Hằng tuần, hai tờ tạp chí Time và Newsweek cạnh tranh với nhau để có được trang bìa bắt mắt hơn. Một trang bìa đầy kịch tính hoặc thú vị sẽ lôi cuốn sự chú ý của các khách hàng tiềm năng tại các sạp báo. Vậy là ban biên tập của Time cứ mỗi tuần lại gặp nhau sau cánh cửa đóng kín để chọn trang bìa cho mình. Họ làm như vậy và biết rằng ban biên tập Newsweek cũng đang gặp nhau ở đâu đó, cũng sau một cánh cửa đóng kín để chọn trang bìa cho mình. Ban biên tập Newsweek, đến lượt họ, cũng biết rằng ban biên tập của Time đang ra một quyết định tương tự, những gì Time biết và những gì Newsweek biết, và cứ tiếp tục như vậy.
Hai tạp chí đang tham gia vào một trò chơi chiến lược, nhưng trò chơi này về bản chất hoàn toàn khác so với những trò chơi mà chúng ta đã xem xét. Các trò chơi trong Chương 2 có thứ tự của các bước đi qua lại. Charlie Brown quyết định có đá quả bóng hay không và biết rằng quyết định của Lucy dịch quả bóng ra chỗ khác hoặc không làm như vậy đang nằm trong tương lai. Trong cờ vua, các nước đi của quân trắng và quân đen là luân phiên. Ngược lại, các hành động của Time và Newsweek là đồng thời. Mỗi bên đều phải hành động mà không cần biết đến lựa chọn của bên kia. Cho đến khi mỗi bên biết được bên kia đã làm gì thì đã quá muộn để thay đổi. Tất nhiên người thua tuần này có thể sẽ cố đáp trả tuần tới nhưng trong một thế giới chuyển động nhanh như hiện nay thì có lẽ đến lúc đó, một bộ các câu chuyện mới và toàn bộ trò chơi mới đã xuất hiện.
Bản chất của suy nghĩ và hành động chiến lược cần cho hai kiểu trò chơi là khác nhau rất rõ. Đối với trò chơi với các bước đi luân chuyển được thảo luận trong Chương 2, mỗi người chơi cần phải nhìn về phía trước và đoán trước câu trả lời của đối phương trong tương lai để tìm cách suy luận ngược lại và quyết định hành động hiện tại cho chính mình. Có một loạt những lập luận thành chuỗi như sau: “Nếu tôi làm điều này, người chơi kia sẽ làm điều đó - trong trường hợp đó thì tôi sẽ trả lời như thế này…” và cứ tiếp tục như vậy.
Đối với trò chơi có những bước đi đồng thời, không có người chơi nào lợi dụng được từ việc quan sát bước đi hoàn chỉnh của người khác trước khi đi bước của mình. Ở đây, lập luận tương tác không phải bằng cách xem xét chiến lược của người khác mà là nhìn xuyên qua nó. Để làm được điều này, đặt mình vào chỗ của đối phương thôi chưa đủ. Bạn sẽ thấy được gì khi bạn làm như vậy? Bạn sẽ chỉ phát hiện ra rằng đối phương của bạn cũng đang làm cùng một việc như bạn, nghĩa là cũng đang suy nghĩ tìm cách đứng vào vị trí hiện tại của bạn. Mỗi người phải đồng thời đặt mình ở hai vị trí: vị trí của chính mình và của người kia và sau đó chỉ ra các bước đi tốt nhất cho cả hai bên. Thay vì một chuỗi liên tiếp các lập luận, đây sẽ là một vòng tròn kiểu “Nếu tôi nghĩ rằng anh ta đang nghĩ là tôi đang nghĩ…”. Điều trớ trêu ở đây là bạn đang tìm cách làm một điều không thể1. Không có gì đáng ngạc nhiên khi Sherlock Holmes và đối thủ tinh quái của mình - Giáo sư Moriarty - vẫn được coi như Napoleon trong thế giới tội phạm là những bậc thầy về suy luận kiểu này. Trong truyện Vấn đề cuối cùng, Holmes đã kể với Watson như sau:
1 Nguyên văn: Biến hình tròn thành hình vuông - ND.
“Tất cả những gì tôi cần nói anh đã đoán được rồi” - anh ta nói.
“Vậy thì có lẽ câu trả lời của tôi anh cũng đoán được rồi đó” - tôi đáp lại.
Cũng giống như Dr. Watson, bạn có thể băn khoăn Holmes làm điều đó như thế nào. Sau khi nghe lời giải thích của chúng tôi, hy vọng bạn sẽ đồng ý rằng điều này thật là sơ đẳng.
Làm thế nào bạn nhìn qua được tất cả những chiến lược cài khớp vào nhau nhưng lại vô hình? Trước hết, bạn cần phải biết rằng những hành động không được biết của những người chơi khác không phải là không chắc chắn theo một cách vô cảm như thời tiết. Trước khi đi làm, biên tập viên tạp chí Time có thể đã nghe dự báo thời tiết và biết khả năng 40% có thể có mưa và sẽ quyết định có cần mang theo ô hay không. Khả năng Newsweek sử dụng một đề tài cụ thể cho trang bìa là một vấn đề hoàn toàn khác.
Sự khác nhau là ở chỗ biên tập viên báo Time có một mẩu thông tin xác đáng về Newsweek, không giống như thời tiết, ban biên tập của tạp chí khác cũng là những đối thủ biết chơi chiến lược không kém gì ban biên tập của Time2. Ngay cả khi một biên tập viên không thể quan sát được trên thực tế quyết định của các tạp chí khác, anh ta có thể tư duy về vấn đề này từ triển vọng của tạp chí đó và cố hình dung ra được nó cần phải làm gì.
2 Một số người tin rằng thiên nhiên cũng là một chiến lược gia trong trò chơi và là một kẻ ác ý thích làm đổ mọi kế hoạch tốt nhất của chúng ta. Chẳng hạn khi bạn nghe dự báo có 40% khả năng trời mưa, điều này có nghĩa là có 6/10 lần bạn nhớ mang ô theo nhưng trời lại không mưa, trong khi 4/10 lần còn lại bạn quên mang ô và thế là trời mưa như trút nước.
Trong Chương 2, chúng tôi đã đưa ra một nguyên tắc duy nhất và thống nhất để dò ra chiến lược tốt nhất cho các trò chơi với các bước đi luân chuyển. Đó là Quy tắc số 1 của chúng tôi: Nhìn xa hơn và suy luận ngược về. Chương này sẽ không dễ dàng như vậy. Tuy nhiên, tư duy về tư duy trong những bước đi đồng thời có thể được tóm lại trong ba quy tắc đơn giản cho hành động. Các quy tắc này đến lượt chúng lại dựa trên hai ý tưởng rất đơn giản - các chiến lược lấn át và trạng thái cân bằng. Cũng giống như trong Chương 2, chúng tôi sẽ phát triển những ý tưởng và quy tắc này thông qua những ví dụ đơn giản.
1. Các chiến lược lấn át
Trong bóng chuyền, khi có hai quả ra ngoài và điểm đếm dừng ở 3 bóng và 2 đập, bất kỳ người chạy nào cũng bắt buộc phải chơi ném bổng (pitch). Điều này có thể thấy được nếu suy nghĩ xuyên suốt về tất cả các khả năng có thể. Trong hầu hết các trường hợp, những người chạy làm gì không quan trọng. Nếu người đỡ không chạm được vào quả ném bổng thì hoặc quả ném đó sẽ là điểm bóng thứ 4 và những người chạy dẫn điểm, hoặc đó là quả đập thứ 3 và lượt bóng đó kết thúc. Nếu quả ném bổng đó rơi ra ngoài thì những người chạy sẽ về vị trí ban đầu của mình. Nếu đó là cú sát mép và được bắt thì lượt bóng sẽ kết thúc. Tuy nhiên, trong trường hợp, những người chạy có lợi thế rõ ràng: Nếu bên đỡ bóng chạm bóng ở khu vực trung lập thì bên chạy sẽ có có hội tốt hơn để ghi điểm.
Chúng ta nói rằng bên chạy ném bổng là chiến lược lấn át trong tình huống này; nó tốt hơn trong một số tình huống và không tệ hơn trong bất kỳ tình huống nào. Nói chung, người chơi có chiến lược lấn át khi anh ta có một kế hoạch hành động khiến anh ta làm tốt hơn những người chơi khác bất kể những người này làm gì. Nếu người chơi có một chiến lược như vậy, quyết định của anh ta sẽ rất đơn giản; anh ta có thể chọn chiến lược lấn át mà không cần phải lo lắng đến các bước đi của đối phương. Do vậy, đây chính là điều đầu tiên người ta cần tìm.
Có những ví dụ rất hay về chiến lược lấn át ở khắp mọi nơi, chúng dễ dàng được phát hiện nếu bạn biết bạn cần phải tìm kiếm cái gì. Hãy xem vị thế của Indiana Jones ở đỉnh điểm kịch tính trong bộ phim Indiana Jones và Cuộc viễn chinh cuối cùng. Indiana Jones, bố anh và bọn Đức Quốc xã cùng đến chỗ của Chén Thánh một lúc. Hai cha con Jones đã từ chối giúp cho bọn quốc xã đạt được bước cuối cùng. Do vậy, bọn chúng đã bắn bố của Indiana. Chỉ có sức mạnh hàn gắn của Chén Thánh mới có thể cứu được Jones cha khỏi vết thương chết người. Có động cơ thúc đẩy, Indiana đã dẫn đường đến chỗ Chén Thánh. Tuy nhiên, còn một thử thách cuối cùng. Anh phải chọn giữa vô số những chiếc chén cốc và chỉ một trong số đó là chiếc chén của Chúa Jesus. Trong khi chiếc chén thật mang lại sự sống vĩnh cửu, việc chọn sai sẽ mang đến cái chết. Tên cầm đầu bọn quốc xã đã nôn nóng chọn một chiếc chén rất đẹp bằng vàng, uống thứ nước thần thánh trong đó và chết đột tử do đã chọn sai chiếc chén thật. Indiana chọn chiếc chén gỗ, chiếc chén của người thợ mộc. Thốt lên “chỉ có một cách duy nhất để biết,” anh đã vục chiếc chén vào nước Thánh và uống với hy vọng đó là chiếc chén sống. Khi nhận ra mình đã khôn ngoan chọn đúng, Indiana mang chiếc chén tới cho cha anh và nước trong chén đã giúp làm liền vết thương của ông.
Mặc dù cảnh phim này chỉ để tăng tính hồi hộp, nó làm chúng tôi cảm thấy hơi bối rối bởi một người uyên bác như tiến sĩ Indiana Jones mà lại có thể bỏ qua chiến lược lấn át. Anh đáng lẽ nên đưa nước luôn cho cha mình mà không nên thử trước. Nếu Indiana chọn đúng thì cha anh sẽ được cứu sống. Nếu chọn sai, cha anh sẽ chết nhưng Indiana sẽ vô hại. Việc thử chiếc chén trước khi đưa cho cha mình cũng chẳng giúp được anh vì nếu đó là chiếc chén sai thì sẽ không còn cơ hội thứ hai nữa - Indiana sẽ chết vì chiếc chén, còn cha anh sẽ chết vì vết thương3.
3 Ví dụ này cũng chỉ ra một điểm yếu trong Lý thuyết trò chơi. Các hành động chỉ được biện minh bằng hậu quả mà thôi. Không có giá trị đạo đức nào được đặt lên hành động. Ngay cả khi người bố bị thương thập tử nhất sinh thì Indiana cũng có thể không muốn chịu trách nhiệm thực hiện hành động có thể đưa đến cái chết cho mình.
Việc tìm ra chiến lược lấn át ở đây còn dễ hơn tìm Chén Thánh. Một người nổi tiếng đã nói: “Thà yêu rồi mất còn hơn không bao giờ có được tình yêu”4. Nói cách khác, tình yêu chính là chiến lược lấn át.
4 Alfred, Lord Tennyson, Hoài niệm (New York: W. W.Norton, 1973), trang 19-20. Vở kịch do Samuel Butler đóng vai Tennyson còn xuất sắc hơn “Bởi yêu rồi mất còn hơn là không bao giờ mất” trong Con đường của mọi người trần (New York: E.P Dutton, 1952), trang 385.
2. Cuộc chiến trang bìa
Trong cuộc cạnh tranh giữa Time và Newsweek, hãy giả sử có một tuần với hai chủ đề tin tức chính: Sự bế tắc giữa Thượng viện và Hạ viện về ngân sách và một loại thuốc mới được công bố là hiệu quả trong chữa trị bệnh AIDS. Lựa chọn của các ban biên tập trước hết dựa trên cái gây chú ý hơn cả đối với những người mua tại các sạp báo (còn những người đặt báo dài hạn thì sẽ vẫn mua báo bất kể trang bìa như thế nào). Trong số những người mua báo ngoài sạp bán lẻ, giả sử có 30% quan tâm đến vấn đề ngân sách và 70% quan tâm đến AIDS. Những người này sẽ chỉ mua báo nếu vấn đề họ quan tâm nằm trên trang bìa; nếu cả hai tạp chí có trang bìa như nhau thì số người quan tâm sẽ chia đều cho cả hai bên.
Bây giờ ban biên tập Time sẽ lý luận như sau: “Nếu Newsweek dùng bài viết về AIDS cho trang bìa, khi đó nếu ta dùng bài về ngân sách, ta sẽ giành trọn ‘thị trường ngân sách’ (30% số độc giả) trong khi nếu ta cũng dùng bài về AIDS, chúng ta sẽ chia nhau ‘thị trường AIDS’ (tức là ta sẽ giành 35% tổng số độc giả); như vậy là bài viết về AIDS sẽ bán chạy hơn bài ngân sách. Nếu Newsweek dùng bài ngân sách, khi đó cũng dùng bài ngân sách ta sẽ chỉ giành được 15% độc giả trong khi dùng bài về AIDS ta giành 70% số độc giả; một lần nữa ta lại có lợi hơn nếu đi theo cách thứ hai. Như vậy là ta có một chiến lược lấn át. Nó luôn luôn có lợi hơn so với chiến lược kia bất kể đối thủ của ta chọn gì”.
Chúng ta có thể thấy logic của suy luận trên nhanh hơn và rõ ràng hơn nhiều trên một bảng đơn giản. Chúng ta đặt hai cột tương ứng với hai lựa chọn của Newsweek và hai dòng tương ứng với lựa chọn của Time. Tổng cộng chúng ta có bốn ô, mỗi ô chỉ ra một kết hợp của các chiến lược. Con số trong mỗi ô chỉ mức bán ra của Time, theo tỷ lệ phần trăm tổng số người đọc. Dòng đầu tiên là mức bán của Time khi chọn bài viết về AIDS cho trang bìa và chúng ta đặt nó tương ứng cùng với các lựa chọn của Newsweek. Dòng thứ hai là mức bán của Time khi chọn bài ngân sách và tương tự chúng ta có các mức tương ứng với các lựa chọn của Newsweek. Chẳng hạn ở ô dưới, bên trái, Time có bài viết về ngân sách và Newsweek có bài về AIDS, Time khi đó sẽ có được 30% thị trường.
Chiến lược lấn át rất dễ nhận thấy. Các số dòng đầu tiên luôn luôn cao hơn dòng thứ hai. Đây chính là tiêu chí của sự lấn át. Với bảng này, bạn có thể làm một phép kiểm tra nhanh chóng bằng mắt xem liệu tiêu chí này có được đáp ứng không. Bạn có thể tưởng tượng nhấc dòng thứ nhất đặt lên trên dòng thứ hai, khi đó mỗi con số của dòng thứ hai sẽ bị che đi bởi các con số lớn hơn của dòng thứ nhất.
Lợi thế hình ảnh của bảng trên so với lập luận miệng sẽ tăng lên khi chúng ta xem đến những trò chơi phức tạp hơn, khi mỗi bên có đến một vài chiến lược để lựa chọn.
Trong trò chơi này cả hai người chơi cùng có chiến lược lấn át. Để thấy được điều đó, chúng ta sẽ vẽ bảng cho doanh thu của Newsweek như dưới đây. Cột thứ nhất sẽ là doanh số nếu chọn bài về AIDS, tương ứng với các lựa chọn của Time. Cột này luôn có các con số cao hơn cột thứ hai; một lần nữa bạn dễ dàng nhận thấy điều này bằng mắt. Do đó, trang bìa về AIDS cũng là chiến lược lấn át của Newsweek.
Trò chơi trong đó mỗi bên đều có chiến lược lấn át là trò chơi đơn giản nhất từ viễn cảnh chiến lược. Ở đó cũng có tương tác chiến lược, nhưng kết luận là có thể biết trước. Mỗi lựa chọn của người chơi đều là chiến lược lấn át, không liên quan đến việc những người chơi khác làm gì. Điều này không làm cho trò chơi mất đi sự thú vị để chơi hay để suy ngẫm về nó. Chẳng hạn, trong cuộc chạy đua 100 mét, chiến lược lấn át sẽ là chạy nhanh hết mức có thể. Nhưng vẫn có rất nhiều người thích tham gia và theo dõi cuộc đua này. Trong nghịch cảnh người tù ở Chương 1, khi chơi trên quảng trường Dzerzhinsky, cả hai người chơi đều có chiến lược lấn át. Nhưng lực hấp dẫn của chiến lược này đã hút họ đến một kết cục bất hạnh cho cả hai. Điều này làm nảy sinh một câu hỏi rất thú vị - làm thế nào những người chơi có thể hợp tác để có được một kết quả tốt hơn? Chúng ta sẽ có nhiều chuyện để nói về điều này trong chương tiếp sau.
Đôi khi một người chơi có chiến lược lấn át nhưng người kia không có. Chúng tôi minh họa điều này bằng cách đổi đi chút ít câu chuyện về cuộc cạnh tranh xung quanh trang bìa của tạp chí Time và Newsweek. Giả sử rằng các độc giả hơi có chút thiên vị về phía Time. Khi cả hai tạp chí có trang bìa như nhau, 60% độc giả tiềm năng, những người thích đề tài trên trang bìa sẽ chọn Time, còn 40% chọn Newsweek. Bây giờ bảng doanh số của Time sẽ như sau:
Đối với Time, trang bìa về AIDS vẫn là chiến lược lấn át. Nhưng bảng của Newsweek sẽ khác đi như sau:
Nếu bạn tưởng tượng nhấc cột thứ nhất và đặt chồng lên cột thứ hai thì số 30 sẽ bị che bởi số bé hơn là 28, trong khi số 12 bị che bởi số lớn hơn 70. Không có chiến lược nào là lấn át chiến lược khác. Nói cách khác, lựa chọn tốt nhất cho Newsweek bây giờ không còn độc lập với lựa chọn của Time nữa. Nếu Time chọn chủ đề về AIDS, Newsweek tốt nhất là chọn ngân sách và ngược lại. Đối với Newsweek, toàn bộ thị trường ngân sách bây giờ vẫn còn tốt hơn là phần nhỏ hơn của thị trường lớn hơn là AIDS.
Ban biên tập Newsweek không quan sát được lựa chọn của Time nhưng họ có thể đoán ra. Bởi vì Time có chiến lược lấn át, đó sẽ phải là lựa chọn của họ. Do vậy, Newsweek có thể đoán chắc chắn rằng ban biên tập Time chọn trang bìa về AIDS và sẽ chọn chiến lược tốt hơn cả cho chính họ là trang bìa về ngân sách.
Những trò chơi khi một bên có chiến lược lấn át cũng rất đơn giản. Bên đó sẽ chơi với chiến lược lấn át của mình, còn bên kia chọn câu trả lời tốt nhất để đối lại với chiến lược đó.
Bây giờ khi đã giới thiệu ý tưởng về chiến lược lấn át, cần phải nhấn mạnh hai điểm sau đây. Rất dễ nhầm lẫn ở chỗ chiến lược lấn át thực sự lấn át cái gì. Năm 1981, Leonard Silk khi viết về cuộc tranh cãi của Quốc hội về Luật thuế khôi phục kinh tế đã kết luận: “Ông Reagan đã cảm thấy rằng phe Cộng hòa có cái mà các nhà lý thuyết trò chơi gọi là chiến lược lấn át - chiến lược khiến cho người chơi lúc nào cũng vượt trội hơn đối phương bất kể đối phương sử dụng chiến lược nào”5. Chúng ta sẽ xem xét trò chơi này kỹ hơn trong Chương 5, còn ở đây chúng tôi chỉ muốn chỉ ra rằng định nghĩa của Silk về chiến lược lấn át là không chính xác. Sự lấn át trong chiến lược lấn át là của một trong số các chiến lược của bạn đối với các chiến lược còn lại cũng của bạn chứ không phải là sự lấn át của bạn đối với đối phương. Một chiến lược lấn át là cái khiến cho người chơi đó có lợi hơn so với chính anh ta khi áp dụng bất kỳ chiến lược nào khác, không quan trọng đối phương đang sử dụng chiến lược nào. Hãy nhớ rằng trong ví dụ về trang bìa, cả hai Time và Newsweek đều có chiến lược lấn át; mặc dù vậy không bên nào có thể có doanh số cao hơn bên kia.
5 Trích dẫn từ bài báo “Lý thuyết trò chơi: Nước đi của Reagan”, New York Times, 15/4/1981, trang D2.
Sự ngộ nhận phổ biến thứ hai là chiến lược lấn át đòi hỏi kết cục có thể xấu nhất khi chơi bằng chiến lược lấn át vẫn phải tốt hơn kết cục khả quan nhất khi chơi bởi chiến lược khác. Điều này tình cờ là đúng với các ví dụ ở trên. Với các con số trong tính huống giả định đầu tiên thì doanh số tệ nhất khi dùng AIDS làm trang bìa là 35%; khả năng tối ưu mà họ có thể hy vọng khi dùng vấn đề ngân sách cho trang bìa là 30%. Tuy nhiên, đây không phải là đặc điểm tổng quát của chiến lược lấn át.
Hãy hình dung một cuộc chiến về giá giữa Time và Newsweek. Giả sử rằng chi phí ấn hành mỗi tờ tạp chí là 1 đô la và chỉ có hai lựa chọn về giá: hoặc 3 đô la (lãi 2 đô la cho mỗi bản) và 2 đô la (lãi 1 đô la cho mỗi bản). Giả sử rằng khách hàng luôn mua tạp chí giá rẻ hơn và nếu giá là như nhau thì khách hàng sẽ chia đều giữa hai tạp chí. Tổng số độc giả là 5 triệu nếu giá là 3 đô la và tăng lên đến 8 triệu nếu giá chỉ là 2 đô la. Bạn có thể dễ dàng tính toán lợi nhuận của Time trong cả bốn sự kết hợp có thể về giá và lập được bảng sau:
Chiến lược lấn át của Time sẽ là lấy giá 2 đô la (cũng như vậy đối với Newsweek). Kết cục xấu nhất có thể xảy ra với Time khi theo đuổi chiến lược này là khi lợi nhuận ròng chỉ còn 4 triệu đô la. Nhưng cơ hội tốt nhất nếu theo đuổi một chiến lược khác lại cao hơn, chính xác là 5 triệu đô la. Vấn đề ở đây là việc so sánh hai con số này không có ý nghĩa gì cả. Lợi nhuận ròng 5 triệu đô la sẽ là khi cả hai tạp chí cùng đặt giá 3 đô la; khi đó Time có thể làm tốt hơn để thu lợi nhuận 8 triệu đô la bằng cách chuyển sang đặt giá 2 đô la.
Chúng ta có thể tổng kết các bài học rút ra từ những ví dụ này thành một quy tắc hành vi trong các trò chơi với các bước đi đồng thời.
Quy tắc số 2:
NẾU BẠN CÓ CHIẾN LƯỢC LẤN ÁT THÌ HÃY ÁP DỤNG NÓ
Đừng bận tâm đến lựa chọn của đối thủ của bạn. Nếu bạn không có chiến lược lấn át mà đối thủ của bạn có thì hãy tính toán rằng anh ta sẽ dùng nó và cố chọn câu trả lời tương ứng tốt nhất.
Có một lời cảnh báo ở đây. Chúng ta đã phát triển khái niệm về chiến lược lấn át cho các trò chơi với các bước đi đồng thời. Hãy thận trọng khi dùng nó đối với trò chơi theo các bước đi luân chuyển. Bởi vì bản chất của sự tương tác chiến lược là khác nhau nên ý tưởng về chiến lược lấn át cũng không giống nhau. Giả sử chúng tôi nói rằng bạn có chiến lược lấn át nếu đối với mỗi lựa chọn cho sẵn của đối thủ cạnh tranh bạn sẽ làm được tốt hơn với chiến lược này so với bất kỳ chiến lược nào khác. Khi các bước đi là tuần tự và đối thủ của bạn đi trước, bạn sẽ luôn chọn chiến lược lấn át của mình. Như chúng tôi vừa nói, đây là câu trả lời tốt nhất của bạn đối với mỗi nước đi của đối thủ của bạn và do vậy cũng là đối với nước đi cụ thể mà anh ta chọn. Tuy nhiên, nếu bạn là người đi đầu thì nước đi của đối thủ là không được cho trước. Anh ta sẽ quan sát lựa chọn của bạn khi đi nước của mình và bạn có cơ hội gây ảnh hưởng đến hành vi của anh ta. Trong một số trường hợp có thể sẽ là tốt nhất đối với bạn khi bạn chọn một thứ khác với chiến lược lấn át của mình. Chúng tôi sẽ giải thích điều này kỹ hơn trong Chương 6 khi nói về cam kết.
3. Các chiến lược bị lấn át
Không phải mọi trò chơi đều có chiến lược lấn át, ngay cả đối với trò chơi chỉ có một người. Thực tế, sự lấn át là ngoại lệ nhiều hơn là quy tắc. Mặc dù sự có mặt của chiến lược lấn át dẫn đến những quy tắc hết sức đơn giản cho hành động, các quy tắc này không thể áp dụng được cho hầu hết các trò chơi trên thực tế. Các nguyên tắc khác do vậy cần phải được đưa vào hành động.
Cũng như chiến lược lấn át luôn tốt hơn bất kỳ một chiến lược nào khác, chiến lược bị lấn át luôn luôn tệ hơn một chiến lược bất kỳ khác. Cũng như khi bạn sẽ chọn chiến lược lấn át nếu bạn có nó và chắc chắn rằng đối thủ của bạn cũng sẽ chọn nó nếu anh ta có, bạn cần phải tránh không chọn các chiến lược bị lấn át nếu bạn có chúng và có thể chắc chắn rằng đối thủ của bạn cũng cố tránh điều đó như bạn nếu anh ta cũng có chúng.
Nếu như bạn chỉ có hai chiến lược để lựa chọn và một trong số đó là chiến lược bị lấn át thì chiến lược kia phải là chiến lược lấn át. Do vậy, các ví dụ về việc tránh không chọn chiến lược bị lấn át khác với các ví dụ về chọn chiến lược lấn át ở chỗ chúng dựa trên các trò chơi trong đó ít nhất một bên có tối thiểu ba chiến lược để lựa chọn. Hãy cùng xem xét một ví dụ đơn giản loại này ngay sau đây.
Hãy nghĩ đến một trận đấu bóng đá trong đó mối quan tâm duy nhất của bên tấn công là lấn sân càng nhiều càng tốt trong khi mối quan tâm duy nhất của bên phòng thủ là giữ cho đối thủ chiếm càng ít sân càng tốt. Chẳng hạn, do còn rất ít thời gian nên bên tấn công muốn cố cải thiện cơ hội làm bàn của mình.
Giả sử rằng bên tấn công chỉ có hai chiến lược lựa chọn: dắt bóng hoặc chuyền bóng, trong khi bên phòng ngự có ba chiến lược: chống dắt bóng, chống chuyền bóng và dùng tiền vệ phản công chớp nhoáng. Chúng ta có thể tính toán phần diện tích sân mà bên tấn công có thể khống chế cho mỗi một kết hợp chiến lược trong số sáu khả năng có thể xảy ra. Chẳng hạn, lấy tình huống bên phòng ngự quyết định phản công chớp nhoáng trong khi bên tấn công đang chuyền bóng. Giả sử rằng có 10% cơ hội để tiền vệ đánh mất 10 mét sân, 70% cơ hội cho cú chuyền bóng lên thêm 10 mét và 20% còn lại là cơ hội chuyền bóng dài lên 20 mét. Tính theo trung bình sẽ là:
0.1 x (-10) + 0.7 x 10 + 0.2 x 20 = -1 + 7 + 4 = 10
Các con số trên rõ ràng sẽ phụ thuộc vào các kỹ năng đặc biệt (hoặc sự thiếu hụt về các kỹ năng đó) của hai đội; chúng tôi chọn các số này chỉ để minh họa mà thôi6.
6 Trong ví dụ của chúng tôi, đội tấn công mạnh khi chuyền bóng và yếu trong dẫn bóng. Đó là lý do chuyền bóng đưa lại kết quả tốt hơn là dẫn bóng ngay cả khi bên đối phương thực hiện chiến lược chống chuyền bóng. Dẫn bóng chỉ tốt hơn khi phải chống lại cuộc tấn công chớp nhoáng của đối phương bởi vì khi đó các hậu vệ đối phương sẽ không kịp quay về vị trí.
Chúng ta xem kết quả của tính toán trên cho sáu kết hợp chiến lược trong bảng sau:
Phần sân dự tính giành được bởi bên tấn công
Bên tấn công cố bằng mọi cách đạt được con số có thể lớn nhất trong bảng trên. Trong khi đó bên phòng ngự cố gắng giữ sao cho con số đó là nhỏ nhất, do vậy chúng ta không cần một bảng riêng để xác định hành động của họ7.
7 Điều này xảy ra trong tất cả các trò chơi có tổng lợi ích bằng (0), trong đó thu hoạch của một bên đúng bằng tổn thất của bên kia.
Không bên nào ở đây có chiến lược lấn át: không có dòng nào có các con số luôn cao hơn dòng kia và cũng không có cột nào mà các con số luôn luôn nhỏ hơn các cột khác. Tuy nhiên, bên phòng ngự có một chiến lược bị lấn át. Đó chính là phản công chớp nhoáng. Kết quả của phản công chớp nhoáng luôn là mất sân và luôn mất nhiều hơn, do vậy luôn xấu hơn cho bên phòng ngự so với khi áp dụng một chiến lược khác. Vì thế bên phòng ngự tuyệt đối không nên phản công chớp nhoáng, còn bên tấn công có thể chắc chắn rằng đối phương sẽ không làm điều đó.
Lập luận chưa dừng ở đây. Chiến lược phản công chớp nhoáng như vậy sẽ bị bỏ đi trong kế hoạch của huấn luyện viên trưởng đội phòng ngự và trò chơi sẽ là mỗi bên có hai chiến lược. Trong trò chơi đã được lược giản này, bên tấn công có chiến lược lấn át, đó là chuyền bóng. Các con số tương ứng của nó, 9 và 8, luôn cao hơn khi dắt bóng 3 và 7. Lý do chuyền bóng không phải là chiến lược lấn át trong tình huống ban đầu bởi dắt bóng khi đó mang lại kết quả tốt hơn khi đối phương áp dụng chiến lược phản công chớp nhoáng (do người giữ bóng có khả năng rơi vào khoảng sân trống khi các hậu vệ của đội phòng ngự đã ra ngoài vị trí của mình), Tuy nhiên, giờ đây chiến lược này đã không còn được xem xét đến. Do vậy, bên tấn công sẽ chọn chuyền bóng. Bên phòng ngự đến lượt mình phải suy nghĩ để tìm ra câu trả lời tốt nhất cho chiến lược được lựa chọn đó và đó chính là chống chuyền bóng.
Ý tưởng tổng quát ở đây có thể được viết lại thành một quy tắc hành vi nữa cho các trò chơi với các bước đi đồng thời như sau:
Quy tắc số 3:
BỎ CÁC CHIẾN LƯỢC BỊ LẤN ÁT RA KHỎI TÍNH TOÁN VÀ TIẾP TỤC NHƯ VẬY MỘT CÁCH LẦN LƯỢT
Nếu như trong quá trình chơi, bất kỳ chiến lược lấn át nào xuất hiện trong trò chơi nhỏ hơn, chúng cần được chọn một cách lần lượt. Nếu cả quy trình này kết thúc trong một kết cục duy nhất, bạn đã tìm thấy các giải pháp hành động cho những người chơi và kết cục của trò chơi. Thậm chí ngay cả khi trò chơi không có một kết cục duy nhất thì nó cũng sẽ giúp giảm bớt quy mô và tính phức tạp của trò chơi. Chúng tôi minh họa ý tưởng về lần lượt loại bỏ các chiến lược bị lấn át bằng cách bịa ra một câu chuyện về sự đe dọa can thiệp của hải quân ở vùng vịnh Péc-xích8. Hình kẻ ô dưới đây cho thấy các vị trí và các lựa chọn của các bên tham chiến. Tàu của Iraq tại điểm I dự định bắn tên lửa vào mục tiêu là tàu của Mỹ tại điểm A. Đường đi của tên lửa được lập trình trước khi phóng đi. Nó có thể đi theo đường thẳng hoặc rẽ vuông góc sang phải sau mỗi khoảng thời gian 20 giây. Nếu tên lửa của Iraq bay thẳng từ I đến A, tên lửa Mỹ có thể đánh trả đường đạn như vậy một cách dễ dàng. Do vậy, phía Iraq sẽ tìm cách đi theo một đường zic zag. Tất cả các con đường từ I đến A đều có thể được thể hiện theo các cạnh của hình dưới đây. Độ dài của mỗi đoạn đều bằng nhau và đúng bằng đoạn đường tên lửa có thể bay trong 20 giây.
8 Câu chuyện này là bản mới cập nhật từ câu chuyện mèo chuột trong cuốn Một chiến lược gia hoàn hảo của J.D. Williams. Có lẽ chú mèo ở đây là mèo Ba Tư chăng?
Radar đặt trên tàu của Mỹ có thể phát hiện việc Iraq phóng tên lửa về phía mình và máy tính sẽ ngay lập tức phóng tên lửa đối lại. Tên lửa đối kháng của Mỹ bay với tốc độ đúng bằng tốc độ của tên lửa Iraq và cũng có thể thực hiện những cú rẽ 90 độ tương tự. Do vậy, đường đi của tên lửa đối kháng cũng có thể biểu diễn dọc các cạnh của hình kẻ ô trên với điểm khởi đầu là A. Tuy nhiên, để còn đủ nhiên liệu cho một vụ nổ gây thiệt hại ngoài trời thì tên lửa đối kháng chỉ có thể bay trong 1 phút, có nghĩa là nó chỉ có thể đi được ba cạnh (chẳng hạn, AB, BC và CF, chúng ta sẽ viết rằng đường đi khi đó là ABCF).
Nếu trước hoặc ngay tại thời điểm 1 phút kết thúc, tên lửa đối kháng gặp tên lửa đến, nó sẽ nổ và vô hiệu hóa mối đe dọa. Nếu không, tên lửa của Iraq sẽ tiếp tục con đường của mình và đâm vào tàu của Mỹ. Câu hỏi đặt ra là hai tên lửa phải chọn đường đi cho mình như thế nào?
Chỉ có phút đầu tiên của quãng đường là có liên quan đến trò chơi này. Mỗi bên cần phải suy nghĩ trước về ba đoạn đường 20 giây. Nếu đếm hết các khả năng thì mỗi bên có tám đường đi để lựa chọn. Như vậy chúng ta phải xem xét tổng cộng 64 kết hợp và tính toán xem trường hợp nào trúng còn trường hợp nào trượt.
Chẳng hạn, nếu chiến lược của Iraq là đi theo đường IFCB, điều đó có nghĩa là tên lửa đi thẳng một mạch từ I qua F rồi đến C, sau đó rẽ phải sang B. So sánh nó với chiến lược ABCF của phía Mỹ. Hai tên lửa sẽ gặp nhau tại C sau hai đoạn (40 giây); do vậy kết hợp này được coi là trúng đích. Nếu chiến lược đó của Iraq gặp chiến lược ABEF của Mỹ thì kết quả sẽ là trượt. Đường đi của hai bên đều có chung điểm B và F, Tuy nhiên, hai tên lửa đạt đến các điểm đó vào các thời điểm khác nhau; chẳng hạn tên lửa của Mỹ tới B sau 20 giây nhưng mãi sau 60 giây tên lửa của Iraq mới bay tới đó.
Bảng sau chỉ ra tất cả các kết hợp có thể. Tám chiến lược của Iraq được đánh số tương ứng từ I1 đến I8 và đường đi cũng được chỉ ra tương ứng, chẳng hạn I1 là IFCB. Tương tự các chiến lược của Mỹ được đánh số từ A1 đến A8. Các cú bắn trúng được biểu thị bằng chữ H, trượt biểu thị bằng chữ O.
Bảng bắn trúng và trượt
Bảng trên trông có vẻ phức tạp, nhưng quy tắc lược giản các chiến lược bị lấn át sẽ nhanh chóng khiến nó trở nên đơn giản hơn. Tên lửa đốis kháng của Mỹ đang cố bắn trúng nên H sẽ tốt hơn là O. Tiếp đó có thể dễ dàng nhận thấy đối với Mỹ thì chiến lược A2 bị lấn át bởi A4; nếu nhấc dòng A4 lên và đặt chồng lên hàng A2 bạn sẽ thấy A4 có tất cả các H ở những nơi mà A2 có, và còn có thêm ở một nơi nữa - đó là chỗ để đáp trả chiến lược I5 của Iraq. Làm tất cả các tính toán như vậy cho tất cả các khả năng, ta có kết quả là các chiến lược A2, A3, A6 và A7 bị lấn át bởi cả hai chiến lược A4 và A8. A1 bị lấn át bởi A8, còn A5 bị lấn át bởi A4. Do vậy phía Iraq có thể chắc chắn rằng phía Mỹ sẽ không dùng chiến lược nào khác ngoài A4 hoặc A8. Tập trung sự chú ý vào hai dòng đó, phía Iraq sẽ cố gắng để tên lửa đối kháng bắn trượt, do vậy đối với họ các chiến lược I1 và I5 sẽ lấn át các chiến lược I2, I3, I4, I6 và I7. Sau khi chúng ta gạch đi các dòng và cột tương ứng với các chiến lược bị lấn át, trò chơi sẽ được lược giản còn như sau:
Hai quy tắc của chúng ta không thể lược giản trò chơi hơn nữa bởi vì không còn chiến lược lấn át hay bị lấn át nào nữa. Tuy nhiên, chúng ta cũng đã làm được khá nhiều rồi. Hãy nhìn vào các chiến lược còn lại trên bản đồ, chúng ta sẽ thấy tên lửa của Iraq phải đi theo đường viền bên ngoài hình kẻ ô trong khi tên lửa đối kháng của Mỹ phải đi dọc ngang bên trong các ô. Chúng ta sẽ xem ngay sau đây làm thế nào để chọn tiếp từ hai khả năng còn lại cho mỗi bên.
4. Chiến lược cân bằng
Khi tất cả các giản ước dựa trên chiến lược lấn át và bị lấn át đã được sử dụng hết, trò chơi đã ở mức tối giản, việc suy luận vòng quanh cần phải được giải quyết trực diện. Cái gì là tốt nhất với bạn cũng sẽ tốt nhất với đối phương của bạn và ngược lại. Ở đây chúng tôi sẽ giới thiệu kỹ thuật biến cái không thể thành có thể để dẫn bạn ra khỏi vòng suy luận luẩn quẩn.
Để làm điều này, hãy quay lại với cuộc chiến giá cả giữa Time và Newsweek, Tuy nhiên, thay vì chỉ có hai mức giá để chọn, ở đây sẽ có cả một loạt các mức giá khác nhau. Bây giờ ban điều hành Time sẽ phải suy nghĩ để tìm ra câu trả lời tốt nhất cho mỗi mức giá có thể của Newsweek. Giả sử mỗi tạp chí đều có những độc giả trung thành của mình, Tuy nhiên, bên cạnh đó còn có một lượng độc giả có thể bị lôi kéo bởi cạnh tranh giá. Nếu vì một lý do nào đó, Newsweek quyết định lấy giá 1 đô la, đúng bằng chi phí sản xuất, khi đó ban điều hành Time sẽ không thể đi theo chiến lược phi lợi nhuận này mà sẽ đặt giá cao hơn, giả sử 2 đô la và thu lợi nhuận từ nhóm độc giả trung thành của mình. Nếu Newsweek lấy giá cao hơn, Time cũng sẽ tăng giá nhưng tăng ít hơn, do đó giành lợi thế về giá. Giả sử cứ mỗi đô la tăng giá của Newsweek thì câu trả lời tối ưu của Time là tăng theo thêm nửa đô la. Mối tương quan giữa những câu trả lời tối ưu của Time đối với tất cả các mức giá có thể của Newsweek được biểu diễn trong bảng sau:
Giả sử rằng cả hai tạp chí đều có mức chi phí như nhau, số độc giả trung thành bằng nhau và mức độ lôi kéo đối với lượng độc giả còn lại tương tự như nhau. Do đó, đồ thị cho tương quan giữa câu trả lời tối ưu của Newsweek cho các mức giá của Time cũng giống hệt như trên.
Bây giờ chúng ta có thể hình dung hai giám đốc bắt đầu suy nghĩ một cách riêng rẽ. Thí dụ giám đốc Time sẽ nói: “Nếu anh ta lấy giá 1 đô la, ta sẽ lấy 2 đô la. Nhưng anh ta cũng biết ta đang nghĩ như thế nên sẽ không lấy 1 đô la mà lấy mức giá là câu trả lời tối ưu cho mức giá 2 đô la của ta, đó sẽ là 2,5 đô la. Khi đó, ta sẽ không lấy giá 2 đô la nữa mà sẽ là câu trả lời tối ưu của ta đối với mức giá 2,5 đô la của anh ta, nghĩa là 2,75 đô la. Nhưng đến khi đó thì anh ta sẽ…” Đến bao giờ suy luận này sẽ kết thúc?
Nó sẽ kết thúc ở mức giá 3 đô la. Nếu giám đốc của Time nghĩ rằng giá của Newsweek sẽ là 3 đô la thì câu trả lời tối ưu của ông ta cho mức giá đó cũng là 3 đô la. Và ngược lại. Suy luận vòng quanh đã có điểm hội tụ.
Chúng ta có thể chỉ ra điều này trên một đồ thị khác, trên đó hai câu trả lời được đặt cạnh nhau. Hai đường thẳng biểu diễn chúng gặp nhau tại một điểm mà tại đó mức giá đúng bằng 3 đô la.
Chúng ta đã tìm thấy một kết hợp chiến lược trong đó mỗi hành động của người chơi này là câu trả lời tối ưu cho hành động của người chơi kia. Với hành động của người kia là cho trước, không người chơi nào muốn thay đổi chính hành động của mình. Các nhà lý thuyết trò chơi gọi kết cục này là trạng thái cân bằng (hay điểm cân bằng - equilibrium). Khái niệm này được nhà toán học John Nash ở trường tổng hợp Princeton phát triển và tên ông được lấy để đặt cho sự cân bằng này - cân bằng Nash. Ý tưởng của Nash chính là nền tảng cho quy tắc hành vi cuối cùng chúng tôi đưa ra cho các trò chơi có các bước đi đồng thời:
Quy tắc số 4:
SAU KHI ĐÃ GIẢN LƯỢC CON ĐƯỜNG BẰNG CÁCH TÌM KIẾM CÁC CHIẾN LƯỢC LẤN ÁT HOẶC ĐƯA RA CÁC CHIẾN LƯỢC BỊ LẤN ÁT, BƯỚC TIẾP THEO CẦN LÀM LÀ TÌM ĐIỂM CÂN BẰNG CỦA TRÒ CHƠI.
Sherlock Holmes và Giáo sư Moriarty chắc chắn phải dùng đến mánh khóe để có thể nhìn xuyên qua chiến lược của nhau.
Quy tắc này cần giải thích thêm một chút. Vì sao những người chơi được lôi kéo về cùng một kết cục như vậy? Có một số lý do có thể đưa ra. Không có lý do nào trong đó là tuyệt đối thuyết phục nhưng toàn bộ các lý do đó hợp lại thì có sức thuyết phục rất mạnh.
Trước hết, đó là sự cần thiết phải thoát khỏi suy luận lòng vòng không đưa bạn đến đâu cả. Điểm cân bằng đứng ổn định dưới những vòng suy luận kiểu như “tôi nghĩ là anh ta đang nghĩ rằng…”. Nó khiến dự tính của người chơi về hành động của người kia trở nên nhất quán. Mỗi người đều đã dự đoán đúng hành động của người kia và đã chọn cho mình câu trả lời tối ưu.
Ưu điểm thứ hai của chiến lược cân bằng phát sinh từ các trò chơi có tổng lợi ích bằng 0, trong đó lợi ích của các bên là hoàn toàn đối lập. Trong trò chơi như thế, các đối thủ của bạn không thể giành điểm bằng cách lừa bạn chơi chiến lược cân bằng. Bạn đã tính toán đến câu trả lời tối ưu của họ đối với điều bạn đang làm rồi.
Lý do thứ ba là lý do thực dụng. Sự minh chứng của chiếc bánh chính là khi ăn nó. Xuyên suốt cuốn sách này chúng tôi thảo luận một số trò chơi có sử dụng cách tiếp cận cân bằng. Chúng tôi đề nghị bạn xem xét những dự đoán về kết cục và các giải pháp cho hành vi phát sinh từ cách suy nghĩ này. Chúng tôi tin rằng điều này sẽ giúp các bạn đánh giá chiến lược này tốt hơn bất kỳ tranh luận trừu tượng nào về giá trị của chiến lược này9.
9 Các nhà nghiên cứu trên trận tuyến của Lý thuyết trò chơi lo ngại về những hạn chế của khái niệm điểm cân bằng Nash. Họ đã phát triển những trò chơi trong đó các kết cục trực giác hiển nhiên không phải là các điểm cân bằng Nash và ngược lại. Tuy nhiên, những vấn đề này không ảnh hưởng đến hầu hết các ứng dụng của Lý thuyết trò chơi. Các độc giả muốn biết thêm về các hạn chế của điểm cân bằng Nash có thể tìm thấy những lập luận xuất sắc trong cuốn sách Trò vui và trò chơi của Ken Binmore (Lexington, Mass.: D.C.Heath) và Lý thuyết trò chơi và mô hình kinh tế của David Kreps (Ox- ford: Oxford University Press, 1990)
Cuối cùng, chúng tôi muốn bạn tránh hiểu nhầm về khái niệm cân bằng ở đây. Khi chúng tôi nói rằng kết cục là điểm cân bằng, không có khẳng định đương nhiên nào ở đây rằng kết cục này là tốt nhất đối với tất cả những người chơi trong trò chơi, chưa nói đến cả xã hội nói chung. Việc đưa ra đánh giá như vậy luôn là một câu hỏi riêng và câu trả lời là khác nhau tùy thuộc vào từng hoàn cảnh cụ thể. Trong Chương 4 và Chương 9, chúng ta sẽ gặp các ví dụ cho cả hai loại này.
5. No nê hay đói khát
No nê
Liệu khái niệm về điểm cân bằng có phải là một giải pháp hoàn chỉnh cho vấn đề suy luận lòng vòng trong các trò chơi với các bước đi đồng thời hay không? Câu trả lời là không. Một số trò chơi có nhiều điểm cân bằng, một số khác lại không có điểm nào. Trong một số khác nữa, khái niệm điểm cân bằng cần phải được làm cho khó nhận thấy hơn bằng cách chấp nhận những loại chiến lược mới. Chúng tôi sẽ minh họa và đưa ví dụ cho điều này ngay sau đây.
Bạn cần phải lái xe bên nào của đường? Câu hỏi này không thể được trả lời nếu chỉ sử dụng các chiến lược lấn át hay bị lấn át. Mặc dù vậy, câu trả lời vẫn có vẻ dễ dàng. Nếu tất cả những người khác đều đi bên phải đường, bạn cũng sẽ muốn đi về bên đó. Nếu đặt chuyện này vào trong khung suy luận “Tôi cho là anh ta nghĩ rằng…” thì nếu tất cả mọi người đều nghĩ rằng tất cả những người khác lái xe bên phải, tất cả mọi người sẽ đều muốn đi bên tay phải và sự chờ đợi của họ đều sẽ được khẳng định. Lái xe bên phải sẽ chính là điểm cân bằng.
Tuy nhiên, lái xe bên trái cũng vậy, như ở Anh, Australia và Nhật Bản. Trò chơi này có hai điểm cân bằng. Không có gì trong khái niệm về điểm cân bằng nói cho chúng ta biết điểm cân bằng nào là hoặc cần phải là trội hơn các điểm khác. Khi trò chơi có nhiều điểm cân bằng, những người chơi cần phải có chung suy nghĩ về cái họ chọn. Nếu không thì sẽ là một sự hỗn độn thực sự.
Trong ví dụ về lái xe, một quy tắc được thiết lập đã cho bạn câu trả lời. Nhưng bạn sẽ làm gì nếu cuộc gọi điện thoại giữa Peter và Paula bị cắt do sự cố? Nếu Peter cố gọi lại cho Paula thì Paula phải đang không gọi (và cũng không cố gọi cho Peter ) để điện thoại của cô không bị bận. Nói cách khác, nếu Paula chờ Peter gọi lại mà Peter cũng chờ nốt thì cuộc nói chuyện của họ sẽ không bao giờ thực hiện được. Cái tối ưu cho người này phụ thuộc vào cái người kia đang làm. Một lần nữa ở đây có hai điểm cân bằng, một điểm là khi Peter gọi còn Paula chờ, còn điểm kia là ngược lại.
Cả hai người cần phải có một quy ước ngầm để giúp họ chọn được các chiến lược nhất quán, cụ thể là suy nghĩ chung về điểm cân bằng nào cần đạt được. Một giải pháp là người nào gọi đầu tiên thì sẽ gọi lại. Còn người trả lời cú điện thoại sẽ chờ để điện thoại rung chuông lần nữa. Ưu thế của cách này là người gọi ban đầu rõ ràng đã biết số điện thoại của người bên kia trong khi chưa chắc điều ngược lại đã đúng. Có một khả năng nữa là nếu một người có thể gọi miễn phí, còn người kia thì không (giả dụ như Peter đang ở văn phòng làm việc trong khi Paula đang gọi điện thoại công cộng trả tiền), khi đó người có thể gọi miễn phí sẽ là người gọi lại.
Để kiểm tra khả năng phối hợp của bạn tại điểm cân bằng, hãy trả lời câu hỏi sau: Bạn sẽ phải gặp một ai đó ở New York vào một thời điểm nào đó ngày mai. Người đó cũng được yêu cầu gặp bạn. Cả bạn lẫn người đó đều không được biết thêm bất kỳ một hướng dẫn gì về việc sẽ gặp nhau ở đâu và vào giờ nào. Vậy thì bạn sẽ phải đến đâu, vào lúc nào?
Thomas Schelling đã khiến câu hỏi này trở nên nổi tiếng trong cuốn sách của ông là Chiến lược của xung đột. Không có câu trả lời được xác định trước nào tốt hơn câu trả lời được đưa ra nhiều nhất. Với sinh viên của chúng tôi thì nhà ga trung tâm vào đúng giữa trưa là câu trả lời thường gặp nhất. Điều này cũng đúng cả với các sinh viên của Preceton mặc dù tàu của họ đến New York đỗ tại nhà ga Penn10.
10 Có lẽ câu trả lời độc đáo nhất ngoài câu trả lời trên là của Tanya Luhrmann, giáo sư nhân loại học. Bà đã trả lời đó là phòng đọc chính của Thư viện công cộng New York. Khi người ta nói với bà rằng đây là câu trả lời không phổ biến nếu không nói là độc nhất, bà đã bảo vệ ý kiến của mình ngay lập tức. Bà giải thích rằng mặc dù xác suất thành công của bà là thấp nhưng bà thích gặp gỡ với những người chọn nơi này làm điểm gặp gỡ hơn là những người chọn nhà ga trung tâm.
Đói khát
Một phức tạp khác ở đây là không phải trò chơi nào cũng có ít nhất một điểm cân bằng như trong các ví dụ chúng tôi đã mô tả ở trên. Trong câu chuyện về tên lửa, không có một kết cục nào trong số bốn kết cục còn lại là điểm cân bằng. Chẳng hạn hãy xem khi chiến lược I1 của Iraq kết hợp với chiến lược A4 của Mỹ. Kết hợp này dẫn đến bắn trượt và Mỹ có thể giành kết quả tốt hơn nếu chuyển sang A8. Tuy nhiên, khi đó Iraq sẽ chuyển sang chiến lược I5 và đến lượt mình Mỹ sẽ chuyển sang A4, khi đó Iraq quay trở lại I1 và cứ tiếp tục như vậy. Điểm cần chú ý ở đây là nếu một bên thực hiện một hành vi xác định thì bên kia sẽ lợi dụng điều đó. Điều hợp lý duy nhất mỗi bên cần làm khi đó là pha trộn các bước đi của mình theo một cách thức ngẫu nhiên. Vấn đề này đối xứng đến nỗi tỷ lệ pha trộn là hiển nhiên: Mỹ cần phải chọn hoặc A4 hoặc A8 với xác suất như nhau và Iraq tương tự như vậy sẽ có xác suất 50% cho mỗi lựa chọn I1 hoặc I5.
Chiến lược pha trộn hay hỗn hợp này có thể phát sinh ngay cả khi các bên cố gắng hợp tác với nhau. Trong ví dụ về cuộc gọi điện thoại, hãy hình dung hai bên tung đồng xu để xác định xem họ có nên là người gọi lại hay không. Cặp hành động ngẫu nhiên này là điểm cân bằng thứ ba đối với vấn đề điện thoại dựa trên tiêu chí mô tả ở trên.
Nếu tôi cố gắng gọi cho anh, tôi sẽ có 50% cơ hội kết nối được (khi anh đợi tôi gọi) và 50% khả năng là đường dây bận. Nếu tôi đợi, tôi cũng có 50% cơ hội liên lạc lại được; 50% nữa đến từ một nửa số cơ hội rằng anh đang cố gắng gọi lại cho tôi. Mỗi vòng, cả hai bên đều hoàn toàn không quan tâm đến hành động nào sẽ được làm: Câu trả lời của hai bên thực tế là tối ưu đối với nhau. Bởi vì chỉ có 50% cơ hội quay lại cuộc nói chuyện, chúng ta có thể dự tính rằng trung bình cần phải thử hai lần trước khi chúng ta thành công.
Trong các trò chơi khác, tỷ lệ đúng trong đó mỗi người chơi cần phải pha trộn các chiến lược của mình không dễ thấy như vậy. Trong Chương 7, chúng tôi sẽ phát triển một bộ quy tắc để xác định khi nào các chiến lược hỗn hợp là cần thiết và phương pháp để tìm ra một tỷ lệ pha trộn đúng nhất.
Chúng tôi sẽ tóm tắt lại chương này một cách ngắn gọn. Chúng ta có ba quy tắc cho hành động trong các trò chơi với những bước đi đồng thời: Thứ nhất, tìm và sử dụng các chiến lược lấn át; tiếp theo, tìm và tránh các chiến lược bị lấn át, trong mỗi trường hợp hãy tính toán rằng đối phương cũng đang làm điều tương tự; và cuối cùng, tìm và sử dụng điểm cân bằng. Để kết luận lại chương này, chúng ta xem xét một tình huống để xem khả năng bạn có thể chuyển những suy nghĩ này thành hành động như thế nào.
6. Bài tập tình huống số 3
NGƯỜI CỨNG RẮN, MỜI CHÀO MỀM MỎNG
Khi Robert Campeau ra giá lần đầu tiên cho chuỗi cửa hàng liên hợp Federated Stores (với biểu tượng vương miện đá quý Bloomingdales), ông đã áp dụng chiến lược giá đệm hai cấp. Tình huống này xem xét tính hiệu quả của một cuộc bỏ thầu hai cấp như một bước đi chiến lược11: Liệu nó có thể cho kẻ đột kích hưởng lợi thế một cách không công bằng hay không?
11 Đưa ra giá đệm: Mua các cổ phần của một công ty, thường với giá có chênh lệch cao hơn giá thị trường của cổ phần bằng tiền mặt hay chứng khoán hoặc cả hai nhằm mục đích chiếm quyền kiểm soát của một công ty đang là mục tiêu hấp dẫn. Việc đưa ra giá đệm có thể xuất phát từ các thương lượng đầy thiện ý giữa công ty mục tiêu và công ty muốn tiếp quản hay có thể do tự ý hoặc không thân thiện dẫn đến việc công ty có nguy cơ bị thâu tóm tìm biện pháp chống lại (định nghĩa của từ điển Thị trường chứng khoán do Đặng Quang Gia chủ biên, in năm 1998)
Cuộc bỏ thầu hai cấp thường chào mức giá cao cho các cổ phần đầu tiên được bỏ thầu và mức giá thấp hơn cho các cổ phiếu được bỏ thầu sau đó12. Để đơn giản, chúng ta xem tình huống trong đó mức giá trước khi tiếp quản doanh nghiệp là 100 đô la mỗi cổ phiếu. Cấp đầu đưa ra mức giá cao hơn, 105 đô la cho mỗi cổ phiếu cho những cổ đông bỏ thầu đầu tiên cho tới khi một nửa số cổ phiếu được mua hết. 50% cổ phiếu tiếp theo sẽ rơi xuống cấp thứ hai; mức giá chào cho các cổ phiếu này chỉ là 90 đô la. Để bảo đảm công bằng, các cổ phiếu không được đưa vào các cấp khác nhau dựa theo thứ tự bỏ thầu. Đúng hơn là mỗi người sẽ đều nhận được một mức giá hỗn hợp: Tất cả các cổ phiếu bỏ thầu đều được chia theo tỷ lệ tương ứng vào hai cấp (những người không bỏ thầu sẽ có tất cả các cổ phiếu của mình nằm ở cấp thứ hai nếu cuộc bỏ thầu thành công). Chúng tôi có thể biểu diễn mức thanh toán trung bình cho mỗi cổ phiếu bằng một biểu thức đại số đơn giản: Nếu lượng đặt mua ít hơn 50%, tất cả những người bỏ thầu sẽ nhận được giá 105 đô la cho mỗi cổ phiếu; nếu một số lượng X% > 50% cổ phiếu của công ty được bán, mức giá trung bình trả cho mỗi cổ phiếu sẽ là:
12 Bỏ thầu (tender) là hành động tự bỏ cổ phần của một người nào đó để đáp ứng một giá mua đã ấn định.
105 đô la x 50/X + 90 đô la x (X-50)/X = 90 + 15 x 50/X
Có một điều có thể nhận thấy về cách thức chào giá cổ phiếu hai cấp là nó vô điều kiện; ngay cả khi kẻ đột kích (raider)13 không nắm được quyền kiểm soát thì các cổ phiếu bỏ thầu cũng vẫn được mua ở mức giá cấp đầu tiên. Điểm thứ hai cần chú ý về bỏ thầu hai cấp là nếu tất cả mọi người cùng bỏ thầu, khi đó mức giá trung bình cho mỗi cổ phiếu sẽ chỉ là 97,5 đô la. Mức giá này còn thấp hơn mức giá trước khi cổ phiếu được đưa ra bỏ thầu. Nó cũng là kết quả xấu hơn dự tính khi việc thâu tóm công ty thất bại; nếu kẻ đột kích thua, các cổ đông hy vọng mức giá sẽ quay trở về 100 đô la. Do vậy, họ hy vọng rằng hoặc việc ra giá sẽ thất bại, hoặc một kẻ đột kích khác sẽ xuất hiện.
13 Kẻ đột kích giành được quyền kiểm soát công ty sẽ có quyền chuyển công ty thành tư hữu và mua lại toàn bộ số cổ phiếu của các cổ đông còn lại. Theo luật, các cổ đông này phải được hưởng mức giá của “thị trường công bằng” cho các cổ phiếu của mình. Thông thường cấp thấp hơn trong bỏ thầu hai cấp vẫn nằm trong dải mức giá có thể được chấp nhận là giá trị công bằng của thị trường.
Thực tế là kẻ đột kích khác đã xuất hiện, đó chính là Macy’s. Hãy hình dung Macy’s đưa ra một đề nghị chào giá có điều kiện: Công ty này đưa ra mức giá 102 đô la cho mỗi cổ phiếu với điều kiện họ sẽ được mua phần lớn số cổ phiếu. Vậy thì bạn bỏ thầu theo ai và chào giá nào bạn cho là sẽ thành công?
THẢO LUẬN
Bỏ thầu theo chào giá hai cấp chính là chiến lược lấn át. Để chứng minh điều đó, chúng ta sẽ xem xét tất cả các trường hợp có thể. Có ba khả năng để kiểm tra:
- Chào giá hai cấp chỉ thu hút được ít hơn 50% tổng số cổ phiếu và thất bại.
- Chào giá hai cấp thu hút được một lượng cổ phiếu trên 50% và thành công.
- Chào giá hai cấp thu hút được đúng 50%. Nếu bạn bán, cuộc chào giá sẽ thành công. Nếu không có bạn, cuộc chào giá sẽ thất bại.
Trong trường hợp đầu tiên, chào giá hai cấp thất bại, mức giá sau bỏ thầu sẽ là 100 đô la nếu cả hai lời chào giá đều thất bại hoặc sẽ là 102 đô la nếu lời chào giá cạnh tranh của Macy’s thành công. Nhưng nếu bạn bỏ thầu cổ phiếu của mình, bạn sẽ có mức giá 105 đô la, cao hơn mức giá trong cả hai khả năng kia. Trong trường hợp thứ hai, nếu bạn không bỏ thầu, bạn sẽ chỉ nhận được 90 đô la cho một cổ phiếu. Việc bạn bỏ thầu sẽ khiến bạn giành được mức giá ít nhất là 97,5 đô la. Như vậy một lần nữa tốt hơn hết là bỏ thầu. Trong trường hợp thứ ba, trong khi mọi người sẽ thiệt nếu chào giá thành công, chỉ riêng cá nhân bạn được lợi. Lý do là nếu đúng 50% cổ phiếu được đặt mua, bạn sẽ nhận được mức giá đúng 105 đô la. Mức giá này là xứng đáng. Như vậy là bạn sẵn sàng đẩy vụ mua bán này đến chỗ được thực hiện.
Bởi vì bỏ thầu là chiến lược lấn át nên chúng ta có thể dự tính rằng tất cả các cổ đông sẽ bỏ thầu. Khi tất cả mọi người đều làm như vậy, mức giá trung bình cho mỗi cổ phiếu có thể thấp hơn mức giá trước khi có chào giá và thậm chí thấp hơn mức giá dự kiến trong tương lai nếu chào giá thất bại. Như vậy là chào giá hai cấp sẽ giúp cho kẻ đột kích trả tiền ít hơn giá trị thực của công ty. Thực tế rằng các cổ đông có một chiến lược lấn át không có nghĩa là họ sẽ kết thúc thành công. Kẻ đột kích sử dụng mức giá thấp ở cấp thứ hai để giành một lợi thế không công bằng. Thường thì chào giá cấp hai ít chặt chẽ hơn so với trong ví dụ của chúng tôi do mức độ bắt buộc bị giấu đi một phần bởi mức trả trước trong thâu tóm. Nếu như công ty thực sự có giá là 110 đô la một cổ phiếu sau thâu tóm thì kẻ đột kích vẫn có thể có được một lợi thế không công bằng bằng cách sử dụng cấp thứ hai với mức giá giữa 100 đô la và 110 đô la. Các luật sư cho rằng bỏ thầu hai cấp là không tự nguyện (ép buộc) và thường lấy đó làm lý do để kiện kẻ đột kích ra toà. Trong cuộc đấu giành Bloomingdales, Robert Campeau cuối cùng đã thắng nhưng với lời chào giá đã bị thay đổi đi và không bao gồm bất kỳ một cơ cấu cấp nào nữa.
Chúng ta cũng thấy rằng việc chào giá có điều kiện không phải là một chiến lược chống trả hiệu quả đối với chào giá hai cấp vô điều kiện. Trong ví dụ của chúng ta, chiến lược của Macy’s có thể đã hiệu quả hơn nhiều nếu như họ chào 102 đô la cho mỗi cổ phiếu một cách vô điều kiện. Chào giá vô điều kiện của Macy’s sẽ thủ tiêu điểm cân bằng mà tại đó chào giá hai cấp thành công. Lý do là nếu mọi người nghĩ rằng chào giá hai cấp chắc chắn sẽ thành công, họ sẽ trông đợi mức giá hỗn hợp là 97,5 đô la, mức này thấp hơn so với mức mà họ sẽ nhận được bằng cách đặt giá cho Macy’s. Do vậy các cổ đông không thể trông đợi rằng bỏ thầu hai cấp sẽ thành công và tiếp tục bỏ thầu theo nó.
Vào cuối năm 1989, các hoạt động kinh doanh của Campeau bị phân rã do nợ quá nhiều. Federated Stores xin tái tổ chức theo Chương 11 của Luật Phá sản. Khi chúng tôi nói rằng chiến lược của Campeau thành công, chúng tôi chỉ có ý rằng công ty đã đạt được mục đích là thắng trong cuộc chiến mua lại. Thành công trong việc điều hành công ty kinh doanh lại là một trò chơi hoàn toàn khác.
LỜI BẠT CHO PHẦN 1
Trong ba chương đầu tiên, chúng tôi đã giới thiệu một vài khái niệm và phương pháp, sử dụng các ví dụ từ kinh doanh, thể thao, chính trị, v.v… như các phương tiện thể hiện. Trong các chương sau, chúng tôi sẽ để cho các ý tưởng và kỹ thuật phát huy trong thực tế. Ở đây chúng tôi tóm tắt và tổng kết lại các ý tưởng và kỹ thuật đó để các bạn dễ tham chiếu.
Trò chơi là một tình huống của sự phụ thuộc lẫn nhau về chiến lược: Kết quả của lựa chọn (chiến lược) của bạn phụ thuộc vào lựa chọn của một hoặc nhiều người khác đang hành động một cách có mục đích. Những người ra quyết định trong trò chơi được gọi là người chơi, còn lựa chọn của họ được gọi là các bước đi. Mối quan tâm hoặc lợi ích của những người chơi có thể hoàn toàn mâu thuẫn; lợi ích của người này luôn luôn là thiệt hại của người khác. Những trò chơi như vậy gọi là các trò chơi có tổng bằng 0. Tuy nhiên, điển hình hơn là khi trò chơi có đồng thời cả những tương đồng cũng như mâu thuẫn về lợi ích; ở đó có thể có những kết hợp chiến lược cùng có lợi, hoặc cùng có hại. Dù thế nào chúng tôi cũng quy ước gọi những người chơi khác trong trò chơi là các đối thủ.
Các bước đi trong trò chơi có thể là luân chuyển hoặc đồng thời. Trong trò chơi với những bước đi luân chuyển có một dãy mắt xích dài của suy luận: Nếu tôi làm điều này, đối thủ của tôi có thể sẽ làm điều đó và đến lượt mình tôi sẽ trả lời bằng cách như thế này… Trò chơi như vậy được nghiên cứu bằng cách vẽ ra cây trò chơi. Các lựa chọn bước đi tối ưu có thể tìm thấy bằng cách áp dụng quy tắc thứ nhất: Nhìn xa hơn và suy luận ngược về.
Trong trò chơi với các bước đi đồng thời, có một vòng tròn logic của suy luận: Tôi nghĩ là anh ta nghĩ rằng tôi nghĩ như vậy… Cần phải làm một điều tưởng như không thể; đó là thấu hiểu hành động của đối thủ ngay cả khi bạn thực tế không thể nhìn thấy nó khi bạn đi bước đi của mình. Để đối phó với trò chơi kiểu này cần phải xây dựng một bảng chỉ ra tất cả các kết cục tương ứng với tất cả các kết hợp lựa chọn có thể tưởng tượng ra. Sau đó, thực hiện theo các bước sau đây.
Hãy bắt đầu bằng tìm xem liệu các bên có chiến lược lấn át hay không - đó là chiến lược luôn đem lại kết quả tốt hơn tất cả các chiến lược khác của bên đó, không phụ thuộc vào lựa chọn của bên kia. Điều này dẫn đến quy tắc thứ hai: Nếu bạn có chiến lược lấn át, hãy sử dụng nó. Nếu bạn không có chiến lược lấn át trong khi đối thủ của bạn lại có, hãy tính toán rằng anh ta sẽ sử dụng nó và chọn câu trả lời tối ưu tương ứng.
Tiếp theo, nếu không bên nào có chiến lược lấn át, hãy xem liệu có bên nào có chiến lược bị lấn át hay không - đó là chiến lược luôn luôn mang lại kết cục xấu hơn đối với bên áp dụng nó so với khi bên đó áp dụng các chiến lược khác. Nếu đúng như vậy, hãy áp dụng quy tắc thứ ba: Hãy loại bỏ các chiến lược bị lấn át khỏi tính toán. Cứ tiếp tục làm như vậy một cách lần lượt. Nếu trong quá trình đó, có chiến lược lấn át nào đó xuất hiện trong các trò chơi nhỏ hơn, chúng sẽ lần lượt được chọn. Nếu quy trình này kết thúc tại một kết cục duy nhất, bạn đã tìm được giải pháp về hành động cho những người chơi và kết cục của trò chơi. Ngay cả khi nếu quy trình không dẫn đến một kết cục duy nhất, nó cũng có thể giảm quy mô của trò chơi xuống một mức mà bạn có thể tìm cách xoay xở tốt hơn. Cuối cùng, nếu không có cả chiến lược lấn át lẫn bị lấn át, hoặc sau khi trò chơi đã được đơn giản hóa hết mức bằng áp dụng bước thứ hai thì hãy dùng quy tắc thứ tư: Tìm kiếm điểm cân bằng là cặp chiến lược mà trong đó hành động của người này chính là câu trả lời tối ưu cho hành động của người kia.
Nếu chỉ có một điểm cân bằng duy nhất kiểu này, sẽ dễ hiểu là tất cả người chơi cùng chọn nó. Nếu có nhiều điểm cân bằng như vậy, mọi người sẽ cùng phải biết một quy tắc chung hoặc thỏa thuận để chọn một trong số chúng. Nếu không có điểm cân bằng nào như vậy, điều này thường có nghĩa là bất kỳ một hành vi có hệ thống nào cũng có thể bị đối thủ tìm cách khai thác, thì người chơi cần phải biết chơi hỗn hợp - pha trộn các cách đi của mình.
Trên thực tế, các trò chơi có thể có một vài bước đi luân chuyển và một vài bước đi đồng thời; khi đó cần phải sử dụng kết hợp các kỹ thuật này để tư duy và xác định lựa chọn tối ưu cho hành động của người chơi.