1. Charlie Brown, đến lượt cậu
Trong một chủ đề thường thấy của loạt tranh hoạt hình Hạt dẻ, Lucy giữ quả bóng trên mặt đất và rủ Charlie Brown chạy đến đá quả bóng đó. Vào đúng thời điểm cuối cùng, Lucy kéo quả bóng ra chỗ khác. Charlie Brown đá vào không khí, ngã ngửa ra và điều này khiến Lucy hết sức khoái chí.
Bất kỳ ai cũng có thể khuyên Charlie đừng chơi trò của Lucy. Ngay cả khi Lucy chưa chơi trò đó với Charlie năm ngoái (hoặc năm trước hay trước trước nữa) thì cậu cũng đã biết tính cách của cô bé Lucy từ những hoàn cảnh khác và đoán trước được hành động của cô ta rồi.
Tại thời điểm mà Charlie quyết định xem có chấp nhận chơi trò chơi của Lucy không thì hành động của cô bé còn đang nằm trong thời tương lai. Nhưng ngay cả khi đó là chuyện trong tương lai thì cũng không có nghĩa là Charlie cần phải xem nó là không chắc chắn. Cậu cần phải biết là khi lựa chọn giữa hai kết cục - để cho cậu đá và xem cậu ngã - thì chắc chắn Lucy sẽ thích trường hợp sau hơn. Do đó, cậu cần phải dự đoán được tại thời điểm cậu đá, cô bé sẽ kéo quả bóng ra chỗ khác. Khả năng theo logic là Lucy để cho cậu đá quả bóng thực tế không hợp lý. Ỷ lại vào khả năng này, mượn lời Tiến sĩ Johnon khi mô tả sự tái hôn, là chiến thắng của hy vọng trước kinh nghiệm. Charlie cần phải bỏ qua khả năng đó và đoán trước được rằng việc chấp nhận sẽ khiến cậu không thể tránh khỏi ngã lăn ra sân. Tóm lại, Charlie nên từ chối lời mời của Lucy.
2. Hai kiểu tương tác chiến lược
Bản chất của trò chơi chiến lược là sự phụ thuộc lẫn nhau trong quyết định của những người chơi. Sự tương tác lẫn nhau này phát sinh theo hai kiểu. Kiểu thứ nhất là luân phiên, như trong câu chuyện của Charlie Brown. Những người chơi luân phiên hành động. Mỗi người chơi khi đến lượt mình sẽ phải tính toán xem hành động hiện tại của mình sẽ ảnh hưởng đến hành động trong tương lai của đối thủ như thế nào và hành động tiếp sau đó khi đến lượt lần tới của anh ta sẽ là gì.
Kiểu tương tác thứ hai là đồng thời, giống như trong câu chuyện về nghịch cảnh người tù ở Chương 1. Những người chơi hành động đồng thời mà không biết đến hành động của những người khác. Tuy nhiên, mỗi người chơi đều biết rằng còn có những người khác cũng đang chơi. Do vậy, mỗi người đều phải cố tự hình dung ra hành động của tất cả những người khác và tính toán để dự đoán kết cục. Hành động tối ưu của chính anh ta cũng là một phần không thể tách rời trong tổng thể tính toán đó.
Khi bạn thấy mình đang chơi một trò chơi chiến lược, bạn phải xác định xem tương tác ở đây là luân phiên hay đồng thời. Một số trò chơi như bóng đá có thể có những yếu tố từ cả hai kiểu. Khi đó bạn phải khớp chiến lược của mình theo hoàn cảnh. Trong chương này, chúng tôi sẽ phát triển sơ bộ những cách thức và quy tắc giúp bạn chơi trò chơi luân phiên; chơi đồng thời sẽ là nội dung của Chương 3. Chúng tôi bắt đầu bằng những ví dụ rất đơn giản, đôi khi là những câu chuyện tự bịa ra, như câu chuyện về Charlie Brown. Điều này là cố ý; các câu chuyện bản thân chúng không quan trọng và các chiến lược đúng đắn thường dễ nhận thấy chỉ cần trực giác thông thường, do vậy những ý tưởng nền tảng trong đó sẽ càng rõ ràng hơn rất nhiều. Các ví dụ sẽ càng ngày càng mang tính thực tế cao hơn và phức tạp hơn trong những bài tập tình huống ở các chương cuối.
3. Quy tắc chiến lược đầu tiên
Nguyên tắc chung của các trò chơi với những bước đi luân phiên là mỗi người chơi phải hình dung được câu trả lời trong tương lai của những người chơi khác và sử dụng chúng để tính toán xem bước đi tốt nhất của anh ta bây giờ là gì. Ý tưởng này quan trọng đến mức nó đáng được coi là một quy tắc cơ bản của hành vi chiến lược:
Quy tắc số 1:
NHÌN XA HƠN VÀ SUY LUẬN NGƯỢC VỀ
Hãy dự đoán xem những quyết định ban đầu của bạn cuối cùng sẽ dẫn đến đâu và sử dụng thông tin này để tính toán lựa chọn tối ưu của bạn.
Trong câu chuyện của Charlie Brown, mọi người đều có thể làm điều này dễ dàng (trừ Charlie). Cậu chỉ có hai khả năng lựa chọn và mỗi khả năng lựa chọn đó dẫn đến quyết định của Lucy giữa hai hành động có thể xảy ra. Hầu hết các tình huống chiến lược có nhiều lượt ra quyết định hơn, mỗi lượt lại có một vài khả năng lựa chọn và nếu chỉ lập luận miệng đơn thuần thì khó có thể theo dõi được tất cả. Việc áp dụng thành công quy tắc nhìn xa hơn và suy luận ngược về cần một hỗ trợ trực quan hơn. “Cây đồ thị” của các lựa chọn trong trò chơi là một cách hỗ trợ như vậy. Chúng tôi sẽ chỉ cho các bạn thấy sử dụng những cây đồ thị này như thế nào.
4. Cây quyết định và cây trò chơi
Một thứ tự các quyết định với sự cần thiết phải nhìn xa hơn và suy luận ngược về có thể phát sinh ngay cả với người ra quyết định một mình mà không tham gia vào trò chơi chiến lược với những người khác. Đối với Robert Frost trong khu rừng màu vàng thì:
- Hai ngả đường tách ra trong rừng, và tôi
- Tôi chọn con đường ít người đi hơn
- Và chính điều này đã làm nên tất cả những gì khác biệt1
1 Các bài thơ của Robert Frost, Louis Untermeyer biên soạn (New York, Washington Square Press, 1971).
- Chúng ta có thể cho thấy điều này một cách có hệ thống.
Đây không nhất thiết là kết cục cuối cùng của lựa chọn.
Mỗi con đường có thể lại có thêm vài nhánh nữa. Sơ đồ bây giờ sẽ trở nên phức tạp hơn một cách tương ứng. Sau đây là một ví dụ từ kinh nghiệm của riêng chúng tôi.
Những người đi từ Princeton đến New York có một vài khả năng lựa chọn. Trước hết là chọn phương tiện đi lại: xe buýt, xe lửa hoặc xe hơi. Những người chọn đi xe hơi sẽ phải chọn tiếp trong số các đường đi sau: cầu Verrazano Narrows, đường hầm Hà Lan, đường hầm Lincoln và cầu George Washington. Những người đi xe lửa phải quyết định chuyển sang tàu PATH tại ga Newark hay đi tiếp đến ga Pen. Một khi đã đến New York, nhưng người đi xe lửa và xe buýt sẽ phải chọn giữa đi bộ tiếp, đi tàu điện ngầm (tàu nhanh hoặc tàu chợ), đi xe buýt hay bắt taxi để đến được địa điểm cuối cùng. Lựa chọn tối ưu phụ thuộc vào nhiều yếu tố, bao gồm giá cả, tốc độ, dự tính về tắc đường, địa điểm cuối cùng tại New York và thậm chí cả sự khó chịu với bầu không khí trên xa lộ Jersey.
Sơ đồ này mô tả những lựa chọn của một người tại mỗi điểm cắt và có hình dạng giống một cái cây với những nhánh rẽ ngang liên tiếp, do vậy nó được gọi là “cây quyết định”. Cách đúng đắn để sử dụng sơ đồ hay cây đồ thị này không phải là chọn con đường có nhánh đầu tiên có vẻ tốt nhất và sau đó “đến nơi thì đi qua cầu Verrazano”. Thay vào đó bạn phải dự tính cho cả các quyết định sau đó và sử dụng nó để đưa ra các quyết định trước đó. Chẳng hạn, nếu bạn định đến Trung tâm thương mại quốc tế, tàu PATH sẽ là lựa chọn ưu việt nhất vì nó đi thẳng một mạch từ Newark.
Chúng ta có thể sử dụng chính cây đồ thị như vậy để mô tả các lựa chọn trong trò chơi chiến lược, tuy nhiên có một yếu tố mới thêm vào bức tranh. Đó là trò chơi bây giờ sẽ có từ hai người chơi trở lên.
Tại các điểm mọc nhánh dọc theo đồ thị cây có thể sẽ là những người chơi khác nhau luân phiên ra quyết định. Người chọn trước cần phải nhìn xa hơn, không chỉ cho những lựa chọn trong tương lai của anh ta mà cả lựa chọn của những người khác nữa. Anh ta phải dự đoán được những người khác sẽ làm gì bằng cách đặt mình vào địa vị của những người đó và cố đoán xem họ sẽ nghĩ gì. Để nhắc bạn về sự khác biệt, chúng tôi gọi cây đồ thị chỉ ra thứ tự cho các quyết định trong trò chơi chiến lược là cây trò chơi và giữ tên gọi cây quyết định cho những tình huống mà chỉ có một người chơi tham gia.
Câu chuyện của Charlie Brown đơn giản một cách nực cười, nhưng bạn có thể quen hơn với các cây trò chơi bằng cách dùng câu chuyện này cho hình vẽ. Bắt đầu trò chơi vào thời điểm Lucy đưa ra lời mời và Charlie đối mặt với quyết định chấp nhận hoặc từ chối. Nếu Charlie từ chối, câu chuyện chấm dứt. Nếu cậu chấp thuận, Lucy sẽ có hai lựa chọn giữa việc để Charlie đá bóng và kéo bóng ra ngoài. Chúng ta sẽ minh họa điều này bằng cách kéo thêm một nhánh chạc đôi nữa dọc theo đường đi của cây đồ thị.
Như đã nói ở trên, Charlie cần phải đoán trước là Lucy sẽ chọn nhánh trên. Do vậy, cậu phải cắt bớt nhánh dưới trong lựa chọn của cô bé khỏi chiếc cây. Bây giờ nếu cậu chọn nhánh trên của mình, nó sẽ dẫn thẳng đến cú ngã đau điếng. Do vậy, lựa chọn tối ưu của cậu khi đến lượt mình sẽ là nhánh dưới.
Để kết lại ý tưởng, hãy xem xét một ví dụ kinh doanh với một cây trò chơi tương tự như trên. Để tránh đụng chạm đến bất kỳ một công ty thực nào và xin cáo lỗi cùng Graham Greene, chúng ta giả sử thị trường máy hút bụi ở Cu Ba trong thời kỳ trước Phidel Castro đang bị chi phối bởi nhãn hiệu Fastcleaners và một công ty mới có tên Newcleaners đang đắn đo xem có nên gia nhập thị trường này hay không. Nếu Newcleaners tham gia vào thị trường thì Fastcleaners có hai lựa chọn: dàn xếp với Newcleaners bằng cách chấp nhận thị phần nhỏ hơn hoặc lao vào một cuộc chiến về giá cả2. Giả sử rằng Fastcleaners thỏa hiệp với sự gia nhập thị trường nói trên, Newscleaners sẽ có lợi nhuận là 100.000 đô la, còn nếu cạnh tranh về giá thì chi phí đối với Newcleaners sẽ là 200.000 đô la. Nếu Newcleaners đứng ngoài thị trường, hiển nhiên lợi nhuận của công ty sẽ bằng 0. Chúng ta sẽ minh họa câu chuyện này bằng cây trò chơi và mức lợi nhuận cho từng kết quả:
2 Trong cuốn Người của chúng ta ở Havana của Greene, người bán hàng cho một trong hai công ty này đã chọn chiến tranh - với thuốc độc thay vì giá cả.
Newcleaners cần phải làm gì? Đây là dạng quyết định cho vấn đề mà các nhà phân tích vẫn thường phải giải quyết và các trường kinh doanh vẫn hay giảng dạy. Họ cũng vẽ một hình tương tự, nhưng gọi nó là cây quyết định. Lý do là vì họ thường cho rằng các kết quả “tự dàn xếp” hay “chiến tranh giá cả” là những khả năng có thể phát sinh tình cờ. Do vậy, họ gắn các xác suất xảy ra cho cả hai. Chẳng hạn nếu cùng dàn xếp và chiến tranh giá cả có khả năng xảy ra như nhau thì xác suất của mỗi kết cục là 1/2. Sau đó họ tính toán mức lãi trung bình mà Newcleaners có thể kỳ vọng khi tham gia vào thị trường, nhân số lãi hoặc lỗ với xác suất tương ứng và cộng chúng lại với nhau.
Họ sẽ thu được:
(½)100.000$ - (½)200.000$ = -50.000$.
Bởi vì kết quả thu được là lỗ nên với các xác suất này, nhận định của các nhà phân tích kinh doanh sẽ là Newcleaners không nên nhảy vào thị trường Cu Ba.
Các đánh giá về xác suất là từ đâu ra? Lý thuyết trò chơi đưa ra câu trả lời: Xác suất này đến từ sự tin tưởng của Newcleaners vào lợi nhuận của Fastcleaners trong mỗi trường hợp trên. Để đánh giá xem Fastcleaners sẽ làm gì, trước hết Newcleaners sẽ phải đánh giá mức lãi của Fastcleaners trong các kịch bản khác nhau. Sau đó, những người chơi có thể nhìn xa hơn và suy luận ngược về để đoán xem đối phương sẽ làm gì. Để tiếp tục ví dụ này, giả sử rằng ngài độc quyền Fastcleaners có thể thu lợi nhuận là 300.000 đô la. Việc chia sẻ thị trường với Newcleaners sẽ làm mất đi 100.000 đô la lợi nhuận. Cạnh tranh giá cả sẽ khiến Fastcleaners mất một khoản chi phí 100.000 đô la. Bây giờ chúng ta điền toàn bộ những con số tính toán trên vào cây đồ thị sau:
Chúng ta sẽ sử dụng thông tin trên cây đồ thị để dự đoán tất cả các bước đi trong tương lai. Bởi các hành động có thể được xác định từ cơ cấu của trò chơi nên cây đồ thị này đúng nhất phải được gọi là cây trò chơi chứ không phải cây quyết định. Chẳng hạn để dự đoán câu trả lời của Fastcleaners cho hành động gia nhập thị trường, chúng ta nhận thấy rằng công ty kiếm được 100.000 đô la nếu cùng dàn xếp và mất 100.000 đô la nếu cạnh tranh về giá. Newcleaners cần phải dự đoán được rằng Fastcleaners sẽ chọn cùng dàn xếp thay vì cạnh tranh giá. Nhìn xa hơn và suy luận ngược về, Newcleaners cần phải nhẩm tính để cắt bớt đi nhánh cây chiến tranh giá cả. Do vậy, họ nên quyết định tham gia thị trường với tính toán sẽ thu lãi 100.000 đô la.
Quyết định này có thể sẽ khác trong các tình huống khác. Chẳng hạn, nếu Newcleaners có khả năng sẽ tiếp tục nhảy vào thị trường trên một hòn đảo khác nơi Fastcleaners đã thiết lập thị trường cho mình, Fastcleaners có thể có động cơ để chứng tỏ mình là một đối thủ khó chơi và sẵn sàng chịu lỗ ở Cu Ba để làm điều chứng tỏ đó. Nhìn xa hơn và suy luận ngược về, Newcleaners phải nhận thấy rằng họ cầm chắc lỗ 200.000 đô la và do vậy, nên quyết định đứng ngoài thị trường Cu Ba.
Newcleaners có thể thấy các kết cục cho trước được chuyển thành hành động như thế nào. Nhưng họ có thể không chắc về phần thưởng mà Fastcleaners có được ở cuối cây đồ thị. Chính sự không chắc chắn về lợi nhuận này sẽ chuyển thành sự không chắc chắn trong hành động. Chẳng hạn Newcleaners có thể tin rằng trong cuộc chiến giá cả có 33,3% khả năng Fastcleaners sẽ thiệt hại 100.000 đô la, 33,3% khả năng hòa vốn và 33,3% còn lại là có lãi 120.000 đô la bất kể có cuộc chiến giá cả. Trong trường hợp này nhìn xa hơn và suy luận ngược về cho thấy có 2/3 khả năng Fastcleaners sẽ muốn thương lượng để dàn xếp vì 100.000 đô la vẫn còn tốt hơn là bị mất ngần đó tiền hoặc hòa vốn, tuy nhiên lại xấu hơn so với khi kiếm được 120.000 đô la. Cơ hội xảy ra cuộc chiến giá cả do vậy sẽ là 1/3. Cách duy nhất để biết điều gì sẽ xảy ra là cứ nhảy vào thị trường. Với lợi thế cho trước, Newcleaners dự tính sẽ kiếm được 100.000 đô la trong 2/3 trường hợp và mất 200.000 đô la trong 1/3 trường hợp còn lại: Lợi nhuận dự tính của họ như vậy đúng bằng 0 và như vậy họ chẳng có lý do gì để gia nhập thị trường.
Trong ví dụ này, chúng ta đã chuyển sự không chắc chắn của Newscleaners về thu nhập của Fastcleaners sang các xác suất dự tính về các câu trả lời của Fastcleaners. Tuy nhiên, cần thận trọng khi đặt sự không chắc chắn vào một chỗ nào đó. Chỗ đặt đúng nhất là ở cuối cây đồ thị. Hãy nhìn xem cái gì đã đi sai ở đây và tránh vội vàng trong đánh giá của mình. Tính trung bình, Fastcleaners có thể kiếm lợi nhuận trong cuộc chiến giá cả (1/3 x 120.000$ + 1/3 x 0 - 1/3 x 100.000$ = 6.667$). Tuy nhiên điều này không có nghĩa là họ sẽ luôn muốn có chiến tranh. Xác suất thắng không phải là 100%. Sự hiện diện của tính không chắc chắn cũng không có nghĩa xác suất thắng sẽ là 50%. Cách đúng đắn để phân tích chính xác vấn đề đối với Newcleaners là bắt đầu từ cuối cuộc chơi và nhẩm tính xem Fastcleaners sẽ làm gì trong mỗi trường hợp.
5. Các cây đồ thị phức tạp hơn
Trên thực tế, những trò chơi của bạn phức tạp hơn nhiều so với những ví dụ chúng tôi dùng với mục đích minh họa ở trên. Tuy nhiên, những nguyên tắc đó vẫn áp dụng được khi cây con phát triển thành cây lớn. Có lẽ ví dụ tốt nhất ở đây là chơi cờ. Mặc dù các quy tắc trong chơi cờ tương đối đơn giản, nó có thể tạo ra một trò chơi đầy tính suy luận chiến lược. Quân trắng khởi đầu bằng một nước, quân đen đáp trả bằng một nước, và cứ luân phiên như vậy. Do đó, kiểu suy luận chiến lược đơn thuần nhất trong chơi cờ bao gồm nhìn xa hơn để thấy trước hậu quả của nước cờ bạn đi đúng theo cách mà chúng ta đã thấy.
Một ví dụ của suy luận kiểu như vậy có thể như sau: “Nếu ta đi quân tốt đó bây giờ, đối thủ của ta sẽ di chuyển quân ngựa và đe dọa quân xe. Do vậy, ta phải bảo vệ ô mà quân ngựa định đi vào bằng quân tượng trước khi ta di chuyển quân tốt”.
Bởi vì cờ là một trò chơi với các nước đi luân chuyển nên chúng ta có thể minh họa trò chơi bằng một cây đồ thị. Quân trắng có thể mở đầu bằng bất kỳ nước nào trong số 20 nước đi có thể3. Trong bức tranh dưới, chúng tôi chỉ ra cơ hội đầu tiên cho nước đi của quân trắng bằng điểm quyết định đầu tiên (hoặc điểm mấu) trên cây đồ thị, đánh dấu là W1. 20 nước đi mà quân trắng có thể đi sẽ trở thành 20 nhánh xuất phát từ mấu cây này. Mỗi nhánh được gọi tên bằng nước đi mà nó tượng trưng: tốt đối diện vua - 4 (P-K4 hoặc e4 theo cách viết đại số), tốt đối diện hậu - 4 và cứ tiếp tục như vậy. Chúng tôi chỉ muốn truyền đạt ý tưởng chung và vì vậy để tránh làm rối mắt chúng tôi sẽ không vẽ tất cả các nhánh có thể hoặc tên gọi của các nhánh. Mỗi nhánh sẽ dẫn đến một mấu tiếp theo đại diện cho nước đi đầu tiên của quân đen, được đặt là B1. Quân đen cũng có thể đi bất kỳ nước nào trong số 20 nước có thể, do vậy sẽ có 20 nhánh tách ra từ điểm mấu B1 nói trên. Sau khi mỗi bên đã đi một nước, bây giờ chúng ta sẽ có cả thảy 400 khả năng đi có thể. Kể từ đây, số nhánh cây mọc thêm sẽ phụ thuộc vào nước đi trước đó. Chẳng hạn nếu quân trắng đi nước đầu tiên là P-K4, quân trắng sẽ có thêm rất nhiều khả năng cho nước đi thứ hai bởi vì quân tượng và hậu bây giờ đã có thể di chuyển. Bạn thấy đấy, chiếc cây của bạn có thể xây dựng đơn giản như thế nào trên nguyên tắc và nó sẽ trở nên phức tạp nhanh chóng đến thế nào trên thực tế.
3 Anh ta có thể đi một trong tám quân tốt về phía trước một hoặc hai ô, hoặc di chuyển một trong hai quân mã, mỗi quân theo một trong hai đường (đến các ô có ký hiệu xe-3 hoặc tượng-3).
Chúng ta có thể lựa chọn một nhánh tại mỗi điểm mấu trên cây trò chơi và đi tiếp xuống mãi. Mỗi con đường như vậy sẽ đại diện cho một tình huống cụ thể mà trò chơi có thể biến đổi. Các chuyên gia cờ đã xem xét rất nhiều con đường như vậy trong các giai đoạn đầu (khai cuộc) và nghiên cứu xem chúng có thể dẫn đến đâu. Chẳng hạn, con đường mà chúng ta đã đặt tên trên cây đồ thị, khi các nước đi đầu tiên là P-K4 đối với trắng và P-QB4 đối với đen, có thể là sự báo trước thế cờ Phòng thủ kiểu Sicil4.
4 Tiếp tục các nước sẽ dần đến cái gọi là Biến tấu của quân tốt bị đầu độc, nghe rất giống như nó đến từ cung điện của các Borgia hay từ Phố Wall.
Trong nhiều trò chơi, mỗi con đường như vậy sẽ kết thúc sau một số nhất định các bước đi. Trong thể thao hay các trò chơi trên bàn (chẳng hạn cờ vua), đó có thể là khi một bên thắng hoặc trận đấu hòa. Nói chung, kết quả cuối cùng của trò chơi có thể dưới hình thức phần thưởng bằng tiền hoặc hiện vật hoặc hình phạt đối với những người chơi. Chẳng hạn cuộc chơi cạnh tranh trong kinh doanh có thể kết thúc với lợi nhuận rất lớn cho một công ty và sự phá sản cho công ty kia.
Còn “trò chơi” chạy đua vũ trang hạt nhân có thể kết thúc bằng một thỏa ước hòa bình thành công hoặc cả hai bên cùng bị hủy diệt.
Nếu như trò chơi kết thúc sau một số bước đi xác định thì dù là đi theo con đường nào về nguyên tắc chúng ta cũng có thể giải được nó một cách hoàn toàn. Giải trò chơi hàm ý tìm ra được ai là người thắng và bằng cách nào. Điều này được thực hiện bằng cách suy luận ngược về dọc theo cây trò chơi. Một khi chúng ta đã xem xét suốt dọc cả cây, chúng ta sẽ biết được liệu chúng ta có thắng được hay không và nếu được thì phải sử dụng chiến lược nào. Đối với bất kỳ trò chơi nào với một số xác định các bước đi luân chuyển luôn luôn có một chiến lược tối ưu để chơi. Tất nhiên có chiến lược tối ưu không có nghĩa là chúng ta có thể dễ dàng tìm ra chiến lược đó. Cờ vua là một ví dụ rõ nhất cho điều này.
Các chuyên gia cờ vua đã rất thành công trong việc mô tả đặc điểm của các chiến lược tối ưu tại điểm gần kết thúc của ván cờ. Một khi bàn cờ chỉ còn lại ba đến bốn quân cờ, những chuyên gia chơi cờ có thể nhìn trước kết cục của trận đấu và xác định (bằng cách đi nhẩm ngược lại) xem liệu một trong hai bên có thể có được một chiến lược bảo đảm thắng lợi không hoặc bên kia có thể ép thủ hòa được không. Sau đó, họ có thể sử dụng những thế hết cờ mong muốn khác nhau để đánh giá các chiến lược tại điểm giữa cuộc chơi. Vấn đề là ở chỗ không một ai có khả năng tính toán xuyên suốt cả cây đồ thị ngược về đến tận nước đi đầu tiên.
Có một vài trò chơi đơn giản có thể được giải hoàn toàn. Chẳng hạn, trò oẳn tù tì luôn luôn có thể thủ hòa. Chính vì vậy mà đây là trò chơi dành cho trẻ con hơn là người lớn. Ngay cả môn cờ đam cũng đang gặp nguy bởi vì người ta tin rằng (mặc dù chưa ai khẳng định) người chơi thứ hai luôn có thể thủ hòa. Để có thể duy trì sự ham thích đối với trò chơi này, trong các cuộc đấu cờ đam, những người chơi bắt đầu tại một điểm giữa ván, khi chiến lược thắng và hòa là không thể biết trước. Đến một ngày khi các ván cờ vua có thể giải được hoàn toàn theo cách này, có lẽ người ta sẽ buộc phải thay đổi các quy tắc chơi của nó.
Còn trong khi chờ đến lúc đó, những người chơi cờ đã làm gì? Họ làm đúng những gì tất cả chúng ta cần làm khi đưa các chiến lược luân chuyển vào thực tiễn: kết hợp các phân tích hướng về tương lai với suy xét giá trị. Họ đặt câu hỏi: Liệu đi theo con đường này sau bốn, năm nước đi nữa nói chung sẽ dẫn đến một vị thế cờ tốt hay xấu? Họ gắn giá trị cho từng kết cục có thể xảy ra, coi đó dường như là kết cục cuối cùng của trò chơi. Sau đó, họ nhìn xa hơn và suy luận ngược về để ra một chiến lược có thể mang đến giá trị lớn nhất sau bốn hoặc năm nước đi. Suy luận ngược về là phần dễ làm.
Vấn đề khó là gán giá trị cho mỗi nước đi trung gian. Giá trị của mỗi quân cờ cần phải được lượng hóa và sự đánh đổi giữa lợi thế về giá trị và lợi thế trong thế cờ phải được cân nhắc.
Paul Hoffman trong cuốn sách của mình có tựa đề Cuộc báo thù của Acsimet đã mô tả thành công của chương trình chơi cờ trên máy tính do Hans Berliner lập ra. Bản thân là kiện tướng vô địch cờ thế giới, Berliner đã sáng tạo ra một chiếc máy tính dành riêng để chơi cờ có thể xem xét 30 triệu lựa chọn chỉ trong thời gian 3 phút tiêu chuẩn cho mỗi nước đi và có một quy tắc rất hay để đánh giá các thế cờ trung gian. Không có quá 300 người chơi cờ trên thế giới có thể đánh bại được chương trình chơi cờ này. Trong môn cờ thỏ cáo, Berliner cũng có một chương trình đã từng đánh bại cả người vô địch thế giới về môn cờ này.
Sự kết hợp giữa tính logic rõ ràng từ suy luận ngược về và đánh giá các thế cờ trung gian dựa trên kinh nghiệm cũng là cách hữu ích để xử lý nhiều trò chơi phức tạp khác ngoài cờ vua.
6. Thương lượng
Trong kinh doanh và chính trị học quốc tế, các bên thường thương lượng hoặc đàm phán xung quanh vấn đề phân chia chiếc bánh lợi ích chung. Chúng ta sẽ nghiên cứu điều này chi tiết hơn trong Chương 11. Còn ở đây, chúng ta sử dụng nó để minh họa cho việc suy luận ngược về có thể cho chúng ta khả năng đoán trước được kết cục của các trò chơi với các bước đi luân chuyển như thế nào.
Hầu hết mọi người đều theo thông lệ trong xã hội và dự đoán rằng chia đôi phần chênh lệch sẽ là kết cục của cuộc thương lượng. Điều này có lợi thế là công bằng. Chúng tôi có thể chỉ ra rằng trong nhiều kiểu thương lượng phổ biến, chia đôi 50:50 chính là giải pháp rút ra từ suy luận ngược.
Có hai đặc điểm chung của thương lượng mà chúng ta phải quan tâm trước hết. Thứ nhất, chúng ta cần phải biết ai là người đưa ra đề nghị với ai, đó chính là quy tắc của trò chơi. Và sau đó, chúng ta cần phải biết điều gì sẽ xảy ra nếu các bên thất bại trong việc đạt được thỏa thuận.
Các cuộc thương lượng khác nhau diễn ra theo những quy tắc khác nhau. Trong hầu hết các cửa hàng bán lẻ, người bán đặt giá và người mua chỉ có hai lựa chọn là chấp nhận mức giá đó hoặc bỏ đi chỗ khác5. Đây là quy tắc đơn giản “lấy hay bỏ”. Trong trường hợp thương lượng về mức lương, nghiệp đoàn sẽ đưa ra yêu sách và công ty sẽ quyết định có chấp nhận hay không. Nếu không, họ có thể đưa ra đề nghị ngược lại hoặc chờ nghiệp đoàn điều chỉnh yêu sách của mình. Trong một số trường hợp, thứ tự hành động được quy định bởi luật hoặc thông lệ; trong một số trường hợp khác nó có thể đóng một vai trò chiến lược bởi chính nó. Dưới đây chúng ta sẽ xem xét một cuộc thương lượng khi các bên luân phiên nhau đưa ra đề nghị.
5 Một số người mua hàng có khả năng mặc cả bất kỳ chỗ nào (kể cả Sears). Cuốn sách của Herb Cohen, Bạn có thể mặc cả mọi thứ, đưa ra rất nhiều lời khuyên có giá trị.
Một đặc điểm quan trọng của các cuộc thương lượng chính là “thời gian là tiền bạc”. Khi các cuộc thương lượng bị kéo dài, chiếc bánh lợi ích sẽ co lại. Dù vậy, các bên vẫn có thể không chịu thỏa thuận. Mỗi bên hy vọng một dàn xếp có lợi về phía mình sẽ bù đắp được chi phí bỏ ra khi thương lượng. Cuốn sách Ngôi nhà trắng của Charles Dickens mô tả một tình huống cực đoan; cuộc cãi vã xung quanh tài sản của Jarndyce bị kéo dài lâu đến mức toàn bộ giá trị tài sản đã bị nuốt chửng bởi khoản phí khổng lồ phải trả cho luật sư. Tương tự, nếu thất bại trong thỏa thuận về lương đưa đến đình công thì công ty sẽ mất lợi nhuận trong khi công nhân sẽ mất lương. Nếu các quốc gia đàm phán quá lâu về tự do hóa thương mại, họ sẽ bỏ mất những lợi ích tiềm tàng mà việc mở rộng thương mại có thể đem lại trong thời gian họ tranh cãi xem phải chia lợi ích đó như thế nào. Sợi chỉ chung ở đây là các bên trong thương lượng đều mong muốn đạt được một thỏa thuận cho trước bất kỳ nào càng sớm càng tốt.
Trên thực tế, sự co lại của chiếc bánh lợi ích diễn ra theo những cách thức phức tạp và ở những mức độ khác nhau trong những tình huống khác nhau. Chúng ta có thể minh họa ý tưởng này một cách tương đối đầy đủ theo cách rất đơn giản sau đây: Giả sử rằng chiếc bánh co lại đến bằng 0 với một lượng co lại là như nhau sau mỗi bước đề nghị hay đề nghị ngược lại. Hãy tưởng tượng đến chiếc bánh như thể nó làm bằng kem lạnh và nó sẽ chảy ra trong khi bọn trẻ cãi nhau để chia phần chiếc bánh.
Trước hết, giả sử chỉ có một bước đi ở đây. Có một chiếc bánh kem lạnh nằm trên bàn; một đứa trẻ (Ali) đề nghị cách chia bánh với đứa kia (Baba). Nếu Baba đồng ý thì việc chia bánh sẽ diễn ra như thỏa thuận giữa hai đứa, còn nếu không, chiếc bánh sẽ tan và chẳng đứa nào có phần cả.
Bây giờ Ali có một vị thế rất mạnh: Cô ta hoàn toàn có thể đề nghị Baba chọn giữa chỉ một chút ít và không có gì. Ngay cả khi nếu cô ta để nghị lấy cả 100% chiếc bánh cho mình và chỉ cho Baba liếm con dao dính bánh đã cắt, điều duy nhất Baba có thể làm là nhận và liếm dao hoặc chẳng được tý nào hết. Tất nhiên Baba có thể từ chối lời đề nghị do quá tức giận với sự bất công đó. Hoặc cậu ta có thể muốn xây dựng và duy trì một ấn tượng về một người thương lượng cứng rắn, điều có thể giúp cậu trong các cuộc thương lượng trong tương lai, bất kể với Ali hay với một ai khác biết đến hành động của Baba ở đây. Trên thực tế, Ali cần phải nghĩ xa hơn đến những vấn đề như vậy và đề nghị chia cho Baba một phần vừa đủ (có lẽ là một lát nhỏ?) để dụ dỗ cậu ta đồng ý. Để đơn giản hóa, chúng tôi sẽ bỏ sang bên những chi tiết phức tạp này và giả sử rằng Ali có thể lấy hết 100% chiếc bánh. Trên thực tế, chúng ta sẽ quên đi việc Baba có thể liếm phần bánh dính dao và chỉ nói rằng Ali có thể lấy toàn bộ chiếc bánh bằng cách đưa ra một lời đề nghị “lấy hoặc bỏ”.
Một khi có vòng hai cho cuộc thương lượng, mọi chuyện sẽ tốt hơn đối với Baba. Một lần nữa có một chiếc bánh kem lạnh trên bàn nhưng có thể thương lượng hai lần trước khi chiếc bánh tan hết. Nếu Baba từ chối lời đề nghị của Ali, cậu ta có thể quay lại với một đề nghị khác, nhưng tại thời điểm đó chỉ còn lại một nửa chiếc bánh. Nếu Ali cũng từ chối lời đề nghị của Baba thì nửa còn lại cũng sẽ tan nốt và cả hai sẽ không còn gì.
Bây giờ Ali phải nhìn xa hơn để thấy hậu quả của lời đề nghị ban đầu của cô ta. Cô ta biết rằng Baba có thể từ chối lời đề nghị của mình và quay lại với thế mạnh khi đưa ra lời đề nghị kiểu “lấy hoặc bỏ” để chia nửa còn lại của chiếc bánh. Điều này sẽ cho Baba thực chất là toàn bộ nửa chiếc bánh còn lại. Do vậy, cậu sẽ không định chấp nhận bất kỳ cái gì ít hơn thế từ lời đề nghị vòng đầu tiên của Ali. Còn nếu Ali bỏ qua lần đề nghị này thì cô ta sẽ chẳng còn lại gì hết. Biết như vậy nên cô ta sẽ bắt đầu bằng việc đề nghị luôn cho Baba một nửa chiếc bánh, nghĩa là vừa đủ để khuyến khích Baba nhận lấy trong khi giữ lại cho mình một nửa kia. Vậy là họ ngay lập tức đồng ý chia chiếc bánh 50:50.
Bây giờ thì nguyên tắc đã rõ ràng và chúng ta có thể dễ dàng đưa thêm một bước nữa vào. Một lần nữa, hãy tăng tốc thương lượng hoặc để chiếc bánh tan chậm hơn. Với mỗi đề nghị hoặc đề nghị ngược lại, chiếc bánh sẽ tan từ nguyên chiếc cho đến còn 2/3 rồi 1/3 và hết. Nếu Ali đưa ra đề nghị cuối cùng khi chiếc bánh đã tan chỉ còn lại 1/3, cô ta sẽ lấy tất cả chỗ đó. Biết được điều đó, Baba sẽ đề nghị cô ta lấy 1/3 chiếc bánh khi đến lượt cậu đề nghị, khi đó chiếc bánh vẫn còn 2/3. Như vậy, Baba có thể chờ đợi nhận được nhiều nhất là 1/3, tức là một nửa của 2/3 chiếc còn lại. Nhưng biết được điều này, Ali sẽ mở đầu cuộc thương lượng bằng cách đề nghị Baba lấy 1/3 (vừa đủ để Baba có thể chấp nhận) và giữ 2/3 cho mình.
Điều gì xảy ra với khả năng chia đều? Kết quả này sẽ lặp lại khi số bước đi (ra đề nghị) là chẵn. Quan trọng hơn, ngay cả khi số bước là lẻ thì hai bên cũng sẽ ngày càng tiến gần đến kết cục chia đều 50:50 khi số bước đi tăng lên.
Với bốn bước đi, Baba sẽ là người đưa ra đề nghị cuối cùng và lấy một phần tư chiếc bánh còn trên bàn vào thời điểm đó. Do vậy Ali phải đề nghị cậu lấy 1/4 vào lần đề nghị áp chót khi trên bàn chỉ còn một nửa chiếc bánh. Nhưng như vậy thì Baba ở bước đi trước đó (bước thứ hai) có thể đề nghị Ali lấy 1/4 trong số 3/4 chiếc bánh còn lại và giữ 1/2 cho mình. Nhìn trước tất cả điều đó, Ali sẽ mở màn cuộc thương lượng bằng cách đề nghị luôn để Baba lấy một nửa và giữ một nửa cho mình.
Với năm bước đi, Ali mở đầu bằng đề nghị chia cho Baba 2/5 chiếc bánh và giữ lại 3/5 cho mình. Với 6 bước, bánh lại được chia 50:50. Với bảy bước, Ali lấy 4/7 và Baba 3/7. Một cách tổng quát, khi số bước đi là chẵn, mỗi bên sẽ nhận được đúng một nửa. Khi số bước n là lẻ, Ali sẽ nhận được (n+1)/(2n) còn Baba nhận được (n-1)/(2n). Khi số bước tăng lên đến 101, lợi thế đi trước của Ali sẽ chỉ còn là cô ta nhận được 51/101 trong khi Baba nhận được 50/101.
Trong quá trình thương lượng điển hình này, chiếc bánh co lại chậm nên có thời gian cho nhiều đề nghị và đề nghị ngược lại được đưa ra trước khi chiếc bánh biến mất hoàn toàn. Điều gợi ý ở đây là chuyện ai là người đưa ra đề nghị đầu tiên không còn quan trọng nữa một khi chân trời cho thương lượng đủ xa. Giải pháp chia đều có vẻ là khó tránh khỏi trừ phi thương lượng bị bế tắc trong một thời gian dài và đến khi thắng thì chiếc bánh chẳng còn lại bao nhiêu để lấy nữa. Đúng là người nào đi bước cuối cùng sẽ lấy tất cả những gì còn lại. Nhưng khi thương lượng kết thúc, hầu như chẳng còn gì sót lại cho người thắng. Lấy tất cả của không có gì chính là thắng trận đấu nhưng thua cuộc chiến. Điều quan trọng bạn cần thấy là mặc dù chúng ta đã xem xét nhiều đề nghị và đề nghị ngược lại có thể, kết cục dự đoán trước là lời đề nghị đầu tiên của Ali sẽ được chấp nhận. Các bước tiếp sau do vậy không bao giờ được chơi đến. Tuy nhiên, thực tế là các bước này sẽ được viện đến nếu không đạt được thỏa thuận ngay từ vòng đi đầu tiên khiến Ali sẽ buộc phải tính toán sao cho lời đề nghị đầu tiên của mình vừa đủ để có thể được chấp nhận.
Điều quan sát thấy nói trên đến lượt nó đã gợi ý thêm một chiều nữa cho chiến lược trong thương lượng. Nguyên tắc nhìn xa hơn và suy luận ngược về có thể xác định kết cục của quá trình ngay từ trước khi nó bắt đầu. Thời điểm cho áp dụng chiến lược có thể còn sớm hơn nữa, khi các quy tắc của thương lượng được xác định.
Tuy nhiên, cũng quan sát trên làm nảy sinh một câu hỏi. Nếu quá trình thương lượng giống hệt như mô tả trên đây thì đình công sẽ chẳng bao giờ xảy ra. Tất nhiên triển vọng về một cuộc đình công có ảnh hưởng đến việc đạt được thỏa thuận, nhưng công ty, hoặc nghiệp đoàn, tùy từng trường hợp, ngay từ cơ hội đầu tiên nên đưa ra một đề nghị tối thiểu có thể chấp nhận được đối với bên kia. Đình công, hay nói chung hơn là sự đổ vỡ đàm phán thường nảy sinh từ những đặc điểm khó thấy hơn hoặc phức tạp hơn của thực tế mà chúng tôi không thể đưa hết vào câu chuyện đơn giản nói trên. Chúng tôi sẽ còn đề cập đến một số điểm này trong Chương 11.
7. Chiến tranh và hòa bình
Minh họa thứ hai cho suy luận ngược về đến từ việc xem xét liệu hòa bình có thể được duy trì như thế nào sau một loạt các hành động đối kháng song phương.
Chúng tôi muốn lấy một ví dụ phần nào mang tính giả định. Sudan là một nước tương đối yếu đang bị đe dọa tấn công bởi nước láng giềng Libya. Nếu như hai nước này bằng cách nào đó nằm biệt lập khỏi thế giới thì sẽ chẳng có gì ngăn cản Libya tấn công và chiếm Sudan.
Trong khi hai nước láng giềng đối kháng có thể không duy trì được hòa bình thì sự có mặt của bên thứ ba có thể tạo ra sự cản trở cần thiết. Trong trường hợp của Sudan và Libya, nguyên tắc này có thể được gọi là “Kẻ thù của kẻ thù là bạn của ta”. Mối nguy hiểm đối với Libya là nếu họ đánh Sudan, họ sẽ phải rút bớt quân đội từ biên giới phía đông giáp Ai Cập. Mặc dù Ai Cập không muốn tấn công nước Libya đầy sức mạnh nhưng nếu Libya yếu đi từ cuộc chiến tranh với Sudan thì đó có thể là một cơ hội mời gọi đối với người Ai Cập để giải quyết với anh bạn láng giềng hay gây gổ. Libya có thể (hoặc ít nhất cần phải) suy luận ngược về để dự đoán được khả năng Ai Cập tấn công mình khi họ đang vướng bận với Sudan. Hóa ra là Sudan lại được an toàn. Nhưng nếu dừng chuỗi suy nghĩ về ba nước ở đây sẽ dẫn đến một cảm nhận sai lầm về an ninh.
Nếu ba nước tạo ra thế ổn định, thì bốn nước sẽ ra sao? Hãy thêm Israel vào. Nếu Ai Cập tấn công Libya, điều này có thể khiến Israel mở cuộc tấn công. Trước khi Sadat và Begin bình thường hóa quan hệ, đó sẽ là một mối đe dọa thực sự đối với Ai Cập. Vào những năm trước 1978, Libya có ít lý do hơn để lo ngại cuộc tấn công của Ai Cập bởi sự không an toàn của Ai Cập trong quan hệ với Israel. Kết quả là Sudan không thể trông đợi vào việc Ai Cập sẽ kiểm soát tham vọng bành trướng của Libya6. Với quan hệ được cải thiện hơn giữa Israel và Ai Cập, chuỗi suy luận ngược về dừng lại ở Ai Cập, và Sudan được an toàn, ít nhất là trong hiện tại.
6 Như vậy chúng ta sẽ có “kẻ thù của kẻ thù không phải là bạn của ta”.
Ví dụ về sự ngăn trở này tất nhiên đã được hư cấu. Về bản chất nó hàm ý việc một nước bị tấn công hay không phụ thuộc vào việc có một số chẵn hay lẻ các mối liên hệ trong chuỗi những kẻ có thể phản bội. Một kịch bản thực tế hơn sẽ xem xét tất cả những mối quan hệ phức tạp giữa các quốc gia và cung cấp chi tiết hơn về khả năng họ tấn công lẫn nhau. Ngoài ra ở đây còn có một nhận xét quan trọng nữa: kết cục của các trò chơi phụ thuộc rất nhiều vào việc có bao nhiều người chơi tham gia vào đó. Nhiều người hơn có thể tốt hơn và sau đó lại trở thành xấu hơn, thậm chí ngay cả trong cùng một trò chơi. Nhận định rằng hai quốc gia đối kháng làm cho quan hệ láng giềng không ổn định trong khi ba kẻ đối kháng lại có thể khôi phục sự ổn định không hàm ý rằng bốn kẻ sẽ còn tốt hơn nữa; trong trường hợp này thì bốn cũng giống như hai7.
7 Thực tế nếu có một số lẻ các quốc gia trong chuỗi suy luận thì A sẽ được an toàn. Nếu chuỗi có một số chẵn các quốc gia thì B sẽ tấn công A; sau cuộc tấn công của B, chuỗi sẽ còn lại một số lẻ các quốc gia và B sẽ an toàn.
Để phát triển ý tưởng này thêm nữa, chúng tôi muốn bạn đọc thêm tình huống “Đấu súng tay ba” trong tập hợp các bài tập tình huống ở chương cuối cuốn sách này. Ba kẻ đối kháng, mỗi người có một năng lực khác nhau, phải quyết định xem họ sẽ tấn công ai. Bạn có thể thấy câu trả lời sẽ làm bạn ngạc nhiên.
8. Trò chơi của người Anh
Xuyên suốt chương này chúng ta đã nói về các trò chơi trong đó các hành động hay bước đi được thực hiện theo một thứ tự nghiêm ngặt. Trên thực tế, rất ít các trò chơi có những quy tắc được xác định rõ ràng để người chơi tuân theo. Những người chơi tự đặt ra luật chơi của mình. Làm thế nào họ có thể nhìn trước và suy luận ngược về và sự thực là làm thế nào họ có thể biết trong trò chơi của họ có bất kỳ thứ tự nào không?
Để minh hoạ, chúng tôi sẽ sử dụng ví dụ về cuộc vận động bầu cử ở Anh năm 1987. Đảng cầm quyền là Đảng Bảo thủ khi đó dưới thời Margaret Thatcher đang bị Đảng Lao động dưới sự lãnh đạo cuả Neil Kinnock thách thức. Trong cuộc vận động, mỗi người phải chọn giữa đường cao - vận động dựa trên các giải pháp đưa ra cho vấn đề cần giải quyết; và đường thấp - cuộc đấu mang tính cá nhân8. Có một số lượng đủ lớn các cử tri hài lòng với hoạt động của Thatcher để có thể chắc chắn rằng nếu cả hai cùng có chương trình vận động tương tự nhau thì Thatcher sẽ thắng.
8 Đường thấp theo định nghĩa trong www.dictionary.com còn là đi theo cách không thật chính đáng lắm, nhất là trong vận động bầu cử - ND.
Hy vọng duy nhất của Kinnock là ông ta sẽ tạo ra một ấn tượng tốt hơn trong các cuộc vận động cho các phong cách đối lập; chúng ta hãy giả sử rằng cơ hội của ông ta khi bà Thatcher chọn đường cao, ông ta chọn đường thấp cũng giống như khi họ có những lựa chọn đối lập nhau. Giả sử rằng mỗi người trong số họ đều có xu hướng chọn đường cao nhưng điều này chưa đủ để chiến thắng.
Đâu là cái gọi là “con đường ít người đi”? Câu trả lời phụ thuộc chủ yếu vào thứ tự ra quyết định của hai bên. Chúng ta sẽ xem xét một vài khả năng sau đây.
Giả sử rằng bà Thatcher chọn trước, bởi vì truyền thống ở đây là đảng cầm quyền sẽ khởi xướng trước công chúng bản tuyên ngôn của mình trước khi đảng đối lập làm việc đó. Bà ta có thể vẽ ra một cây trò chơi như dưới đây.
Bằng cách nhìn xa hơn và suy luận ngược về, bà Thatcher có thể dự đoán rằng nếu bà ta đi đường cao thì ông Kinnock sẽ đi đường thấp và ngược lại9. Bởi vì cả hai lựa chọn đều cho bà khả năng thắng như nhau nên bà ta sẽ chọn đường cao.
9 Bài hát Loch Lomond có đoạn: “Cứ đi đường cao đi còn ta đi đường thấp. Và ta sẽ về Scotland”. Do đó, chúng tôi phải chỉ ra rằng Đảng Lao động đã giành được hầu hết ghế tại Scotland mặc dù Đảng Bảo thủ thắng cuộc tranh cử trên toàn Liên hiệp Anh với một sự chênh lệch rất lớn.
Thực tế bà Thatcher đi trước là một bất lợi cho bà, bởi nó cho phép ông Kinnock chọn chiến thuật đối lập. Nhưng thực tế là bà ta phải đi trước tự nó không tạo nên vấn đề. Cho phép chúng tôi làm một thay đổi nhỏ trong kịch bản. Giả sử rằng bà Thatcher sẽ gặp các nhà tư vấn của Đảng Bảo thủ và những người phụ trách vận động quảng cáo cho mình trước khi ra quyết định chiến lược. Nhưng lựa chọn của bà không được công bố ra ngoài. Ông Kinnock cũng chủ trì một cuộc họp tương tự. Ông ta sẽ phải quyết định điều gì? Liệu ông ta có nên trù liệu rằng bằng việc đi bước đầu tiên, bà Thatcher sẽ suy luận theo cách mà chúng ta vừa mô tả hay không? Điều đó sẽ có nghĩa là bà chọn đi đường cao và do đó ông Kinnock sẽ chọn đi đường thấp.
Nhưng nếu bà Thatcher biết rằng ông Kinnock sẽ nghĩ như vậy, bà ta sẽ chọn cho mình chiến lược đường thấp. Ông Kinnock không biết chắc về quyết định của bà và sẽ là ngu ngốc nếu bỏ qua khả năng có sự tính toán “cấp hai” như vậy. Vậy thì phải chăng ông ta nên chọn đường cao? Không nhất thiết, vì bà Thatcher có thể suy nghĩ đến “cấp ba” và cứ tiếp tục như thế. Điểm chung rút ra ở đây là đối với việc áp dụng nguyên tắc nhìn xa hơn và suy luận ngược về, điều quan trọng là các bước đi trước phải dễ dàng quan sát được bởi những người đi sau.
Ngay cả khi bà Thatcher đi trước và lựa chọn của bà ta là có thể thấy được thì sẽ ra sao nếu bà ta có thể thay đổi chiến lược của mình trong quá trình vận động? Giả sử rằng ấn tượng cuối cùng của cử tri là quan trọng nhất và những gì bà Thatcher nói trong tuyên bố đầu tiên của mình là không liên quan. Ông Kinnock sẽ không thể coi nó là đương nhiên khi quyết định chiến lược cho mình. Ngược lại, bà Thatcher cũng không thể nghĩ rằng câu trả lời của ông Kinnock khi tính toán cho bước đi đầu tiên của mình là không thay đổi. Do đó, chúng ta có một điều kiện thứ hai để có thể áp dụng nguyên tắc nhìn xa hơn và suy luận ngược về: Đó là các chiến lược cần phải là không thể đảo ngược.
Điều gì sẽ xảy ra nếu một trong hai điều kiện trên không được thỏa mãn? Ngay cả khi các lựa chọn của hai bên được đưa ra vào các thời điểm khác nhau thì chúng vẫn có thể được coi là đồng thời theo cách nhìn nhận của tư duy chiến lược. Việc chuyển từ đi các bước luân phiên sang đi đồng thời có thể là lợi thế đối với một trong hai hoặc cả hai bên. Trên thực tế, trong cuộc vận động tranh cử ở Anh năm 1987 mỗi bên đều đã có ít nhất một sự đảo ngược chiến lược. Chương 3 sẽ đưa ra những quy tắc cho hành động trong trò chơi với các bước đi đồng thời.
Các cuộc thi đấu điền kinh cho thấy một quan điểm khác về sự khác nhau giữa trò chơi với các bước đi luân chuyển và trò chơi với các bước đi đồng thời. Cuộc thi chạy 100 mét là đồng thời vì không có thời gian cho thứ tự ở đây. Trong cuộc thi bơi bướm, thời gian để đáp trả hành động có thể có nhưng các đối thủ rất khó có thể nhìn thấy vị trí của những người đua khác; do vậy nó cũng được coi là trò chơi đồng thời. Cuộc thi chạy marathon có những yếu tố cho một cơ cấu có thứ tự: Những người chạy có thể quan sát vị trí của nhau (đến một mức độ nào đó) và các chiến lược là không thể đảo ngược bởi vì không thể quay lại để chạy lại những đoạn đường trước đó trong cuộc đua.
Để kết thúc chương này, chúng tôi quay lại với vấn đề của Charlie Brown về việc có nên đá quả bóng hay không. Câu hỏi này đã trở thành một vấn đề thực tế đối với Tom Osborne, huấn luyện viên bóng đá, trong những phút cuối cùng của trận đấu giải vô địch. Chúng tôi nghĩ rằng ông ta đã sai. Suy luận ngược về sẽ cho thấy sai lầm này của ông ta.
9. Bài tập tình huống số 2
TOM OSBORNE VÀ GIẢI CHIẾC BÁT CAM NĂM 1984
Trong giải Chiếc bát cam năm 1984, đội Nebraska Cornhuskers bất bại và đội Miami Huricanes chỉ mới thua một lần sẽ phải gặp nhau. Bởi vì Nebraske đến với trận chung kết với kết quả tốt hơn nên họ chỉ cần hòa là kết thúc với vị trí dẫn đầu mùa giải. Nhưng Nebraska đã để dẫn trước 31-17 trong vòng đấu thứ 4. Sau đó các cầu thủ Cornhuskers bắt đầu phản công. Họ ghi điểm trong một cú đập (touchdown) và nâng tỷ số lên 31-23. Khi đó huấn luyện viên của đội Tom Osborne phải đưa ra một quyết định chiến lược.
Trong bóng đá giữa các trường đại học, một đội ghi điểm bằng cú đập sau đó sẽ bắt đầu chơi từ điểm 2,5 yard (1 yard = 0.914 mét) kể từ vạch gôn. Đội đó sẽ chọn giữa dẫn bóng lên hoặc chuyền bóng đến khu vực cuối sân để lấy thêm 2 điểm nữa, hoặc thử một chiến lược ít rủi ro hơn bằng việc tâng bóng qua cột gôn để lấy thêm 1 điểm.
Osborne chọn cách an toàn hơn và Nebraska đã thành công khi tâng bóng để lấy thêm một điểm. Bây giờ tỷ số là 31- 24. Các cầu thủ Cornhuskers tiếp tục phản công. Chỉ trong vài phút họ đã lấy thêm điểm từ cú đập và đưa tỷ số lên 31-30. Chỉ còn 1 điểm nữa là hòa và họ sẽ giành danh hiệu vô địch chung cuộc. Tuy nhiên đó sẽ là một thắng lợi không mấy hài lòng. Để thắng giải đấu một cách oanh liệt, Osborne nghĩ rằng ông ta phải thắng trận này.
Đội Cornhuskers quyết tâm chiến thắng bằng cách cố ghi thêm một bàn 2 điểm. Irving Fryer nhận được bóng nhưng không ghi được điểm. Miami và Nebraska như vậy là đã kết thúc giải năm đó với điểm số bằng nhau. Nhưng bởi vì Miami thắng Nebraska trong trận chung kết nên họ đã nhận chức vô địch chung cuộc.
Ở địa vị của Osborne, liệu bạn có thể làm tốt hơn như thế không?
THẢO LUẬN
Nhiều người sau đó đã chỉ trích Osborne để thua do đã cố giành một trận thắng thay vì chỉ cần thủ hòa. Tuy nhiên, chúng tôi không cho đây là nguyên nhân. Osborne sẵn sàng liều thêm nữa để thắng nhưng cách làm của ông ta là sai. Tốt hơn là Osborne cố gắng lấy được một cú bóng 2 điểm trước, sau đó nếu thành công sẽ làm cú bóng một điểm, còn nếu thất bại thì lần thứ hai sẽ lại cố để lấy 2 điểm.
Hãy xem xét vấn đề này một cách kỹ hơn. Khi bị dẫn trước đến 14 điểm, ông ta đã biết rằng cần phải có hai cú bóng đập10 và thêm 3 điểm nữa mới thắng. Nhưng ông ta đã chọn cú bóng 1 điểm trước rồi mới đến cú bóng 2 điểm. Nếu cả hai nỗ lực này đều thành công thì thứ tự không quan trọng. Nếu cú bóng 1 điểm thất bại còn cú bóng 2 điểm thành công thì thứ tự cũng không quan trọng và trận đấu sẽ có kết thúc hòa, chung cuộc Nebraska sẽ giành cúp vô địch. Sự khác nhau duy nhất xảy ra nếu Nebraska chơi hỏng cú bóng 2 điểm. Theo kế hoạch của Osborne thì điều này dẫn đến kết quả thua trận và mất luôn cả danh hiệu vô địch. Nếu họ cố gắng có được cú bóng 2 điểm trước thì giả sử có không thành công cũng chưa chắc đã dẫn tới thua. Kết quả khi đó sẽ là 31-23. Khi họ ăn điểm cú bóng đập tiếp theo, tỷ số sẽ là 31-29. Chỉ cần một lần ném bóng 2 điểm thành công nữa là đủ để có một trận hòa và thắng chung cuộc.
10 Mỗi cú bóng đập được 6 điểm - ND.
Chúng ta đã nghe lập luận chống lại rằng nếu Osborne trước hết cố giành 2 điểm và thất bại, đội của ông sẽ chơi để hòa. Điều này có lẽ mang lại ít cảm hứng cho đội bóng hơn và có lẽ họ sẽ không thể ghi điểm bằng cú đập thứ hai nữa. Hơn thế nữa, bằng việc chờ đến cuối trận và cố gắng liều lĩnh một cách tuyệt vọng để ghi được bàn thắng hai điểm, đội của ông ta sẽ rơi vào tình huống biết rằng mọi thứ đều đang mập mờ. Lập luận này sai ở một vài chỗ. Hãy nhớ rằng nếu Nebraska chờ cho đến cú bóng đập thứ hai rồi sau đó để mất cơ hội với hai điểm thì họ sẽ thua. Nếu họ để mất cơ hội này khi thử lần đầu tiên thì vẫn còn có cơ may hòa. Ngay cả khi cơ hội còn rất ít thì vẫn còn hơn là không. Lập luận về lấy đà cũng có kẽ hở. Trong khi những cầu thủ tấn công của Nebraska có thể có khả năng ứng phó với tình hình trong trận đấu cuối cùng giành chức vô địch, chúng ta phải trù tính rằng hậu vệ của Hurricane cũng làm được như vậy. Cuộc chơi là ngang ngửa đối với cả hai bên. Trong chừng mực mà ở đó có tác động của đà, nếu Osborne theo đuổi cú bóng ghi 2 điểm sau cú đập đầu tiên, điều này sẽ làm tăng cơ hội ghi được điểm ở cú đập bóng thứ hai. Nó cũng cho phép ông ta thủ hòa với hai bàn ghi điểm trên sân.
Một trong số những bài học rút ra ở câu chuyện này là nếu bạn phải chấp nhận rủi ro, thường thì hãy cố làm điều đó càng nhanh càng tốt. Điều này là rất rõ đối với những người chơi quần vợt: Ai cũng biết phải liều ở lần giao bóng đầu tiên và cẩn thận hơn trong lần thứ hai. Bằng cách đó nếu bạn thất bại ở lần thử đầu tiên thì trò chơi cũng còn chưa kết thúc. Bạn vẫn còn thời gian để chọn một cách khác có thể mang bạn về lại vị trí ban đầu hoặc thậm chí có thể làm khá hơn thế.