Tại giải thi đấu vô địch bóng chày Liên đoàn quốc gia năm 1986, đội Mets của New York đã thắng trận đấu quan trọng với Astros của Houston khi Len Dykstra đỡ trúng cú ném bóng thứ hai của Dave Smith ở hiệp đấu thứ chín. Hai người chơi sau đó đã trao đổi lại về những gì đã xảy ra1. Dykstra nói: “Anh ấy ném nhanh cho tôi trong lần đầu tiên và tôi đã đỡ trượt. Tôi có linh cảm là anh ấy sẽ ném bổng sau đó và đúng là anh ấy đã làm như vậy. Tôi đỡ cú ném bóng chính xác và ghi điểm”. Còn theo Smith thì “Nói ngắn gọn thì đây là một lựa chọn tồi”. Nói như vậy anh ta có ý rằng Dykstra đoán như vậy bởi vì cú đầu tiên là bóng nhanh nên Smith sẽ thay đổi tốc độ. “Nếu tôi được làm lại điều đó một lần nữa, đó sẽ là một cú ném nhanh nữa.”
1 New York Times, 12/10/1986, trang 5.1-2.
Liệu lần sau khi tình huống tương tự nảy sinh Smith có nên áp dụng chiến lược ném nhanh nữa không? Tất nhiên là không. Người đập bóng có thể nhìn xuyên qua được bước suy nghĩ này của Smith và sẽ trù tính cho một cú ném nhanh. Nhưng khi đó Smith cần phải chuyển sang bước suy nghĩ tiếp theo để ném bổng và cứ tiếp tục như vậy. Không có điểm dừng xác định nào cho quá trình này. Người đập có thể nhìn xuyên qua và khai thác bất kỳ một suy nghĩ và hành động có hệ thống nào của người ném bóng và ngược lại. Chỉ có một cách khôn ngoan đối với cả hai bên là hành động một cách bất đoán2.
2 Để không thể đoán được, người ném bóng phải biết lựa chọn ngẫu nhiên giữa các cú ném chính xác. Anh ta không nên cố tình ném trượt. Một cú ném không chính xác là không thể đoán trước bởi chính anh ta cũng không biết được quả bóng sẽ đi đâu. Nếu không có sự chính xác thì không có sự kiểm soát về vị trí và mức thường xuyên tương đối của các cú ném khác nhau. Ví dụ rõ nhất về cú ném chính xác nhưng bất đoán là cú ném gấp khúc. Bởi quả bóng rất khó xoáy, các chỗ ngoặt sẽ dẫn đến những chuyển động bất ngờ trong không khí và không ai có thể dự đoán được kết cục - nhưng cũng có rất ít người có thể ném tốt cú ném kiểu này.
Trong những tình huống này, một lỗi cổ điển trong tư duy chiến lược là tin rằng bạn có thể đoán trước bước đi của đối thủ đơn giản bằng cách đặt mình vào địa vị của anh ta. Chúng ta có thể thấy lỗi này trong cuốn sách Mùa hè năm 1949 của David Halberstam khi ông mô tả hành vi nhận thức chiến lược của cậu bé mười bảy tuổi Ted Williams3.
3 David Halberstam, Mùa hè năm 1949 (New York: Morrow, 1989).
Giống như rất nhiều các cậu bé chơi bóng khác, Williams có vấn đề với các cú ném bóng. Cậu không bao giờ sẵn sàng với chúng. Một lần người ném bóng đã gạt cậu ra ngoài bằng cú ném hình vòng cung. Williams tức giận với chính mình, cậu bỏ về chỗ ngồi của mình bên ngoài sân. Một trong số những tay ném bóng đội San Diego, một cựu đội trưởng hét to lên với cậu: “Ê cậu bé, cậu thua vì cái gì vậy?”; “À, cú ném chậm hình vòng cung chết tiệt” - Williams trả lời. “Thế cậu có đập được quả ném nhanh của hắn không?”; “Chắc chắn là được” - Williams trả lời. “Cậu nghĩ lần sau hắn sẽ làm gì với cậu?” - Tay ném bóng hỏi. Ngừng một lát. Ted Williams chưa bao giờ nghĩ đến chuyện ném bóng cho Ted Williams, đó là điều mà những người ném bóng phải làm. “Một cú ném hình vòng cung”, cậu trả lời. “Ê cậu bé”, tay ném bóng nói, “Tại sao cậu không ra đó và chờ cú ném đó lần sau?”.
Williams đã làm như vậy và đánh trúng quả bóng trên đường chạy về. Và 25 năm nghiên cứu về tư duy của người ném bóng đã bắt đầu như thế.
Rõ ràng là người ném bóng đã không học được sự cần thiết phải hành động theo một cách không thể đoán trước. Nhưng cả Williams cũng vậy, bởi vì nếu người ném nghĩ đến chuyện phải ném bóng cho Williams như thế nào thì cậu sẽ không ném bóng hình vòng cung khi cậu nhận ra rằng Williams đã dự tính đúng như vậy! Chương này sẽ cho thấy cần phải tính toán như thế nào khi cả hai bên đều cố gắng tỏ ra khôn ngoan hơn đối phương. Mặc dù bạn không thể đoán đúng trong mọi trường hợp, ít nhất bạn cũng có thể nhận ra được sự thiên lệch giữa các lựa chọn.
Biết tính toán và đáp trả một cách chính xác tính bất đoán còn hữu ích trong nhiều tình huống khác bên ngoài sân bóng. Tính bất đoán là yếu tố quan trọng của chiến lược trong bất kỳ lúc nào khi một bên muốn có sự trùng hợp của các hành động, trong khi bên kia cố tránh điều đó. Cơ quan kiểm toán thuế muốn kiểm tra đúng những người trốn thuế trong khi những người gian lận thuế luôn hy vọng sẽ tránh được kiểm toán. Giữa trẻ con với nhau, đứa lớn luôn muốn tránh đứa nhỏ lẽo đẽo bám theo trong khi đứa nhỏ luôn tìm cách đi theo từng bước của anh chị nó. Một đội quân xâm lược muốn có được một sự bất ngờ mưu lược khi chọn địa điểm tấn công; trong khi đội quân phòng thủ muốn tập trung lực lượng vào đúng nơi mà cuộc tấn công xảy ra.
Những người trang trí nội thất cho các câu lạc bộ đêm, các nhà hàng, tiệm may quần áo và gian trưng bày nghệ thuật đều muốn có sự độc đáo. Quần chúng lại muốn bắt chước những người khởi xướng ra mốt. Cuối cùng thì người ta cũng tìm đến đúng chỗ. Nhưng trước đó mọi người đã đi khắp cả những nơi khác rồi. Điều này giải thích tại sao đời sống của các câu lạc bộ đêm thường rất ngắn. Một khi nó thành công, sẽ có rất nhiều người muốn đến đó. Điều này khiến những người đi tiên phong về mốt bỏ đi và bắt đầu một cái gì đó mới ở nơi khác. Như Yogi Berra nói, “Chỗ này đông quá, rồi sẽ chẳng còn ai đến đây nữa”.
Trong khi lựa chọn cú ném của người chơi bóng chày hay lựa chọn người để kiểm tra của Cơ quan Kiểm toán thuế trong mọi trường hợp là không thể đoán trước, có một số quy tắc điều khiển sự lựa chọn này. Mức độ của sự bất đoán không nên để hoàn toàn ngẫu nhiên. Trên thực tế sự thiên lệch khi chọn cú ném kiểu này nhiều hơn so với kiểu khác hay chọn người để kiểm toán có thể được xác định một cách chính xác từ những chi tiết cụ thể của trò chơi. “Mặc dù nghe có vẻ là một sự điên rồ nhưng đúng là có một cách để làm như vậy”. Chúng tôi sẽ giải thích phương pháp này ở đây.
1. Làm chẵn số lẻ như thế nào?
Nhiều người trong số các bạn hẳn còn nhớ một trò chơi từ hồi đi học gọi là “oẳn tù tì” hoặc “khớp ngón tay”. Trong cuộc thi này, một người chơi sẽ chọn chẵn và người chơi kia sẽ là lẻ. Khi đếm từ một đến ba (hoặc oẳn tù tì), cả hai người sẽ đồng thời xòe một hoặc hai ngón tay ra. Nếu tổng số ngón tay của cả hai người chìa ra là chẵn thì người chọn chẵn sẽ thắng. Còn khi tổng số ngón tay là lẻ thì người chơi lẻ sẽ thắng. Giả sử người thua phải trả cho người thắng 1 đô la. Chúng ta có thể lập bảng thắng thua tương quan với các lựa chọn chiến lược như sau:
Sẽ không có điểm cân bằng trong trò chơi này nếu hai người chơi không hành động một cách ngẫu nhiên. Hãy hình dung rằng bên lẻ lúc nào cũng chắc chắn chỉ chơi với một ngón tay. Bên chẵn khi đó cũng sẽ luôn chỉ ra một ngón tay.
Bây giờ ta lật ngược lại logic. Bởi vì người chọn số lẻ biết chắc rằng đối phương luôn xòe ra một ngón tay nên anh ta sẽ chọn xòe ra hai ngón tay. Điều này dẫn đến là người chọn số chẵn đáp lại bằng cách cũng ra hai ngón. Trong trường hợp này, người lẻ lại ra một ngón. Chúng ta quay trở lại chỗ chúng ta bắt đầu và ở đây không có điểm nào để kết thúc cho suy luận vòng tròn như thế này.
Một cách dễ dàng để kiểm tra xem có cần sự ngẫu nhiên không là xem liệu có hại gì không khi để cho đối phương nhìn thấy bước đi của bạn trước khi anh ta đi bước trả lời. Khi cần có tính bất đoán thì đi trước sẽ là bất lợi. Hãy nghĩ xem điều gì sẽ xảy ra trong trò chơi oẳn tù tì nếu bạn phải đi trước: Bạn sẽ cầm chắc thua.
Không phải bất kỳ sự ngẫu nhiên nào cũng như nhau. Giả sử bên lẻ chọn xòe một ngón tay trong 75% thời gian và hai ngón tay trong 25% thời gian còn lại. Khi đó bên chẵn bằng cách luôn đưa ra một ngón tay có thể thắng trong 75% thời gian và trung bình sẽ nhận được 0.75x1+0.25x(-1) = 0.5 đô la sau mỗi cuộc chơi. Tương tự nếu chọn hai bên chẵn sẽ mất trung bình 0.5 đô la cho mỗi lần chơi. Do vậy bên chẵn sẽ chọn một. Nhưng khi đó bên lẻ lại chọn hai chứ không theo tỷ lệ 75:25 nữa. Tỷ lệ hỗn hợp trên sẽ không còn trụ được cho đến những vòng suy luận sau về chiến lược của bên đối phương nữa.
Nói cách khác, có một mô hình cân bằng của sự ngẫu nhiên và nó cần phải được tính toán ra. Trong ví dụ này, toàn bộ tình huống là đối xứng nên tỷ lệ cân bằng cần phải là 50:50 đối với mỗi người chơi. Chúng ta sẽ thử như sau. Nếu bên lẻ chọn một và hai thường xuyên như nhau thì bên chẵn sẽ thắng 0.5x1+0.5x(-1) = 0 trung bình mỗi trận, dù anh ta chơi 1 hay 2. Do đó anh ta cũng sẽ thắng 0 đô la nếu anh ta chọn tỷ lệ lựa chọn 50:50. Lập luận này ngược lại cũng đúng. Như vậy là tỷ lệ lựa chọn 50:50 là câu trả lời tối ưu của những người chơi đối với nhau, nghĩa là đó là điểm cân bằng. Tên gọi của giải pháp này là điểm cân bằng “chiến lược hỗn hợp”, phản ánh sự cần thiết pha trộn các nước đi của những người chơi theo một cách ngẫu nhiên.
Tỷ lệ hỗn hợp cân bằng trong những tình huống tổng quát không hiển nhiên là cân xứng tuyệt đối như vậy, Tuy nhiên, vẫn có một số quy tắc đơn giản để tính được tỷ lệ đó. Chúng tôi sẽ phát triển các quy tắc này thông qua trò chơi quần vợt.
2. Ai muốn chơi quần vợt?
Một trong những bài học chiến lược đầu tiên của quần vợt là không cho thấy rõ hướng đón bóng cho đến phần giây cuối cùng có thể. Bằng không, đối phương sẽ khai thác sự phán đoán của bạn và đánh bóng theo hướng khác. Nhưng ngay cả khi không thể quan sát được bước đi của đối phương thì việc dự đoán bước đi đó cũng mang lại một lợi thế lớn. Nếu người giao bóng luôn luôn đánh bóng bên trái thì người đỡ bóng sẽ chuẩn bị sẵn để di chuyển sang hướng đó và sẽ đỡ quả giao bóng hiệu quả hơn. Người giao bóng do vậy cố gắng trở nên bất đoán để không cho đối phương đoán được mục tiêu của mình lần thứ hai. Ngược lại, người đỡ bóng không nên ưu tiên cho bất kỳ bên nào khi đi bước đầu tiên của mình. Không giống trò chơi khớp ngón tay, những người chơi không thể coi tính bất đoán chẵn lẻ như nhau. Những người chơi có thể cải thiện kết quả của mình bằng cách chơi nhiều hơn ở một bên một cách có hệ thống, mặc dù vẫn theo cách không thể dự đoán trước.
Để cụ thể hơn, hãy hình dung một cặp đấu với những kỹ năng xác định. Người đỡ bóng chơi vợt bên phải có vẻ khá hơn. Nếu anh ta đoán đúng hướng bóng, khả năng vợt phải của anh ta có thể thành công đến 90%, trong khi khả năng vợt trái nếu đoán đúng chỉ thành công 60%. Tất nhiên người đỡ bóng sẽ còn khó khăn hơn nếu dự đoán sai hướng bóng. Nếu anh ta định đỡ bóng bên trái trong khi người giao bóng đánh sang phải thì khả năng kịp chuyển hướng và đỡ thành công chỉ là 30%. Nếu theo hướng ngược lại, cơ hội của anh ta chỉ còn 20%. Chúng ta có thể biểu diễn tất cả qua bảng dưới đây:
Người giao bóng muốn giữ cho tỷ lệ cú đỡ thành công càng thấp càng tốt; người đỡ bóng thì muốn điều hoàn toàn ngược lại. Trước trận đấu, hai bên đã chọn kế hoạch chơi cho mình. Đâu sẽ là chiến lược tối ưu cho mỗi bên?
Nếu người giao bóng luôn hướng các cú bóng của mình sang phải, người đỡ bóng sẽ chuẩn bị sẵn để thuận tay vợt bên đó và đỡ thành công 90%. Còn nếu người giao bóng luôn đánh sang trái, người đỡ bóng cũng sẽ chuẩn bị đợi bên tương ứng và sẽ đỡ thành công 60% cú giao bóng.
Chỉ có thể bằng cách đánh hỗn hợp hướng bóng người giao bóng mới có thể giảm bớt tính hiệu quả của người đỡ bóng. Anh ta để cho người đỡ bóng phải đoán và do vậy sẽ không thể lợi dụng ưu thế bằng cách đứng đúng tư thế thích hợp từ trước.
Giả sử rằng người giao bóng búng đồng xu trước mỗi lần giao bóng và sẽ hướng bóng sang bên trái hay bên phải tùy theo đồng xu lật sấp hay lật ngửa. Bây giờ hãy xem điều gì xảy ra khi người đỡ bóng di chuyển đến vị trí bên phải. Dự đoán này sẽ chỉ đúng trong một nửa thời gian. Khi đoán đúng, khả năng đỡ thành công là 90% trong khi nếu đoán sai, tỷ lệ thành công rớt xuống chỉ còn 20%. Tỷ lệ thành công chung của anh ta là (1/2)90% + (1/2)20% = 55%. Lập luận tương tự, một bước sang bên trái dẫn đến tỷ lệ thành công chung cuộc của anh ta là (1/2)60% + (1/2)30% = 45%.
Với quy tắc tỷ lệ hỗn hợp 50:50 của người giao bóng, người đỡ bóng chọn cách tốt nhất từ phía mình. Anh ta cần phải di chuyển sang phải và tỷ lệ phần trăm đỡ bóng thành công là 55%. Đối với người giao bóng đó cũng đã là một tiến bộ so với kết quả anh ta có được khi chỉ luôn chơi về một bên. Để so sánh, chúng ta hãy nhớ lại tỷ lệ thành công tương ứng của người đỡ bóng là 90% hoặc 60% khi người giao bóng chỉ luôn nhằm vào bên phải hoặc bên trái.
Câu hỏi hiển nhiên tiếp theo sẽ là vậy thì tỷ lệ hỗn hợp nào sẽ là tối ưu đối với người giao bóng? Để trả lời, chúng ta sẽ thể hiện kết quả mà các tỷ lệ chơi hỗn hợp khác nhau mang lại trong bảng dưới đây. Tỷ lệ thời gian người giao bóng nhằm sang bên phải được biểu diễn trên đường nằm ngang từ 0 đến 100%. Đối với mỗi tỷ lệ hỗn hợp, một trong hai đường thẳng trên hình vẽ sẽ cho thấy tỷ lệ thành công của người đỡ bóng khi anh ta chuẩn bị di chuyển sang phải; còn đường thẳng kia là tỷ lệ thành công khi anh ta chuẩn bị di chuyển sang bên trái. Chẳng hạn nếu người đỡ bóng chuẩn bị di chuyển sang phải, chiến lược giao bóng 0% bên phải (tức là 100% bên trái) sẽ cho tỷ lệ thành công của người đỡ bóng là 20%, trong khi chiến lược giao bóng 100% bên phải (0% bên trái) sẽ cho phép tỷ lệ thành công tăng lên 90%. Tỷ lệ thành công của người đỡ bóng tăng dần từ điểm đầu đến điểm cuối dọc theo đường thẳng đó.
Hai đường thẳng sẽ cắt nhau tại một điểm chính là nơi người giao bóng chọn đánh bóng sang phải trong 40% thời gian. Về phía trái điểm này, người đỡ bóng sẽ đạt kết quả khá hơn nếu luôn chuẩn bị tư thế cho quả giao bóng sang trái; về phía phải điểm này, anh ta sẽ khá hơn nếu luôn chuẩn bị cho quả giao bóng sang phải4.
4 Chú ý rằng người đỡ bóng sẽ làm tốt hơn nếu tập trung vào bên phải khi tỷ lệ giao bóng sang phía đó lớn hơn 40%, không phải là 50%. Ngay cả khi sự chênh lệch không thiên về bên phải thì các kỹ năng của anh ta cũng không đồng đều. Luôn chuẩn bị đánh sang bên phải là lựa chọn đúng bất kể khi nào sự thiên lệch là lớn hơn 40%.
Tỷ lệ hỗn hợp 40:60 giữa bên phải và bên trái là tỷ lệ duy nhất mà người đỡ bóng không thể khai thác để giành lợi thế về mình theo cách này. Chỉ có trong trường hợp giao bóng với tỷ lệ hỗn hợp này người đỡ bóng mới luôn có kết quả như nhau bất kể lựa chọn của anh ta là trái hay phải. Cả hai lựa chọn này đều mang lại cho anh ta một tỷ lệ thành công là 48%. Bất kỳ tỷ lệ hỗn hợp nào khác, nếu được khai thác đúng, sẽ cho người đỡ bóng một tỷ lệ thành công nằm ở các phần đường thẳng phía trên của cả hai đường và do đó đều lớn hơn 48%. Như vậy tỷ lệ hỗn hợp với 40% giao bóng sang phải sẽ là lựa chọn tối ưu đối với người giao bóng.
Tỷ lệ hỗn hợp chính xác giữa các lựa chọn phụ thuộc vào kết quả của bốn kết hợp các cặp hành động cơ bản. Đối với những người chơi có những thế mạnh tuyệt đối và tương đối khác nhau, các con số (ở đây là 90, 60, 30 và 20) sẽ là khác nhau và do đó các tỷ lệ hỗn hợp tối ưu để áp dụng cũng khác. Chúng ta sắp thấy một số kết quả rất đáng ngạc nhiên khi làm những thay đổi như vậy. Điều mấu chốt ở đây đơn giản là bạn sẽ phải tìm ra được tỷ lệ hỗn hợp tối ưu cho mình bằng cách đánh giá bốn kết quả cơ sở cho trò chơi thực tế mà bạn đang chơi.
Có một cách đi tắt: bạn có thể tính được chiến lược cân bằng mà không cần phải vẽ sơ đồ như trên. Phương pháp số học đơn giản này là của J.D. Williams5.
5 Chúng ta có thể dùng một chút đại số để khẳng định lại kết quả trên. Nếu bảng kết quả thu hoạch của người chơi Cột giống bảng dưới đây thì tỷ lệ cân bằng của Trái so với Phải sẽ là (D-B)/(A-C). Cột chọn xác suất p để chơi Trái sao cho Hàng sẽ bàng quan giữa chơi Trên và Dưới. pA+(1-p)B = pC+(1-p)D suy ra p/(1-p) = (D-B)/(A-C) như đã nói. Bởi thu hoạch của người chơi Hàng bằng thu hoạch của người chơi Cột nhưng ngược dấu, tỷ lệ hỗn hợp giữa Trên và Dưới sẽ là (D-C)/(A-B).
Quay trở lại với bảng kết quả cơ sở. Đối với người giao bóng, lấy mục tiêu của anh ta là chiến lược đánh bên phải và tìm sự khác nhau giữa kết quả thu được đối với hai lựa chọn của người đỡ bóng; chúng ta có 90 - 30 = 60. Cũng làm như thế cho chiến lược đánh bên trái: 60 - 20 = 40. Các con số theo thứ tự ngược lại chính là tỷ lệ tối ưu cho áp dụng hỗn hợp giữa hai chiến lược6.
6 Chiến lược gia hoàn hảo, bản sửa đổi (New York: McGraw-Hill, 1966).
Do vậy người giao bóng sẽ phải nhằm sang phải hoặc sang trái theo tỷ lệ 40:60.
Bây giờ hãy xem xét cũng trò chơi đó nhưng trên quan điểm của người đỡ bóng. Hình dưới đây là bảng các kết quả thu được trên cơ sở lựa chọn của người đỡ bóng.
Nếu quả giao bóng bay về hướng trái của anh ta thì việc di chuyển sang trái sẽ cho cơ hội đánh trả thành công đến 60% trong khi di chuyển sang phải chỉ cho cơ hội thành công 20% mà thôi. Chúng ta sẽ thay đổi tỷ lệ di chuyển sang phải từ 0% đến 100% trên một đường thẳng giữa hai điểm này. Tương tự chúng ta sẽ có đường thẳng cao dần từ điểm 30 đến điểm 90 khi người giao bóng nhằm đánh sang bên phải. Hai đường này gặp nhau ở một điểm chính là khi người đỡ bóng di chuyển sang hướng phải 30% thời gian và tỷ lệ thành công của anh ta luôn là 48% bất kể người giao bóng đánh về bên nào.
Một cách khác chúng ta có thể áp dụng phương pháp Williams. Lập bảng tương tự như trên, chúng ta có được hiệu số giữa các kết quả của hai lựa chọn của người đỡ bóng. Đối với bước di chuyển sang phải chúng ta có 90 - 20 = 70; đối với bước di chuyển sang trái, 60 - 30 = 30. Tỷ lệ hỗn hợp tối ưu sẽ theo thứ tự ngược lại: 30% thời gian hãy chuẩn bị đánh sang phải, 70% kia là sang trái.
Bạn có thể đã nhận thấy một đặc điểm thú vị của những tỷ lệ hỗn hợp được tính toán trên các quan điểm riêng rẽ của hai người chơi. Cả hai đều cho một tỷ lệ thành công như nhau là 48%. Sử dụng tỷ lệ hỗn hợp tốt nhất của mình, người đỡ bóng có thể thắng người giao bóng với một tỷ lệ đúng bằng tỷ lệ thắng đạt được nếu người giao bóng cũng sử dụng tỷ lệ hỗn hợp tối ưu của mình. Đây không phải là sự trùng hợp mà là đặc tính chung của tất cả các trò chơi với hai người chơi có lợi ích tuyệt đối ngược nhau.
Kết quả này, được gọi là định lý tối thiểu - tối đa (min- max) do các nhà toán học trước đây của trường Princeton là John von Neumann và Oscar Morgenstern đưa ra. Định lý này nói rằng trong các trò chơi có tổng lợi ích bằng 0, trong đó lợi ích của những người chơi là hoàn toàn đối lập (nghĩa là một bên thắng, bên kia thua), một người chơi sẽ phải cố gắng tối thiểu hóa mức thu hoạch tối đa của đối phương trong khi đối phương cố gắng tối đa hóa mức thu hoạch tối thiểu của mình. Khi họ làm như vậy kết quả thu được là đáng ngạc nhiên ở chỗ tối thiểu của thu hoạch tối đa (min-max) sẽ đúng bằng tối đa của thu hoạch tối thiểu (max-min). Không bên nào có thể cải thiện hơn vị thế của mình và do vậy các chiến lược này đã hình thành điểm cân bằng của trò chơi.
Chúng ta dùng quần vợt để minh họa lập luận khi mỗi người chơi chỉ có hai chiến lược lựa chọn. Nếu người giao bóng tìm cách tối thiểu hóa tỷ lệ thành công tối đa của người đỡ bóng, anh ta cần phải hành động như thể người đỡ bóng đã đoán đúng chiến lược hỗn hợp của anh ta và đáp trả theo cách tối ưu của mình. Nghĩa là tỷ lệ thành công của người đỡ bóng sẽ là tối đa của hai đường thẳng ở hình dưới. Tối thiểu của tối đa sẽ xảy ra ở chính nơi hai đường thẳng giao nhau, đó chính là tỷ lệ 48%.
Tiếp theo chúng ta sẽ xem xét vấn đề từ phía người đỡ bóng; anh ta đang cố gắng tối đa hóa thu hoạch tối thiểu của mình. Nếu người đỡ bóng di chuyển sang phải và sang trái với mức độ thường xuyên như nhau thì đường biểu diễn thu hoạch của anh ta sẽ là mức trung bình cộng của hai đường thẳng ban đầu, được vẽ bằng đường chấm trong hình vẽ bên dưới. Bởi vì đường này có hướng đi lên nên điểm tối thiểu của nó sẽ nằm bên trái, tại điểm có tỷ lệ thành công là 40%. Không quan trọng là người đỡ bóng áp dụng tỷ lệ hỗn hợp nào, đường thẳng này sẽ luôn đi qua điểm 48% bởi vì người giao bóng đã lựa chọn áp dụng tỷ lệ hỗn hợp 40:60. Chỉ cần đường thẳng là nghiêng, một trong hai đầu của đường thẳng sẽ rơi xuống dưới 48%. Chỉ khi người đỡ bóng áp dụng tỷ lệ hỗn hợp 30:70 thì đường thẳng mới nằm ngang hoàn toàn và mức tối thiểu lúc này là 48%. Do vậy, tối thiểu của tối đa đúng bằng tối đa của tối thiểu - 48%.
Chứng minh tổng quát của định lý min max là khá phức tạp, nhưng kết luận của nó thì rất hữu ích và đáng để bạn ghi nhớ. Nếu tất cả những gì bạn muốn biết là thắng của một bên hoặc thua của bên kia khi hai người cùng chơi với các chiến lược hỗn hợp tối ưu của mình, bạn chỉ cần tính toán tỷ lệ hỗn hợp tối ưu cho một người và sẽ xác định được kết quả.
Các công cụ khác của chúng tôi, phương pháp của Williams và các đồ thị này có thể áp dụng cho bất kỳ trò chơi nào có tổng lợi ích bằng 0 với hai người chơi và mỗi người có hai lựa chọn chiến lược. Tuy nhiên, nó không thể áp dụng cho các trò chơi khác có tổng lợi ích khác không hoặc có nhiều hơn hai người chơi, hay mỗi người chơi có nhiều hơn hai lựa chọn chiến lược. Các nhà kinh tế học và toán học đã phát triển những kỹ thuật tổng quát hơn, thí dụ như lập trình tuyến tính để giải ra các chiến lược cân bằng thậm chí cho cả những trò chơi có tổng lợi ích bằng 0 phức tạp nhất.
Mặc dù các kỹ thuật này nằm ngoài phạm vi cuốn sách của chúng tôi nhưng chúng ta vẫn có thể sử dụng các kết quả của chúng.
Một đặc điểm chung của tất cả các điểm cân bằng trong chiến lược hỗn hợp là mỗi người chơi đều không quan tâm đến chiến lược anh ta sử dụng trong tình huống cân bằng. Khi cần phải chơi hỗn hợp, cách để tìm ra tỷ lệ hỗn hợp cân bằng cho bạn chính là hành động sao cho những người khác không cần quan tâm đến hành động của mình. Mặc dù điều này nghe có vẻ hơi ngược đời, nó rất phù hợp với động cơ để ngẫu nhiên hóa trong trò chơi có tổng lợi ích bằng 0: Bạn muốn ngăn cản những người khác khai thác bất kỳ một hành vi có hệ thống nào của mình. Nếu họ thiên về một hành động cụ thể nào đó thì điều đó chỉ có nghĩa là họ đã chọn cách chơi tồi nhất trên quan điểm của bạn.
Tại điểm này chúng tôi đã giải thích các lợi thế, thậm chí là sự cần thiết mang tính chiến lược của việc áp dụng các chiến lược hỗn hợp và ngẫu nhiên. Ý tưởng cơ bản ở đây là người ta thường viện đến ngẫu nhiên như một công cụ để khiến đối thủ của bạn không khai thác được bất kỳ hành vi có hệ thống nào của bạn. Chuyển ý tưởng này thành thực tiễn khó hơn đôi chút. Năm phần sau đây sẽ giống như một cuốn cẩm nang hướng dẫn nhỏ cho bạn khi sử dụng các chiến lược hỗn hợp.
3. Vì sao bạn cần chọn tỷ lệ hỗn hợp đúng?
Nếu biết được rằng một người chơi đang theo đuổi một cách đi khác - không phải chiến lược hỗn hợp ngẫu nhiên cân bằng, người chơi kia có thể khai thác điều này sao cho có lợi hơn cho mình. Trong ví dụ về quần vợt, người đỡ bóng có thể đạt được tỷ lệ thành công 48% khi người giao bóng đi theo chiến lược cân bằng với tỷ lệ hỗn hợp là 40% sang phải và 60% sang trái. Người đỡ bóng sẽ giành kết quả tốt hơn nếu người giao bóng chơi theo bất kỳ một chiến lược hỗn hợp nào khác. Chẳng hạn nếu người giao bóng ngờ nghệch kia chỉ nhằm vào bên trái là bên yếu hơn của người đỡ bóng thì người đỡ bóng có thể đón sẵn ở đó và cải thiện tỷ lệ thành công của mình đến 60%. Nói chung, nếu người đỡ bóng đã biết người giao bóng và biết chắc chắn các điểm yếu của anh ta thì người đỡ bóng có thể phản hồi một cách tương ứng. Tuy nhiên, khi đó sẽ luôn có một mối nguy hiểm giống như chú cá mập nuôi trong bể, nghĩa là nếu người giao bóng là một chiến lược gia siêu hạng và anh ta sử dụng những chiến lược tồi trong các trận đầu không quan trọng để gạt người đỡ bóng tập trung vào đối phó theo cách tương ứng, rồi sau đó sẽ khai thác điều này trong những dịp thực sự quan trọng. Một khi người đỡ bóng cố tình đi lệch khỏi tỷ lệ hỗn hợp cân bằng của mình để lợi dụng sự đi lệch của người giao bóng mà anh ta tưởng như vậy, người đỡ bóng sẽ ngay lập tức trở thành đối tượng để người giao bóng khai thác. Sự cố tình chơi không đúng tỷ lệ hỗn hợp của người giao bóng có thể chỉ là một sự bố trí. Chỉ có cách chơi theo đúng tỷ lệ hỗn hợp cân bằng của chính mình mới giúp bạn tránh khỏi nguy hiểm này.
Bản chất của tính ngẫu nhiên cũng quan trọng không kém tỷ lệ hỗn hợp đúng. Nếu người giao bóng áp dụng một hệ thống với bốn lần giao bóng sang phải, sáu lần sang trái, rồi lại bốn lần sang phải và cứ tiếp tục như vậy thì anh ta vẫn đạt được các tỷ lệ hỗn hợp đúng.
Tuy nhiên, đó lại là một hành vi có hệ thống và người đỡ bóng chắc chắn sẽ nhận thấy điều này. Anh ta sẽ đối phó bằng cách di chuyển phù hợp tương ứng và sẽ đạt được tỷ lệ thành công là (4/10)90% + (6/10)60% = 72%. Để tối đa hóa hiệu quả người giao bóng cần phải thực sự bất đoán trong mỗi lần giao bóng. Các ngài Smith và Dykstra trong câu chuyện bóng chày của chúng ta có lẽ đã không nhận ra nguyên tắc này.
4. Vì sao không dựa vào sự ngẫu hứng của người khác?
Nếu một người chơi áp dụng tỷ lệ hỗn hợp tối ưu của mình thì tỷ lệ thành công của anh ta sẽ không đổi bất kể người chơi kia làm gì. Giả sử bạn là người đỡ bóng trong câu chuyện về quần vợt và người giao bóng đang áp dụng tỷ lệ hỗn hợp tối ưu của mình là 40:60. Khi đó bạn sẽ luôn đỡ bóng thành công 48% thời gian dù bạn di chuyển bên phải, bên trái hay theo một tỷ lệ hỗn hợp bất kỳ giữa hai bên. Nhận thấy điều này, bạn có thể muốn giữ cho mình những tính toán về tỷ lệ hỗn hợp tối ưu của bạn, bạn chỉ gắn chặt với một động tác và tin rằng người chơi kia sẽ áp dụng tỷ lệ hỗn hợp tối ưu của anh ta. Vấn đề là ở chỗ người chơi kia không có động cơ áp dụng tỷ lệ hỗn hợp tối ưu của mình trừ khi bạn cũng áp dụng hỗn hợp tối ưu của bạn. Chẳng hạn nếu bạn chỉ chơi bên phải, anh ta sẽ chuyển ngay sang đánh bóng bên trái. Lý do bạn cần phải sử dụng hỗn hợp tối ưu của bạn chính là để người chơi kia cũng phải làm như vậy.
5. Tỷ lệ hỗn hợp tối ưu của bạn
THAY ĐỔI THEO KỸ NĂNG CỦA BẠN NHƯ THẾ NÀO?
Giả sử rằng người đỡ bóng tập luyện để cải thiện kỹ năng đỡ bóng bên trái của mình cho đến khi tỷ lệ thành công bên trái của anh ta tăng từ 60% lên 65%. Chúng ta có thể thay đổi đồ thị mà chúng ta đã dùng trước đây để tính toán tỷ lệ hỗn hợp tối ưu của anh ta. Điều này được thể hiện trên hình vẽ dưới đây. Chúng ta thấy tỷ lệ các bước dịch sang bên phải của người đỡ bóng tăng từ 30% lên 33,3% và về tổng thể tỷ lệ đỡ bóng thành công tăng từ 48 lên 50%.
Một cách đương nhiên tỷ lệ thành công của người đỡ bóng sẽ tăng lên khi kỹ năng chơi của anh ta được cải thiện. Nhưng đáng ngạc nhiên là thành công khi đánh phía bên trái là phía đã được cải thiện lại ít thường xuyên hơn. Trong câu chuyện bàn tay nóng ở Chương 1, chúng tôi đã nói điều này có thể xảy ra. Và bây giờ chúng tôi sẽ giải thích tại sao.
Lý do nằm ở trong tương tác giữa các chiến lược của hai người chơi. Khi người đỡ bóng chơi khá hơn khi đỡ bên trái, người giao bóng sẽ năng chuyển dịch sang bên phải hơn (43% thay vì 40% như trước đây). Để đối phó, người đỡ bóng cũng sẽ di chuyển sang bên phải nhiều hơn. Kỹ năng đánh trái tốt hơn tháo khóa sức mạnh của kỹ năng đánh phải của bạn. Tương tự như vậy đối với Larry Bird, một sự cải thiện khi bắn bằng tay trái sẽ làm thay đổi cách anh ta tự vệ và cho phép anh ta bắn bằng tay phải nhiều hơn.
Một ví dụ khác cho cùng một hiện tượng, giả sử người đỡ bóng rèn luyện để trở nên nhanh nhẹn hơn khiến anh ta có thể quay từ phải sang trái để đỡ bóng một cách chính xác hơn. Tỷ lệ thành công của anh ta ở tình huống này nhờ vậy tăng từ 20% lên 25%. Một lần nữa, tỷ lệ các bước dịch chuyển sang phải sẽ tăng từ 30% lên 31,6% (nếu sử dụng phương pháp Williams, tỷ lệ giữa các bước di chuyển sang phải và bên trái tăng từ 30:70 lên 35:65). Người đỡ bóng sẽ di chuyển sang phải nhiều hơn bởi vì đây là chỗ anh ta có kỹ năng được cải thiện. Để đối phó lại, người giao bóng sẽ giảm bớt lợi điểm của người đỡ bóng bằng cách giao bóng sang bên phải ít đi.
6. Hành động ngẫu hứng như thế nào?
Bạn sẽ làm thế nào nếu người ta bảo bạn chơi pha trộn giữa ném bóng bổng và bóng nhanh một cách tùy hứng nhưng theo tỷ lệ bằng nhau? Có một cách là chọn một con số ngẫu nhiên từ 1 đến 10. Nếu số đó bằng hoặc nhỏ hơn 5, bạn sẽ ném bóng nhanh: Nếu từ 6 trở lên, bạn sẽ ném bóng bổng. Tất nhiên điều này chỉ làm giảm nhẹ một lớp của vấn đề. Vậy thì bạn sẽ làm thế nào để chọn một số ngẫu nhiên từ 1 đến 10?
Hãy bắt đầu với một vấn đề đơn giản hơn là cố gắng ghi lại thứ tự ngẫu nhiên của mặt đồng xu khi bạn tung nó. Nếu thứ tự này là thực sự ngẫu nhiên thì bất kỳ ai cố gắng đoán thứ tự bạn ghi lại cũng chỉ có thể đúng ở mức trung bình không quá 50%. Nhưng ghi lại thứ tự “ngẫu nhiên” như vậy thực ra khó khăn hơn bạn tưởng.
Các nhà tâm lý học phát hiện ra rằng mọi người thường có xu hướng quên mất rằng mặt đồng xu ngửa cũng có khả năng đi sau không kém gì mặt sấp; do vậy họ thường đoán quá nhiều cặp đôi đối nhau liên tục trong khi rất hiếm khi có những dãy đoán toàn ngửa. Nếu một đồng xu tung lên có 30 lần ngửa liên tiếp, lần tiếp theo khả năng lật ngửa vẫn có khả năng xảy ra đúng bằng khả năng lật sấp. Không có cái gì được gọi là “đến lượt” đối với mặt sấp cả. Tương tự như vậy trong quay xổ số, con số của tuần trước vẫn có khả năng thắng tiếp lần sau như tất cả các con số khác. Để tránh đặt ra một thứ tự nào đó vào dãy ngẫu nhiên, bạn cần một cơ chế khách quan hoặc độc lập hơn.
Một trong các mánh khoé ở đây có thể là chọn một quy tắc xác định nào đó nhưng là một quy tắc vừa bí mật, vừa đủ phức tạp để khó có thể phát hiện ra. Ví dụ, hãy nhìn vào độ dài của các câu trong cuốn sách này. Nếu câu gồm có một số lẻ các chữ, gọi đó là ngửa; nếu câu gồm một số chẵn các chữ, gọi đó là sấp. Điều này có thể cho ra một dãy ngẫu nhiên. Nếu chúng ta quay lại đếm 10 câu trước, giả sử chúng ta sẽ có dãy N, S, N, N, N, S, N, S, S, N. Nếu bạn thấy sử dụng cuốn sách này không thuận tiện lắm, đừng lo. Chúng ta luôn luôn mang theo các dãy số với thứ tự ngẫu nhiên bên mình. Chẳng hạn lấy ngày sinh của bạn bè hoặc người thân. Đối với các ngày chẵn, gọi đó là ngửa, nếu là ngày lẻ, gọi đó là sấp. Hoặc xem kim giây trên chiếc đồng hồ đeo tay của bạn. Giả sử chiếc đòng hồ của bạn không thật chính xác, khi đó sẽ không ai khác biết chính xác vị trí hiện tại của chiếc kim giây trên đồng hồ của bạn. Lời khuyên của chúng tôi đối với vận động viên ném bóng phải có tỷ lệ hỗn hợp 50:50 là liếc vào đồng đồ đeo tay của mình ngay trước mỗi lần ném bóng. Nếu kim giây chỉ vào số chẵn thì ném bóng nhanh; nếu số lẻ, ném bóng bổng. Chiếc kim dây có thể sử dụng để đạt được bất kỳ tỷ lệ nào. Để ném bóng nhanh 40% thời gian và bóng bổng 60% thời gian còn lại, chọn bóng nhanh nếu kim giây nằm giữa giây số 1 và 24; còn nếu nằm giữa giây số 25 và 60, hãy ném bóng bổng.
7. Những tình huống duy nhất
Tất cả những lập luận trên đều có ý nghĩa trong các trò chơi như bóng bầu dục, bóng chày hay quần vợt, trong đó các tình huống như nhau phát sinh nhiều lần trong một trận đấu và cũng những người chơi đó đối đầu với nhau hết trận này sang trận khác. Khi đó, họ sẽ đủ có thời gian và cơ hội để quan sát bất kỳ hành vi có hệ thống nào của đối phương và tìm cách đối phó với nó. Tương ứng như vậy, điều quan trọng là bạn cần tránh những khuôn mẫu có thể bị khai thác và luôn gắn chặt vào tỷ lệ hỗn hợp tối ưu. Vậy còn những trò chơi chỉ có một lần chơi duy nhất thì sao?
Hãy xem xét việc lựa chọn địa điểm tấn công và phòng thủ trong một trận chiến đấu. Ở đây, tình huống thường là duy nhất cho nên đối phương không thể suy luận ra bất kỳ một sự có hệ thống nào từ các hành động trước đó của bạn. Tuy nhiên, tình huống cho lựa chọn ngẫu nhiên nảy sinh từ khả năng sử dụng gián điệp. Nếu bạn chọn một cách hành động xác định nào đó, và kẻ thù phát hiện ra bạn đang định làm gì, chúng sẽ chọn cách hành động để gây bất lợi nhất đối với bạn. Bạn muốn làm chúng phải ngạc nhiên; cách chắc chắn nhất để làm điều này là làm ngạc nhiên chính bạn. Bạn cần phải để mở các khả năng cho lựa chọn càng lâu càng tốt và tại thời điểm cuối cùng, bạn sẽ chọn giữa các khả năng bằng một công cụ bất đoán và do đó có thể tránh bị gián điệp phát hiện. Các tỷ lệ tương đối của công cụ cũng cần phải làm sao cho nếu kẻ thù có phát hiện ra, chúng cũng không thể biến thông tin đó thành lợi thế của mình được. Tuy nhiên, đó lại chính là tỷ lệ hỗn hợp tối ưu đã được tính toán trong định nghĩa trên đây.
Cuối cùng là một lời cảnh báo. Ngay cả khi bạn đang sử dụng tỷ lệ hỗn hợp tối ưu của mình, vẫn có những trường hợp bạn rơi vào một kết cục xấu. Ngay cả khi Dave Smith là không thể đoán trước, đôi khi Lenny Dykstra vẫn sẽ đoán đúng và đẩy được bóng ra khỏi sân. Trong chơi bóng, bạn cần chơi theo nhiều kiểu nhưng quan trọng là đôi khi phải đá một quả bóng dài để giữ cho hàng phòng ngự chơi trung thực. Khi quả chuyền bóng thành công, các cổ động viên và những người bình luận thể thao sẽ kinh ngạc trước một cách chơi hết sức khôn khéo của huấn luyện viên và tung hô ông ta như một thiên tài. Nhưng khi thất bại, huấn luyện viên sẽ bị chỉ trích thậm tệ: Làm sao ông ta có thể mạo hiểm với cú chuyền dài như vậy thay vì chơi đa dạng?
Thời điểm để đánh giá chiến lược của huấn luyện viên chính là trước khi sử dụng nó trong bất kỳ tình huống nào. Huấn luyện viên cần phải công khai một thực tế rằng việc trộn lẫn các cách chơi là cần thiết: Chạy chuyền dẫn bóng khắp sân có thể hiệu quả chính bởi vì một số nguồn phòng ngự sẽ bị phân tán để canh các cú dội bom đắt giá đôi khi được thực hiện. Tuy nhiên, chúng tôi ngờ rằng ngay cả khi huấn luyện viên lớn tiếng nói ra thông điệp này trên tất cả các báo và kênh truyền hình trước trận đấu rồi sử dụng những cú dội bom như vậy trong trận đấu và bị thất bại, ông ta vẫn sẽ bị chỉ trích không kém gì so với khi chưa cố gắng giáo dục công chúng về các yếu tố của Lý thuyết trò chơi.
8. Vệ sĩ của những lời nói dối
Nếu bạn đang sử dụng tỷ lệ hỗn hợp tối ưu của mình thì việc người chơi kia có phát hiện ra điều đó không là không quan trọng, chừng nào anh ta chưa tìm ra được hành động cụ thể của bạn được chỉ ra bởi phương tiện ngẫu nhiên của bạn trong trường hợp cụ thể. Anh ta không thể lợi dụng được chiến lược ngẫu nhiên của bạn: Chiến lược cân bằng được lựa chọn để bảo vệ bạn khỏi bị đối thủ khai thác chính bằng cách đó. Tuy nhiên, nếu vì bất kỳ một lý do nào mà bạn không chọn đúng tỷ lệ hỗn hợp tối ưu của mình thì giữ bí mật là điều tối quan trọng. Sự rò rỉ thông tin về điều này sẽ khiến bạn phải trả giá đắt. Cũng vì lẽ đó, bạn có thể được lợi bằng cách làm cho đối thủ của bạn tin vào cái sai trong kế hoạch của bạn.
Để chuẩn bị cho cuộc đổ bộ vào bờ biển Normandy tháng 6 năm 1944, quân Đồng minh sử dụng nhiều phương tiện để khiến người Đức tin rằng cuộc tấn công sẽ diễn ra ở Calais. Một trong những cách tài tình nhất là biến một tình báo Đức trở thành gián điệp hai mang, nhưng không phải là một gián điệp hai mang bình thường. Người Anh làm mọi điều để chắc chắn người Đức biết rằng tình báo của họ đã bị mua chuộc, dĩ nhiên không để cho người Đức biết họ cố tình làm như vậy. Để xây dựng lòng tin (sự mất lòng tin) rằng tình báo đó là gián điệp hai mang, họ để anh ta chuyển về nhà một số thông tin tệ nhất có thể có. Người Đức thấy những thông tin này hữu ích đơn giản bằng việc suy luận theo hướng ngược lại những gì họ được thông báo. Điều này đã được sắp đặt một cách cố ý. Khi kẻ hai mang kia chuyển về một thông tin thật rằng quân Đồng minh sẽ đổ bộ vào Normandy, người Đức đã lấy đó như một bằng chứng tiếp theo rằng chính Calais đã được chọn làm địa điểm tấn công.
Chiến lược này còn có lợi thế tiếp theo là sau cuộc đổ bộ, người Đức không còn chắc chắn hoàn toàn rằng tình báo của họ là điệp viên hai mang nữa. Anh ta đã lại trở thành một trong số các nguồn thông tin chính xác của họ. Với lòng tin được khôi phục lại, bây giờ người Anh lại có thể gửi những thông tin sai và để người Đức tin vào chúng7.
7 Để biết thêm chi tiết của câu chuyện, xem cuốn Người phục vụ bí mật của Hoàng hậu của Christopher Andrew (New York: Penguin, 1986).
Vấn đề ở câu chuyện này là những người Đức có thể đã dự đoán được chiến lược của người Anh và do đó tính toán rằng có một xác suất nào đó về chuyện tình báo của họ có thể đã bị mua chuộc. Khi chơi các chiến lược hỗn hợp hay ngẫu nhiên, bạn không thể lừa đối phương mọi lúc hoặc bất kỳ thời điểm cụ thể nào. Điều tốt nhất bạn có thể hy vọng là khiến đối thủ phải đoán và lừa được đối thủ vài lần. Về mặt này, khi bạn biết người bạn đang nói chuyện có mong muốn đánh lừa bạn vì lợi ích của anh ta, tốt nhất là bạn nên bỏ qua bất kỳ lời khẳng định nào anh ta đưa ra thay vì chấp nhận nó đúng như nó có hay suy luận rằng ngược lại sẽ chính là sự thật.
Có một câu chuyện giữa hai doanh nhân là đối thủ của nhau và gặp nhau tại một ga tàu ở Vacsava.
“Anh định đi đâu?”, người đàn ông thứ nhất hỏi. “Đến Minsk”, người kia đáp.
“Đến Minsk ư? Anh liều quá đấy! Tôi biết anh nói với tôi rằng anh đi Minsk bởi vì anh muốn tôi tin rằng anh đi Pinsk cơ. Nhưng tôi thì tôi biết rằng anh đúng là đi Minsk thật. Tại sao anh lại nói dối tôi?”8
8 Câu chuyện này lấy từ tác phẩm của Sigmund Freud, Các câu chuyện khôi hài và mối quan hệ giữa chúng với sự vô thức (New York: W. W.Norton, 1963).
Hành động có thể cho thấy rõ hơn lời nói một chút. Khi nhìn thấy cái mà đối thủ của bạn làm, bạn có thể suy đoán xác suất tương đối để có thể xảy ra những gì mà anh ta muốn giấu bạn. Điều rõ ràng từ các ví dụ của chúng tôi là bạn không thể đơn giản nhìn nhận những khẳng định của đối thủ theo bề ngoài của chúng. Nhưng điều đó cũng không có nghĩa là bạn phải bỏ qua những gì anh ta làm khi cố gắng phân tích xem lợi ích thực sự của anh ta nằm ở đâu.
Tỷ lệ đúng để chơi hỗn hợp cân bằng phụ thuộc rất nhiều vào thu hoạch của người chơi. Như vậy, quan sát bước đi của người chơi có thể cho thấy một số thông tin về tỷ lệ hỗn hợp được sử dụng và là một bằng chứng đáng giá để giúp suy đoán thu hoạch của đối phương. Các chiến lược ra bài trong trò bài poker là ví dụ thích hợp nhất ở đây.
Những người chơi bài poker rất quen với việc cần phải pha trộn các cách chơi. John McDonald đưa ra lời khuyên như sau: “Bàn tay poker luôn phải được giấu đằng sau chiếc mặt nạ của sự phi nhất quán. Người chơi poker giỏi cần phải tránh có sẵn những bài chơi và phải hành động ngẫu nhiên, thậm chí đôi khi đến mức vi phạm cả những nguyên tắc sơ đẳng nhất của trò chơi”9. Một người chơi “chặt chẽ” không bao giờ giở ngón lừa sẽ hiếm khi thắng một ván ù lớn; bởi sẽ chẳng có ai theo anh ta. Anh ta có thể thắng nhiều ván nhỏ, nhưng chắc chắn sẽ kết thúc là người thua cuộc. Một người chơi quá “thoáng” thường xuyên giở ngón lừa sẽ luôn bị bắt thóp và cuối cùng cũng sẽ thua. Chiến lược tốt nhất là phối hợp cả hai.
9 John McDonald, Chiến lược trong chơi bài poker, kinh doanh và chiến tranh (New York: W. W.Norton, 1950), trang 30.
Giả sử rằng bạn biết một đối thủ poker thông thường lên bài hai phần ba thời gian và gọi bài một phần ba thời gian còn lại khi anh ta có bộ bài tốt. Còn nếu bài xấu, anh ta sẽ ôm bài 2/3 thời gian và lên bài 1/3 thời gian còn lại (nói chung sẽ là một ý tưởng dở nếu gọi bài khi bạn đang giở ngón lừa bởi vì bạn không chờ đợi một ván thắng). Khi đó ta có thể lập bảng như sau để tính xác suất các hành động.
Trước khi anh ta ra bài, bạn tin rằng cơ hội bài xấu và tốt là như nhau. Bởi vì việc phối hợp các khả năng xảy ra phụ thuộc vào chất lượng bài của anh ta nên bạn có thể có thêm thông tin từ việc ra bài đó. Nếu bạn thấy anh ta “ôm” bài, bạn có thể chắc chắn là bài của anh ta xấu. Nếu anh ta gọi, bạn biết là anh ta đang có bài tốt. Trong cả hai trường hợp này việc đánh cuộc đã xong. Nếu anh ta lên bài thì khả năng anh ta có bài tốt sẽ là 2:1. Việc anh ta ra bài không phải luôn luôn tiết lộ chính xác bài của anh ta nhưng bạn cũng đã biết nhiều hơn so với ban đầu. Sau khi nghe lên bài, bạn tăng khả năng anh ta có bộ bài tốt từ 1/2 lên 2/310.
10 Tính toán xác suất có điều kiện khi người ra bài xướng lên có thể sử dụng một kỹ thuật toán học được gọi là quy tắc Bayes. Xác suất người chơi kia đang có bộ bài tốt trên tay phụ thuộc vào việc nghe thấy người đó xướng “X” chính là cơ hội mà người này vừa có bài tốt và xướng “X” chia cho cơ hội anh ta xướng “X”...
9. Sự bất ngờ
Cho đến giờ, chúng tôi mới chỉ tập trung áp dụng các chiến lược ngẫu nhiên hóa hoàn toàn vào các trò chơi trong đó lợi ích của những người chơi là hoàn toàn đối ngược. Có vẻ đáng ngạc nhiên hơn nếu bạn biết rằng có khả năng tìm thấy điểm cân bằng với những hành vi ngẫu hứng ngay cả khi những người chơi có chung lợi ích. Trong trường hợp này, phối hợp các cách chơi sẽ dẫn đến một kết cục kém hơn cho tất cả các bên. Nhưng nếu chỉ vì kết cục kém hơn cũng chưa có nghĩa là các chiến lược không có điểm cân bằng: điểm cân bằng chỉ là sự mô tả, nó không phải là giải pháp.
Lý do phải phối hợp các bước đi xuất phát từ thất bại trong hợp tác. Vấn đề này chỉ nảy sinh khi không có một điểm cân bằng duy nhất. Chẳng hạn hai người đang gọi điện thì đường dây đột ngột bị gián đoạn; họ không phải lúc nào cũng biết ai sẽ phải gọi lại cho ai. Không có khả năng liên lạc, những người chơi không biết phải chờ đợi điểm cân bằng nào. Theo một nghĩa thoáng hơn thì cân bằng với ngẫu nhiên hóa là cách để chơi một thỏa hiệp giữa những điểm cân bằng được phối kết. Bản chất của sự thỏa hiệp này được minh họa trong ví dụ dưới đây.
Della và Jim là một kiểu cặp đôi mà bạn thường hay thấy trong các truyện hư cấu, chính xác ở đây là truyện Quà tặng của Magi của O’Henry. “Không ai có thể đo được” họ yêu nhau đến mức nào và mỗi người sẵn sàng hy sinh những gì mình có chỉ để có được một món quà Noel cho người kia. Della bán mái tóc của mình để mua cái dây đeo cho chiếc đồng hồ được thừa kế của Jim, còn Jim bán chiếc đồng hồ đó để mua bộ lược gài cho mái tóc xinh đẹp của Della.
Nếu họ biết nhau rõ hơn, họ đã có thể nhận ra khả năng là mỗi người sẽ bán món đồ quý giá của mình đi để mua quà cho người kia và kết quả sẽ là một sai lầm mang tính bi kịch. Della sẽ dừng lại và nghĩ xem liệu có nên cứ giữ mái tóc để chờ món quà của Jim hay không.
Cũng như vậy Jim cần phải nghĩ xem có nên bán chiếc đồng hồ của mình không. Tất nhiên nếu cả hai đều dừng lại và không làm gì cả thì sẽ không ai nhận được quà và đây sẽ là một sai lầm khác.
Câu chuyện này có thể được thể hiện như một trò chơi như sau.
Các chiến lược của đôi vợ chồng tương tác với nhau ngay cả khi các lợi ích của họ là hầu như hoàn toàn trùng nhau. Đối với mỗi người cả hai kiểu sai lầm đều dẫn đến kết cục xấu. Để cụ thể hóa, chúng tôi đặt điểm không (0) cho điều này. Giữa hai kết cục, trong đó một bên trao quà, bên kia nhận món quà đó, giả sử mỗi người đều nghĩ rằng trao quà (2 điểm) tốt hơn là nhận quà (1 điểm).
Tình huống khi Della giữ mái tóc còn Jim bán chiếc đồng hồ của mình là một kết cục cân bằng; chiến lược của mỗi người là câu trả lời tối ưu đối với người kia. Tuy nhiên, tình huống khi Della bán mái tóc, còn Jim giữ lại chiếc đồng hồ cũng là một điểm cân bằng nữa.
Liệu có một thỏa thuận ngầm được hiểu bởi cả hai bên để chọn điểm cân bằng này thay cho điểm cân bằng kia hay không? Sự bất ngờ là một khía cạnh quan trọng của món quà; do vậy họ không thể trao đổi với nhau trước để thiết lập thỏa thuận.
Sự kết hợp có thể giúp giữ lại tính bất ngờ, tất nhiên với một chi phí. Dễ dàng chứng minh được các chiến lược trong đó mỗi bên chọn tặng quà với xác suất 2/3 và nhận quà với xác suất 1/3 cũng tạo thành một điểm cân bằng. Giả sử rằng Della sử dụng chính tỷ lệ này. Nếu Jim bán chiếc đồng hồ của mình, sẽ có 1/3 cơ hội là cô sẽ giữ mái tóc (2 điểm) và 2/3 cơ hội là bán nó (0 điểm). Kết quả trung bình là 2/3 điểm. Tính toán tương tự như vậy cho thấy nếu Jim giữ lại chiếc đồng hồ, kết quả trung bình cũng sẽ là 2/3. Do vậy Jim không có lý do rõ ràng để chọn chiến lược này thay vì chiến lược kia, hoặc thực tế là bất kỳ một sự kết hợp nào giữa chúng. Một lần nữa hãy chú ý rằng việc Della sử dụng tỷ lệ hỗn hợp tối ưu của mình chính là để giữ cho Jim cũng áp dụng tỷ lệ đó của anh ta và ngược lại.
Xác suất sai lầm xảy ra là khá lớn: 4/9 lần đôi vợ chồng thấy rằng mỗi người đã bán cái mà người kia mua quà tặng cho (như trong câu chuyện của O’Henry) và 1/9 lần là chẳng ai nhận được quà tặng. Bởi có những sai lầm như vậy nên điểm trung bình 2/3 ít hơn điểm trong các tình huống cân bằng, trong đó một người tặng và một người nhận (2 điểm cho người tặng và 1 điểm cho người nhận). Điều này không giống như trong trò chơi quần vợt, trong đó mỗi người có thể tăng tỷ lệ thành công lên bằng cách áp dụng tỷ lệ chơi hỗn hợp.
Vì sao có sự khác nhau đó? Quần vợt là trò chơi có tổng lợi ích bằng 0, trong đó các lợi ích của hai bên là hoàn toàn đối lập. Họ sẽ làm tốt hơn khi họ chọn các xác suất hỗn hợp một cách độc lập.
Trong câu chuyện Quà tặng của Magi, mối quan tâm của hai vợ chồng gần như trùng nhau. Do vậy, họ cần phải biết phối hợp các tỷ lệ hỗn hợp của mình. Họ cần tung đồng xu và tùy theo kết quả mà quyết định xem ai tặng và ai nhận. Đôi vợ chồng này thực ra có một chút mâu thuẫn trong lợi ích; Jim muốn có kết quả phía trên bên trái trong khi Della muốn kết quả phía dưới bên phải. Một tỷ lệ hỗn hợp đã được phối hợp có thể cho họ một thỏa hiệp, chia đôi chênh lệch. Khi việc tung đồng xu quyết định ai tặng và ai nhận, kết quả trung bình cho mỗi người là 1,5 điểm. Tất nhiên yếu tố bất ngờ ở đây thì đã mất.
10. Hãy bắt lấy chừng nào có thể
Cho đến giờ chúng ta thấy có rất ít các ví dụ về chiến lược hỗn hợp bên ngoài thế giới thể thao. Vì sao các nhà kinh doanh lại ít khi sử dụng hành vi ngẫu nhiên trong thế giới thực như vậy? Trước hết rất khó xây dựng một ý tưởng về việc phó mặc mọi thứ cho may rủi trong văn hóa doanh nghiệp, khi người ta luôn muốn kiểm soát kết quả đạt được. Điều này đặc biệt đúng khi có những chuyện xảy ra không như mong muốn bởi vì nó đôi khi cũng phải xảy ra khi các bước đi được lựa chọn một cách ngẫu nhiên. Trong khi có một số người hiểu rằng huấn luyện viên bóng đá đôi khi phải làm động tác giả để giữ cho hàng phòng ngự chơi trung thực, một chiến lược rủi ro tương tự trong kinh doanh có thể khiến bạn bị đuổi việc nếu chiến lược đó thất bại. Nhưng điều quan trọng ở đây không phải là những gì rủi ro sẽ luôn mang lại lợi nhuận, đúng hơn là nó tránh cho bạn mối nguy hiểm khi sử dụng những mẫu hình xác định và tính dễ đoán.
Một ứng dụng trong đó các chiến lược hỗn hợp giúp cải thiện kết quả kinh doanh là phiếu giảm giá. Các công ty sử dụng các phiếu giảm giá để xây dựng thị phần. Ý tưởng ở đây là lôi kéo thêm khách hàng mới và không chỉ giảm giá cho thị trường hiện tại của bạn mà thôi. Nếu các đối thủ cạnh tranh cũng đồng thời đưa ra phiếu giảm giá thì khách hàng không có động cơ đặc biệt để chuyển từ nhãn hiệu hàng hóa này sang một nhãn hiệu khác. Thay vì thế, họ vẫn sẽ mua nhãn hiệu hàng hóa hiện tại của mình và vẫn được giảm giá. Chỉ có khi một công ty chào phiếu giảm giá trong khi các công ty khác không làm như vậy thì các khách hàng mới có động cơ muốn thử sản phẩm mới.
Trò chơi chiến lược với phiếu giảm giá đối với các đối thủ cạnh tranh như Coke và Pepsi rất giống với vấn đề về phối hợp của Della và Jim. Cả hai công ty đều muốn mình là người đưa ra phiếu giảm giá. Nhưng nếu họ làm điều đó đồng thời thì các tác động sẽ khử lẫn nhau và tình trạng của cả hai bên sẽ đều xấu đi. Một giải pháp là đi theo một mô hình có thể đoán trước như đưa ra phiếu giảm giá cứ 6 tháng một lần và đối thủ sẽ có thể biết cách để hành động xen kẽ. Vấn đề đối với giải pháp này là nếu Coke đoán được Pepsi sắp tung ra phiếu giảm giá, họ sẽ thấy nên đi trước một bước đón đầu. Cách duy nhất để tránh hành động đón đầu là giữ yếu tố bất ngờ thông qua việc sử dụng chiến lược ngẫu nhiên hóa11.
11 Có một bằng chứng thống kê rất mạnh nào đó cho thấy Pepsi và Coke đã đạt được một giải pháp hợp tác về việc phát phiếu giảm giá. Chương trình “60 phút” nói rằng trong suốt 52 tuần của năm, Coke và Pepsi đều đưa ra 26 đợt phát phiếu giảm giá và không hề trùng nhau lần nào. Cơ hội cho điều này xảy ra như một sự may mắn nếu hai bên hành động hoàn toàn độc lập và mỗi bên đều đưa ra 26 đợt giảm giá là 1/495918532948104 - hay ít hơn 1 trên 1.000 tỷ trường hợp.
Có những trường hợp khác nữa khi doanh nghiệp cần phải tránh các mô hình lập sẵn và tính dễ đoán nhận. Một số hãng hàng không chào vé giảm giá cho những người đi sẵn sàng mua vé vào phút cuối cùng. Nhưng họ sẽ không nói với bạn số ghế trống còn lại để bạn có thể dự đoán khả năng thành công. Nếu việc còn những chiếc vé vào phút cuối là dễ đoán trước thì sẽ là một cơ hội rất lớn để khai thác hệ thống này, khi đó các hãng hàng không sẽ mất những khách hàng đáng ra đã mua vé và thanh toán đúng giá như cách thông thường.
Việc sử dụng các chiến lược ngẫu hứng thường thấy nhất trong kinh doanh là tạo động cơ cho sự tuân thủ với chi phí giám sát thấp hơn. Điều này được áp dụng cho tất cả mọi thứ từ kiểm toán thuế, kiểm tra chất gây nghiện đến xác định thời gian đỗ xe. Nó cũng giải thích tại sao sự trừng phạt không nhất thiết phải tương ứng với mức độ vi phạm.
Tiền phạt thông thường cho việc đỗ xe trái luật tại nơi có máy đo thời gian là gấp nhiều lần so với mức phí mà máy đo tính toán. Nếu như mức giá của máy đo là 1 đô la cho mỗi giờ đỗ xe thì liệu mức phạt 1,01 đô la có đủ để buộc mọi người phải trung thực hay không? Sẽ là đủ nếu như cảnh sát giao thông chắc chắn sẽ tóm bạn mỗi lần bạn đỗ xe mà không bỏ tiền vào máy. Biện pháp giám sát tuân thủ kiểu như vậy sẽ là rất tốn kém. Lương của những người giám sát giao thông sẽ là khoản lớn nhất, và cả chi phí để vận hành một cơ chế thu phí cần thiết sao cho chính sách trở nên đáng tin cũng là rất lớn.
Chính quyền có một chiến lược không kém phần hiệu quả mà lại ít tốn kém hơn, đó là tăng mức tiền phạt và giảm bớt các nỗ lực giám sát tuân thủ. Khi mức phạt là 25 đô la, chỉ cần 1 trong số 25 lần vi phạm bị tóm cũng đủ để khiến bạn phải xử sự trung thực. Lực lượng cảnh sát cần thiết để làm công việc giám sát sẽ ít đi và mức tiền phạt thu về sẽ đủ bù đắp cho các chi phí hành chính.
Đây là một ví dụ khác về sự hữu ích của các chiến lược hỗn hợp. Nó cũng tương tự như quần vợt trong một vài khía cạnh nhưng lại khác ở các khía cạnh khác. Một lần nữa, chính quyền chọn một chiến lược ngẫu nhiên bởi vì nó hiệu quả hơn bất kỳ một hành động có hệ thống nào khác: không có người giám sát tuân thủ đồng nghĩa với việc để người dân lạm dụng những diện tích đỗ xe khan hiếm trong khi nỗ lực giám sát 100% sẽ là quá tốn kém. Tuy nhiên, về phía bên kia, phía những người đỗ xe, thì không nhất thiết phải có chiến lược ngẫu nhiên. Trên thực tế chính quyền muốn làm cho xác suất được phát hiện và mức phạt đủ lớn sao cho người dân phải tuân thủ với các quy định đỗ xe.
Việc kiểm tra ma túy đột xuất có nhiều đặc điểm giống với giám sát việc trả tiền khi sử dụng chỗ đỗ xe. Sẽ là rất tốn kém cả về thời gian và tiền bạc để kiểm tra từng nhân viên mỗi ngày nhằm tìm chứng cớ về việc họ sử dụng ma tuý. Việc kiểm tra đột xuất sẽ phát hiện ra những người không thể làm việc mà không dùng ma túy trước đó và ngăn cản những người khác sử dụng có tính chất tiêu khiển. Một lần nữa xác suất bị phát hiện là nhỏ nhưng mức phạt nếu bị tóm là rất cao. Đó cũng là một trong những vấn đề trong chiến lược kiểm toán của Tổ chức Kiểm toán Mỹ IRS. Các mức phạt của họ là nhỏ nếu với khả năng bị phát hiện cho trước. Khi việc giám sát là đột xuất và ngẫu nhiên, sự trừng phạt cần phải lớn hơn nhiều so với mức độ vi phạm. Quy tắc ở đây phải là sự trừng phạt được chờ đợi tương ứng với mức vi phạm đã tính đến cả xác suất bị phát hiện.
Những người hy vọng làm thất bại các biện pháp giám sát cũng có thể sử dụng các chiến lược ngẫu nhiên để có lợi cho mình. Họ có thể giấu tội thực giữa nhiều lần báo động giả hoặc nghi binh khiến cho lực lượng giám sát bị phân tán quá mỏng đến nỗi mất hiệu quả. Chẳng hạn một hệ thống phòng thủ trên không có thể tiêu diệt đến 100% các tên lửa bay đến. Một cách có hiệu quả về mặt chi phí đối với kẻ tấn công để đánh bại hệ thống phòng thủ nói trên là tung ra các vật nghi trang xung quanh tên lửa thật. Việc sản xuất các tên lửa nghi binh rẻ hơn rất nhiều so với một tên lửa thật. Trừ khi hệ thống phòng thủ có thể phân biệt một cách chính xác giữa thật và giả, còn không nó sẽ buộc phải bắn vào tất cả các tên lửa đến, dù là thật hay giả.
Một biện pháp thực tế là bắn các bù nhìn xảy ra trong Thế chiến thứ hai, nhưng không phải cố tình nghi binh cho tên lửa mà là để đối phó với vấn đề về chất lượng. Như John McDonald giải thích trong cuốn sách Chiến lược trong chơi bài poker, kinh doanh và chiến tranh của mình, “việc loại bỏ các viên đạn thối trong sản xuất là rất tốn kém. Ai đó đã có sáng kiến sản xuất ra các bù nhìn và sử dụng các viên đạn chọn ngẫu nhiên để bắn chúng. Một người chỉ huy quân đội không cho phép mình để một quả bom nổ chậm chôn dưới căn cứ của mình mà ông ta lại không bao giờ biết được đâu là quả nào Đức phòng thủ như thế. Sự thật khiến ông ta phải có hành động mỗi khi có một viên đạn không nổ”.
Khi chi phí cho quốc phòng là tỷ lệ thuận với số tên lửa có thể bị bắn hạ, những kẻ tấn công có thể khiến cho chi phí rà soát các đợt tấn công là cao đến mức không thể chịu đựng nổi. Đây chính là một trong những thách thức chủ yếu mà những người tham gia trong chương trình “Chiến tranh giữa các vì sao” phải đối mặt; có thể ở đây không có bất kỳ giải pháp nào.
11. Bài tập tình huống số 7
CHIẾN DỊCH LÃNH CHÚA (OVERLORD)
Năm 1944, quân Đồng minh lên kế hoạch cho một chiến dịch giải phóng châu Âu và phát xít Đức cũng lên kế hoạch để phòng vệ chống lại chiến dịch đó. Có hai khả năng lựa chọn cho cuộc đổ bộ đầu tiên - bờ biển Normandy và Pas de Calais. Một cuộc đổ bộ chắc chắn sẽ thành công nếu quân phòng ngự ở đó yếu, do vậy quân Đức sẽ chỉ tập trung quân của mình vào được một trong hai nơi. Calais là nơi khó chiếm hơn nhưng lại có giá trị hơn nếu giành được bởi nó gần các mục tiêu cuối cùng của quân Đồng minh ở Pháp, Bỉ và ở cả ngay đất Đức nữa. Giả sử các cơ hội thắng lợi sẽ là như sau:
Điểm thu hoạch được đánh theo thang số từ 0 đến 100. Quân Đồng minh coi việc đổ bộ thành công vào Calais sẽ là 100 điểm, đổ bộ thành công vào Normandy là 80 và thất bại ở mỗi nơi đều là 0 điểm (quân Đức sẽ có điểm thu hoạch tương ứng với giá trị tuyệt đối đúng bằng các điểm số nói trên nhưng ngược dấu).
Hãy đặt bạn cùng một lúc vào vị trí của tướng Eisenhower, Tổng chỉ huy quân Đồng minh và Field Marshal Rommel, chỉ huy quân đội Đức phòng vệ bờ biển của Pháp. Chiến lược nào là chiến lược bạn sẽ chọn?
THẢO LUẬN
Trước hết hãy gộp các thông tin về cơ hội thành công và các giá trị điểm cho thành công để xây dựng một bảng điểm trung bình. Các điểm số được liệt kê trên quan điểm quân Đồng minh; điểm của quân Đức là số âm của điểm quân Đồng minh bởi vì lợi ích của hai bên là hoàn toàn đối lập.
Ở đây không có điểm cân bằng trong các chiến lược cơ bản và chúng ta sẽ phải đi tìm các tỷ lệ hỗn hợp. Áp dụng phương pháp Williams, quân Đồng minh sẽ phải chọn đổ bộ vào Normandy hoặc Calais theo tỷ lệ (100-20):(80-60), hay 4:1, trong khi quân Đức cần phải triển khai phòng ngự ở Normandy và Calais theo tỷ lệ (80-20):(100-60), hay 3:2. Điểm số trung bình cho quân Đồng minh khi cả hai bên áp dụng tỷ lệ hỗn hợp tối ưu của mình là 68.
Các xác suất và điểm số chúng tôi chọn là để tiện cho tính toán, Tuy nhiên, rất khó để biết chính xác hay võ đoán về điều này. Do vậy, chúng tôi sẽ so sánh kết quả của mình với thực tế đã xảy ra. Nhìn lại chúng ta biết rằng theo tỷ lệ hỗn hợp của quân Đồng minh thì Normandy luôn là lựa chọn có sức nặng hơn và đó trên thực tế chính là địa điểm mà quân Đồng minh đã chọn. Đối với quân đội Đức, đó cũng là khả năng gần hơn. Do vậy, không bất ngờ lắm khi quyết định của quân Đức đã bị ảnh hưởng bởi cú lừa với kẻ nội gián hai mang của quân Đồng minh, sự bất đồng ý kiến trong hàng ngũ chỉ huy và một chút vận rủi, chẳng hạn như đúng lúc gay cấn nhất thì Rommel lại không có trên mặt trận. Họ đã thất bại khi đưa quân tiếp viện vào buổi chiều ngày D khi cuộc đổ bộ của quân Đồng minh tại Normandy đã gần như hoàn thành bởi vẫn tưởng rằng sẽ còn có một cuộc đổ bộ lớn hơn nữa vào Calais. Ngay cả khi đó vận mệnh của bãi biển Omaha vẫn còn chưa thực sự rõ ràng thêm một thời gian nữa. Nhưng quân Đông minh đã kịp tiến vào Normandy và tập hợp lực lượng của mình tại đó. Còn đoạn sau như thế nào thì tất cả các bạn chắc hẳn đều đã rõ.
LỜI BẠT CHO PHẦN 2
1. Ghi nhận của lịch sử
Lý thuyết trò chơi được khởi xướng bởi John von Neumann, học giả uyên thâm của trường tổng hợp Princeton. Vào những năm đầu tiên, trọng tâm nghiên cứu được đặt vào những trò chơi có xung đột đơn thuần (trò chơi có tổng lợi ích bằng 0). Các trò chơi khác được xem xét dưới hình thức hợp tác, có nghĩa là những người tham gia được giả định sẽ chọn và thực hiện các hành động của họ cùng nhau. Các cách tiếp cận này không thể bao được hầu hết các trò chơi trên thực tế, trong đó mọi người chọn hành động một cách riêng rẽ nhưng mắt xích nối họ với những người khác lại không phải là một quan hệ xung đột đơn thuần. Đối với những trò chơi phổ biến có sự kết hợp cả cạnh tranh và hợp tác, khái niệm của chúng tôi về điểm cân bằng là do John Nash đưa ra. Thomas Shelling đã mở rộng phân tích về các trò chơi có các bước đi luân chuyển, đồng thời phát triển ý tưởng về các bước đi chiến lược.
2. Tài liệu đọc thêm
Các cuốn sách đầu tiên thường được đọc một cách thích thú. Trên tinh thần này chúng tôi muốn giới thiệu cuốn Lý thuyết của các trò chơi và hành vi kinh tế của Von Neumann và Morgenstern (NXB Trường tổng hợp Princeton năm 1947) mặc dù một số phần nặng về toán học trong đó có thể hơi khó theo dõi. Cuốn Chiến lược của xung đột của Schelling (NXB Trường tổng hợp Harvard năm 1960) làm được nhiều hơn là một cuốn sách tiên phong; nó tiếp tục cung cấp thêm các chỉ dẫn và sự hiểu biết sâu sắc.
Cuốn Chiến lược gia hoàn hảo của J.D. Williams (bản hiệu chỉnh, Mc GrawHill 1966) là cuốn sách không có đối thủ về trình bày các trò chơi có tổng lợi ích bằng 0 một cách sinh động. Cuốn sách viết kỹ nhất và khá nặng về Toán học trước thời Lý thuyết trò chơi của Schelling là cuốn Trò chơi và quyết định của hai tác giả Duncan Luce và Howard Raiffa (NXB Wiley, 1957).
Trong số các cuốn sách phổ biến trình bày về Lý thuyết trò chơi, cuốn Lý thuyết trò chơi: Bước đầu làm quen phi kỹ thuật (biên soạn lần 2, NXB Basic Books, 1983) có lẽ là cuốn sách dễ đọc nhất. Cuốn Lý thuyết trò chơi trong các môn khoa học xã hội của Martin Shubik chi tiết hơn nhiều những cũng sử dụng công cụ toán học rất nặng (NXB MIT, 1982)
Bạn còn có thể tìm thấy một vài cuốn sách có giá trị áp dụng Lý thuyết trò chơi vào trong những bối cảnh cụ thể. Trong lĩnh vực chính trị, những cuốn sách đáng đọc gồm có Lý thuyết trò chơi với chính trị của Steven Brams (Free Press, 1979), Nghệ thuật vận động chính trị (NXB Trường tổng hợp Yale, 1986) và cuốn sách đi theo cách tiếp cận kỹ thuật hơn của Peter Ordeshook, Lý thuyết trò chơi và Lý thuyết chính trị (NXB Cambridge, 1986). Hai tài liệu xuất sắc về ứng dụng lý thuyết này trong kinh doanh phải kể đến Chiến lược cạnh tranh của Michael Porter (Free Press, 1982) và Nghệ thuật và khoa học thương lượng của Howard Raiffa (NXB Harvard, 1982).
3. Những lời tạ lỗi
Chúng tôi đã không làm rõ sự khác nhau giữa các trò chơi có tổng lợi ích bằng 0 với các trò chơi khác. Các điểm cân bằng trong trò chơi có tổng lợi ích bằng 0 có một số đặc tính không áp dụng được trong các trò chơi khác; do vậy có những cách xử lý vấn đề rất khác nhau được tách dọc theo khía cạnh này.
Chúng tôi đã đơn giản hóa nhiều tình huống đến mức mỗi người chơi chỉ còn 2 chiến lược. Điều này được làm khi hầu hết các ý tưởng cơ sở có thể được chuyển tải mà không làm mất đi đáng kể nội dung. Trong hầu hết các trường hợp những tình tiết phức tạp do có nhiều chiến lược đơn thuần chỉ là được dựng trên máy tính. Chẳng hạn ngẫu hóa giữa 3 chiến lược cơ bản trở lên có thể dễ dàng được một chương trình máy tính đơn giản thực hiện. Có một khía cạnh mới ở đây: chỉ có một số các chiến lược có thể hoạt động (được chơi với xác suất dương) tại điểm cân bằng. Về điều này bạn có thể đọc thêm sách của Luce và Raiffa.
Chúng tôi đã bỏ qua cái được gọi là “trò chơi hợp tác” trong đó người chơi chọn và thực hiện các hành động của mình cùng nhau và tạo ra các điểm cân bằng. Chúng tôi làm như vậy bởi cho rằng bất kỳ sự hợp tác nào cũng xuất hiện như một kết cục cân bằng của trò chơi phi hợp tác trong đó các hành động được lựa chọn một cách riêng rẽ. Điều này có nghĩa là động cơ của cá nhân gian dối trong bất kỳ thỏa thuận nào cũng đều phải bị nhận biết và được coi là một phần trong lựa chọn chiến lược của họ. Tuy nhiên, những người quan tâm có thể tìm đọc về các trò chơi hợp tác trong các cuốn sách của Davis, Luce, Raiffa và Shubik.
4. Kể từ đây
Phần 3 áp dụng các khái niệm và kỹ thuật đã được trình bày vào một số loại tương tác chiến lược. Chúng gồm có thương lượng, bầu cử, kề miệng hố chiến tranh và các động cơ khuyến khích. Một lần nữa chúng tôi chứng minh các nguyên tắc chiến lược thông qua các ví dụ và tình huống, đồng thời giới thiệu các tài liệu tham khảo thêm ở những chú thích cho các độc giả - những người muốn biết chi tiết hơn nữa về các chủ đề đưa ra.