S
ố liệu là thứ vũ khí hóa học trong trận chiến thuyết phục người khác. Tất cả các chính trị gia và thương gia cừ khôi đều biết điều này. Đưa vài số liệu vào cuộc bàn luận và tác động của chúng sẽ nhanh chóng được nhận thấy: những cặp mắt đờ ra, những quai hàm trễ xuống, và chẳng mấy chốc mà mọi người sẽ gật đầu đồng ý lia lịa. Bạn làm sao có thể cãi lại những con số.
Có đấy, bạn có thể. Thậm chí khi những con số là chính xác, thông thường chúng không thể hiện cái người ta cho rằng chúng thể hiện. Ví dụ, những tay viết xã luận bao giờ cũng nhảy từ số liệu về sự thay đổi hành vi sang kết luận về sự thay đổi, và thông thường theo chiều hướng xấu đi, của các giá trị. Tuy nhiên, hành vi có thể thay đổi, đâu phải bởi giá trị thay đổi, mà bởi hoàn cảnh thay đổi. Bây giờ, thiếu niên phạm tội trộm cướp đường phố nhiều hơn hồi năm 1980. Có phải bởi bây giờ thiếu niên ít coi trọng vấn đề tài sản riêng hơn, hay bởi bây giờ xuất hiện lắm thứ để trộm cướp ngoài đường phố hơn - đáng chú ý nhất là điện thoại di động? Người ta bây giờ ăn nhiều hơn hồi năm 1950. Có phải bởi người ta bây giờ phàm ăn hơn, hay bởi bây giờ giá thực phẩm rẻ hơn?
Tuy nhiên, việc rút ra kết luận sai lầm từ những số liệu là một lỗi thú vị chỉ khi bản thân những số liệu ấy đã chính xác. Mà thông thường chúng lại chẳng chính xác. Hãy xem xét những số liệu sau đây:
35% trẻ em Anh sống trong cảnh nghèo khổ,
50% chủ các doanh nghiệp nhỏ sẽ thay đổi ngân hàng để được giảm 0,25% mức lãi suất đối với khoản bội chi,
25% số thanh thiếu niên sử dụng ma túy từng hút cần sa cùng cha (hoặc mẹ),
2% phụ nữ trẻ mắc chứng tâm thần gây biếng ăn, và trong số đó có 20% tử vong vì chứng bệnh này.
Mỗi số liệu trên đây đều do một nguồn đáng tin cậy cung cấp. Và mỗi số liệu cũng đều là kết quả của một lỗi thuộc về phương pháp thống kê. (Xét đến năng lực thống kê, các nguồn cung cấp xem chừng không đáng tin cậy).
Để hiểu những lỗi ấy không khó khăn gì, tôi hy vọng chương này sẽ cho thấy điều đó, nhưng việc hiểu những lỗi ấy là việc quan trọng. Sự ngây thơ phổ biến về thống kê khiến những số liệu dớ dẩn như thế kia trở thành những “thông tin chính xác” được thấm nhuần trong quá trình đưa ra các quyết định.
TÌNH TRẠNG NGHÈO KHỔ Ở ANH
Chẳng bao lâu sau khi lên cầm quyền năm 1997, chính phủ Công đảng đã lôi kéo sự chú ý của người dân Anh tới trước một thực tế đáng sửng sốt. 35% trẻ em Anh sống trong cảnh nghèo khổ. Tất nhiên, không phải cái nghèo khổ tuyệt đối: thậm chí những đứa trẻ nghèo khổ nhất cũng không bị đe dọa nghiêm trọng về cái ăn, chỗ ở, chuyện học hành, hay chăm sóc y tế. Nói đúng hơn thì 35% trẻ em Anh sống trong cảnh nghèo khổ tương đối: theo tiêu chuẩn của nước Anh hiện đại, chúng tương đối nghèo.
Ở phần “Cái nghèo và cái nghèo”, tôi đã than phiền về việc chính phủ Công đảng lập lờ với tính lưỡng nghĩa của từ “nghèo khổ”. Chúng ta cần thiết phải đấu tranh chống lại sự nghèo khổ, họ khẳng định như thế. Vì sao? Vì cái nghèo là một điều thật khủng khiếp và nó quá phổ biến. Nhưng đây đơn thuần là sự chơi chữ thôi. Cái nghèo tuyệt đối thì khủng khiếp thật (tuy nhiên họa hoằn mới gặp), còn cái nghèo tương đối thì phổ biến (tuy nhiên lại chẳng khủng khiếp lắm).
Dù sao, trong chương này, tôi cũng muốn gạt vấn đề đó sang bên, và chỉ xem xét lời khẳng định rằng 35% trẻ em Anh sống trong cảnh nghèo khổ tương đối. Bởi lời khẳng định này minh họa cho cái cách mà số liệu hay đẩy người ta tới với những ấn tượng sai lầm: dựa trên phương pháp đánh giá không chính xác một hiện tượng.
Chính phủ tính toán con số những người sống trong cảnh nghèo khổ tương đối bằng con số những người sống trong các gia đình có thu nhập thấp hơn 60% thu nhập quốc dân trung bình. (Thu nhập, phục vụ mục đích tính toán này, là thu nhập sau thuế và sau khi trừ đi chi phí nhà ở, được “cào bằng” để phản ánh các nhu cầu tài chính khác nhau của các hộ gia đình căn cứ theo số thành viên của mỗi hộ.) Chúng ta phải công nhận 35% trẻ em sống trong những hộ như thế. Nhưng, tại sao chúng ta lại từ đó kết luận rằng 35% trẻ em sống trong cảnh nghèo khổ tương đối? Nói cách khác, tại sao thu nhập hộ gia đình thấp hơn 60% thu nhập quốc dân trung bình lại là thước đo đúng đắn cho sự nghèo khổ tương đối?
Câu trả lời là không phải vậy. Ở một nước như nước Anh, sử dụng tình trạng bất bình đẳng về thu nhập khả dụng là cách vô vọng để đánh giá sự nghèo khổ tương đối.
Hãy lấy ví dụ hai cậu bé 12 tuổi là hàng xóm sát vách nhau. Hai cậu bé này sống trong hai ngôi nhà xây cất y như nhau, học cùng trường nhau, mỗi khi ốm đau cùng đến khám một bác sĩ, cùng mặc một nhãn hiệu đồ thể thao, v.v... Thực tế, điều kiện vật chất của hai cậu bé khác nhau duy nhất một điểm. Cha mẹ Jimmy cho cậu bé 10 bảng tiền tiêu vặt hàng tuần, còn Timmy chỉ được 5 bảng. Liệu chúng ta có nên kết luận rằng, vì thu nhập khả dụng chỉ bằng nửa Jimmy, Timmy thuộc loại bần hàn so với cậu bạn?
Hiển nhiên là không. Mức tiêu dùng của Jimmy và Timmy gần như y hệt nhau. Giả sử rằng chi phí nhà ở, quần áo, học hành, chăm sóc sức khỏe… mà cả hai cậu bé đều được hưởng là 100 bảng/tuần, và cả hai cậu bé đều tiêu hết sạch khoản tiền tiêu vặt. Vậy thì mức tiêu dùng của Jimmy là 110 bảng/tuần và của Timmy là 105 bảng/ tuần. Mặc dù thu nhập khả dụng của Jimmy gấp đôi của Timmy, mức tiêu dùng của cậu bé chỉ nhỉnh hơn 5%.
Khi một tỷ lệ lớn trong mức tiêu dùng được chi trả không phải bằng thu nhập khả dụng thì sự khác biệt về thu nhập khả dụng sẽ luôn luôn làm cho sự khác biệt về khả năng tiêu dùng trở nên lớn hơn. Mà để xét tình trạng nghèo khổ, bao gồm cả tình trạng nghèo khổ tương đối, khả năng tiêu dùng luôn luôn là yếu tố quan trọng.
Thế tức là chính phủ đã đưa ra phương pháp đánh giá tình trạng nghèo khổ của các hộ gia đình một cách sai lầm. Vì, giống như Jimmy và Timmy, các gia đình ở Anh chẳng cần chi trả phần lớn nhu cầu tiêu dùng bằng thu nhập khả dụng. Hai khoản quan trọng nhất, y tế và giáo dục, đã được nhà nước chi trả từ nguồn thuế. Và, với phương pháp đánh giá tình trạng nghèo khổ do chính phủ đưa ra ở đây, chi phí nhà ở cũng không phải tính đến, bởi nó dùng thu nhập khả dụng sau khi trừ đi chi phí nhà ở.
Trong một xã hội được nhà nước chu cấp rất nhiều thứ như xã hội Anh, sự khác biệt về thu nhập khả dụng sau khi trừ đi chi phí nhà ở sẽ phóng đại sự khác biệt về mức tiêu dùng và do đó sẽ phóng đại con số những người chịu cảnh nghèo khổ tương đối. Điểm này không liên quan gì tới việc phân phối lại tài sản xã hội. Nếu thuế thì cao nhưng tất cả các loại phúc lợi đều được trả bằng tiền mặt thay vì dịch vụ của nhà nước, thu nhập khả dụng sẽ phản ánh chính xác mức tiêu dùng, và thu nhập tương đối sẽ là cơ sở hợp lý để đánh giá tình trạng nghèo khổ tương đối. Một xã hội càng đi xa khỏi mô hình “tiền mặt” và hướng đến mô hình “dịch vụ do nhà nước chu cấp”, phương pháp đánh giá tình trạng nghèo khổ tương đối thông qua thu nhập khả dụng càng trở nên sai lầm.
Để thấy (một cách áng chừng) phương pháp này sai lầm tới mức nào đối với xã hội Anh, hãy giả sử khoản bao cấp của nhà nước về nhà ở, y tế và giao thông cho một hộ gia đình trung bình là bảng/tuần. (Hàng tuần mỗi hộ gia đình được chính phủ chi trả 46 bảng cho giáo dục, 56 bảng cho y tế và 12 bảng cho giao thông. Nên tôi đặt ra 106 bảng cho nhà ở và đạt đến con số 220 bảng/tuần.)
Để có chỉ số hợp lý về mức tiêu dùng tương đối, con số 220 bảng này phải đem cộng trở lại với thu nhập khả dụng sau khi trừ đi chi phí nhà ở. Từ mức thu nhập trung bình 300 bảng/tuần, chúng ta có mức tiêu dùng trung bình là 520 bảng.
Theo chính phủ, mức tiêu dùng như thế nào thì cấu thành tình trạng nghèo khổ tương đối? Có trời mới biết được. Nhưng cứ cho là họ bám lấy cái tỷ lệ 60% mức tiêu dùng trung bình. 60% của 520 bảng là 312 bảng. Vì mỗi hộ gia đình đều đã có 220 bảng chi phí nhà ở và các dịch vụ do nhà nước chu cấp, thu nhập khả dụng trong mỗi hộ gia đình phải dưới 92 bảng mới cấu thành tình trạng nghèo khổ tương đối, thay cho con số hiện tại là 180 bảng (tức 60% của 520 bảng). Với phương pháp tính toán được thay đổi lại như thế này, chỉ có khoảng 10% các gia đình sống trong cảnh nghèo khổ tương đối.
Tôi không nói 10% các gia đình ở Anh sống trong cảnh nghèo khổ tương đối, bởi tôi không nói 60% mức tiêu dùng trung bình là một thước đo đúng đắn. Tôi chỉ đang nhằm mục đích chứng tỏ rằng cái thước đo đúng đắn chắc chắn chẳng phải thu nhập khả dụng, và rằng con số những người nghèo mà chúng ta tính toán ra hết sức phụ thuộc vào phương pháp tính toán do chúng ta lựa chọn.34
34 Một phương pháp đánh giá tình trạng nghèo khổ tương đối hứa hẹn đạt kết quả chính xác hơn là bắt đầu bằng việc hỏi những người dân bình thường xem họ coi mức tiêu dùng tối thiểu như thế nào thì thể hiện rằng có cuộc sống khá giả. Câu trả lời sẽ thay đổi tùy thời gian, tùy từng nước, phụ thuộc vào tổng tài sản quốc gia (vì vậy mà nó mang tính tương đối). Người ta sống trong cảnh nghèo khổ tương đối khi cộng cả thu nhập khả dụng lẫn khoản chu cấp của nhà nước vẫn chưa đủ cho mức tiêu dùng kia. (TG)
Khi nêu lên số liệu thống kê liên quan đến cái gì đó khó đo đếm, ví dụ như sự nghèo khổ, hạnh phúc hay vẻ đẹp, bao giờ cũng phải kiểm tra phương pháp thống kê. Thông thường nó sẽ cung cấp một kết quả phỏng chừng, chấp nhận được với mục đích này nhưng không chấp nhận được với mục đích khác. Đôi khi nó đơn giản là sai lầm hoàn toàn.
Tuy nhiên, mặc dù đã cảnh báo bạn về nguy cơ ấy, tôi lại chẳng thể đưa ra chỉ dẫn chung để phân biệt các phương pháp hay, dở. Đứng trước mỗi phương pháp, bạn đều phải xem xét nó kỹ lưỡng. Việc này nói chung là khó khăn, vì báo chí, các chính trị gia và thương gia nhiều khi chỉ đơn thuần cung cấp số liệu, mà hầu như lờ đi những thông tin chính xác về phương pháp thống kê được sử dụng. Trong trường hợp này, thái độ đúng đắn là hãy hoài nghi một cách khoáng đạt.
THAY ĐỔI NGÂN HÀNG VÀ NHỮNG LỜI DỐI TRÁ KHÁC
Bạn đưa ra giá càng cao thì càng thu nhiều lợi nhuận đối với mỗi sản phẩm bán được (lợi nhuận tính theo mỗi đơn vị sản phẩm). Vậy tại sao không đưa ra giá cao ngất ngưởng đi? Vì bạn sẽ chẳng bán được gì cả. Không giống như lợi nhuận tính theo mỗi đơn vị sản phẩm, giá càng tăng thì doanh số bán hàng càng giảm. Nếu bạn mong muốn đạt mức tối đa tổng lợi nhuận, là điều hầu hết các chủ doanh nghiệp mong muốn, mức giá hợp lý nhất là mức giá đem đến sự cân bằng giữa lợi nhuận tính theo mỗi đơn vị sản phẩm và doanh số bán hàng.
Để xác định được mức giá hợp lý nhất này, bạn cần phải biết lợi nhuận tính theo mỗi đơn vị sản phẩm tại từng mức giá cụ thể và doanh số bán hàng tại mức giá đó. Việc tính toán tiền lãi thì đơn giản, trong trường hợp bạn đã nắm được các khoản chi phí35. Nhưng để xác định xem mỗi mức giá có ảnh hưởng tới doanh số bán hàng như thế nào lại đòi hỏi sự thấu hiểu tâm lý của khác hàng trước mỗi mức giá. Và điều đó khó khăn hơn nhiều.
35 Xin trình bày cho độc giả dễ dàng hình dung như thế này. Nếu các khoản chi phí đã cố định (tức chúng không thay đổi theo doanh số bán hàng, ví dụ quảng cáo trên truyền hình chẳng hạn), lợi nhuận tính theo mỗi đơn vị sản phẩm cũng phụ thuộc vào doanh số bán hàng, vì chi phí trung bình cho mỗi đơn vị sản phẩm sẽ thay đổi tỷ lệ nghịch với doanh số bán hàng. Hầu hết các doanh nghiệp đều có một số khoản chi phí cố định, bởi vậy để xác định được lợi nhuận tính theo mỗi đơn vị sản phẩm tại từng mức giá cụ thể cũng đòi hỏi việc xác định được doanh số bán hàng tại mức giá đó. Nhưng vấn đề vẫn là: làm sao xác định được ảnh hưởng của các mức giá lên doanh số bán hàng. (TG)
Những cuộc thí nghiệm thì đầy rủi ro. Bạn có thể phỏng đoán sai lầm và đánh mất hết khách hàng, hoặc hy sinh lợi nhuận tính theo mỗi đơn vị sản phẩm mà không nâng được doanh số. Đây là lý do tại sao các công ty hay tiến hành điều tra thị trường trước khi áp dụng bất cứ thay đổi nào về giá cả. Chao ôi, những cuộc điều tra như thế vốn vẫn hay đem lại kết quả giả dối, bởi một nguyên nhân rất đỗi đơn giản: người ta toàn nói láo. Cụ thể thì người ta đâu có thực sự nhạy cảm với giá cả như người ta tự khẳng định.
Tôi mới tiến hành điều tra trên đối tượng là quản lý các doanh nghiệp nhỏ ở Hà Lan về mức khấu trừ lãi suất có thể khiến họ thay đổi ngân hàng: “Nếu một ngân hàng đưa ra mức lãi suất cho khoản vay thấu chi của bạn thấp hơn 0,25% mức lãi suất tại ngân hàng hiện thời, khả năng bạn chuyển sang ngân hàng kia như thế nào? Chắc chắn, rất có thể, có thể, có thể không, chắc chắn không? Nếu thấp hơn 0,5%...”
Căn cứ theo giá trị bề ngoài của kết quả điều tra thì thậm chí mức khấu trừ thấp nhất cũng khiến phần lớn những người quản lý các doanh nghiệp nhỏ ở Hà Lan chuyển ngân hàng ngay tức khắc. Tuy nhiên, một số ngân hàng ở Hà Lan rõ ràng có đưa ra mức lãi suất giảm chút ít, và thực tế họ chẳng nhìn thấy cảnh các ông chủ nhỏ rồng rắn xếp hàng để mở tài khoản đâu cả.
Lý do thích đáng khiến người ta không thay đổi ngân hàng là mức giảm lãi suất chút ít không bõ thời gian và công sức cho người ta thay đổi. 0,25% đối với khoản vay thấu chi 20.000 đô-la chỉ tương đương 50 đô- la/năm, trong khi thủ tục chuyển ngân hàng lại rầy rà quá thể.
Vậy tại sao mà họ nói sẽ chuyển? Tôi không trả lời chắc chắn được. Nhưng tôi phỏng đoán rằng họ thích coi mình như những doanh nhân sắc sảo không khi nào lại bỏ qua các cơ hội giao dịch hời hơn. Và chỉ nói sẽ chuyển suông thì chẳng vướng gì đến chuyện tốn kém thời gian, công sức.
Nhìn chung, tốt nhất là đừng tin tưởng vào kết quả điều tra thu thập số liệu đơn thuần bằng cách hỏi người ta về xu hướng hành động hay thói quen. Người ta có đủ thứ lý do để không thể hiện đúng bản thân. Thông thường người ta không cố ý đánh lừa, tuy nhiên thậm chí nếu người ta chỉ tự dối chính mình, kết quả điều tra sẽ vẫn mất tính tin cậy. Ví dụ, nếu bạn muốn tìm hiểu về sự thành thạo trong chuyện chăn gối của đàn ông Ý, tôi không khuyên bạn đi lấy thông tin đơn thuần bằng cách đặt câu hỏi cho họ đâu.
Thật khó biết trước người ta sẽ thể hiện không đúng bản thân điều gì. Ví dụ, bạn vốn vẫn nghĩ rằng bất cứ ai cũng sẵn sàng trả lời chính xác ý định bỏ phiếu ở một cuộc bầu cử phổ thông. Nhưng không. Chiến thắng của Đảng Bảo thủ ở cuộc bầu cử phổ thông năm 1992 đầy bất ngờ đối với các tổ chức thăm dò dư luận, mà hầu hết đều dự đoán Công đảng giành chiến thắng lớn. Phân tích sau bầu cử cho thấy họ đã dự đoán sai lầm vì nhiều người bỏ phiếu bầu Đảng Bảo thủ nhưng lại không muốn thừa nhận, kể cả trên phiếu thăm dò không ghi danh. Vậy hãy thận trọng. Nếu ngay việc bộc lộ sự ủng hộ chính trị một cách thầm kín còn chẳng tin cậy được, bạn gần như không thể tin cậy được gì vào các giá trị bề ngoài.
HÚT XÁCH CÙNG ÔNG BÔ
Việc khám phá ra một tin tức hay trên báo chí bao giờ cũng thú vị. Tôi cho là tôi đã bắt gặp một tin tức hay ở tờ Thời báo (24/2/2003, trang 2) dưới tiêu đề “Những ông bố bà mẹ mắc nghiện”. Nó thông báo rằng “gần 1/4 số thanh thiếu niên có sử dụng ma túy từng hút cần sa cùng cha hoặc mẹ mình”. Rốt cuộc thì đời sống gia đình vẫn còn tồn tại trên đất nước Anh.
Chao ôi, tôi tiếp tục đọc và phát hiện ra rằng số liệu kia không thể tin cậy được. Bởi nó là kết quả của “cuộc điều tra 493 độc giả của tạp chí chuyên về vũ trường và hộp đêm Mixmag”. Bạn sẽ nhìn thấy vấn đề ở đây. Thậm chí nếu những người tham gia vào cuộc điều tra của Mixmag trả lời thật về thói quen sử dụng ma túy của mình, họ cũng khó có thể đại diện cho số thanh thiếu niên mắc nghiện. Xuất phát điểm, họ thuộc típ người cởi mở, muốn chia sẻ thông tin về thói quen sử dụng ma túy của mình, điều này khiến họ dễ dàng cùng sử dụng ma túy với cha mẹ hơn những thanh thiếu niên khác. Tiếp theo, chúng ta có cái thực tế đơn giản là họ đọc một tạp chí chuyên về vũ trường và hộp đêm, những nơi này ai chẳng biết luôn luôn dính dáng đến ma túy. Đây không phải những thanh thiếu niên sử dụng ma túy điển hình: đây là những người mê đắm và bị ám ảnh trong thế giới chất gây nghiện.
Số liệu được cung cấp là kết quả của cái người ta vẫn gọi là nhóm mẫu không đủ tính đại diện. Nhóm mẫu không mang những nét đặc trưng của số đông thanh thiếu niên có sử dụng ma túy, và sự không tiêu biểu ấy khiến họ dễ dàng đưa ra câu trả lời như thế kia.
Mọi người đều biết rằng cần tránh tình trạng nhóm mẫu không đủ tính đại diện khi làm thống kê. Tuy nhiên, sai lầm vẫn rất phổ biến. Báo chí, như tờ Thời báo chẳng hạn, chắc chắn phải biết rõ ràng hơn, vì họ thường xuyên đăng tải các kết quả thăm dò dư luận và thậm chí đôi khi còn tự tiến hành thăm dò. Nhưng, nếu có được một tiêu đề hấp dẫn, họ vẫn sẽ rất sung sướng đăng tải các kết quả của một cuộc điều tra hết sức thiên vị, như ví dụ minh họa ở trên.
Số liệu về thói quen sử dụng ma túy của chúng ta là ví dụ minh họa cho một cách phổ biến dẫn đến tình trạng nhóm mẫu không đủ tính đại diện, nói cụ thể thì là người thực hiện điều tra đã để nhóm mẫu tự lựa chọn chính họ. Những người tình nguyện tham gia vào các cuộc điều tra về cái gì đó không phải là những người giữ thái độ, tình cảm bình thường về cái gì đó này. Họ bao giờ cũng có sự say mê lớn hơn hầu hết những người khác. Bởi vậy điều đúng với họ chưa chắc đúng với số đông.
Cách đây khoảng 10 năm, báo chí và đài phát thanh đưa ra một số liệu gây chấn động là 40% phụ nữ Anh đi nghỉ ở Tây Ban Nha đã làm tình với những người mà họ chưa hề gặp trước đó, chỉ trong vòng 5 tiếng đồng hồ đặt chân lên xứ sở này. Số liệu được tập hợp từ một cuộc điều tra do một tạp chí dành cho phụ nữ thực hiện. Họ mời các độc giả từng trải nghiệm những chuyện chăn gối thú vị qua các kỳ đi nghỉ tham gia.
Nói chung thì xu hướng nhóm mẫu tự lựa chọn chính mình giải thích lý do tại sao các chính trị gia vui vẻ lờ đi quan điểm của những người tuần hành phản đối, những người viết thư gửi ban biên tập và thậm chí cả những thành viên của đảng vốn vẫn dự đại hội thường niên. Chỉ đám cuồng tín mới tham gia vào những hoạt động chính trị kiểu như thế, còn hầu hết các cử tri không thuộc đám cuồng tín đó.
Đa số những trường hợp nhóm mẫu không đủ tính đại diện khá rõ ràng, nhưng một số khó phát hiện ra được. Ví dụ, bạn có thể nghĩ rằng, để tìm hiểu về khoảng thời gian thất nghiệp trung bình, sẽ hợp lý nếu áp dụng phương pháp “bắn không cần ngắm”. Tiếp xúc với một số người thất nghiệp vào một ngày trong năm và hỏi xem họ đã thất nghiệp bao lâu rồi. Miễn sao số người được điều tra đủ lớn, khoảng thời gian thất nghiệp trung bình của họ là khoảng thời gian thất nghiệp trung bình của tất cả những ai từng lâm vào hoàn cảnh này.
Thực tế, số người được điều tra sẽ có xu hướng nghiêng hẳn về khoảng thời gian thất nghiệp dài. Một ngày bất kỳ thì nhiều khả năng rơi vào khoảng thời gian thất nghiệp của những người mất việc đã lâu hơn là những người chỉ mất việc một thời gian ngắn. Rất đông những người vừa mất việc một tuần và đã đi làm lại tại thời điểm bạn tiến hành điều tra. Bởi vậy họ không được tính. Nhưng tất cả những người mất việc hàng năm trời rồi thì vào cái ngày đó cũng đang thất nghiệp, và tất cả đều được tính. Để tránh kết quả thiên vị, bạn cần có nhóm mẫu bao gồm những người, không phải đúng hôm nay đang thất nghiệp, mà là đang thất nghiệp ở một thời điểm nào đấy cách đây, ví dụ như, 10 năm. Khoảng thời gian thất nghiệp trung bình của nhóm mẫu này cung cấp câu trả lời đáng tin cậy hơn.36
36 Tôi lấy ví dụ này từ cuốn “Nhà kinh tế học ghế bành” của tác giả Steven E. Landsburg (Nhà xuất bản Free, New York, 1994), trang 132. Tôi nói “câu trả lời đáng tin cậy hơn” chứ không nói “câu trả lời chính xác”, vì nhóm mẫu này có thể không phản ánh được những thay đổi gần đây trong khoảng thời gian thất nghiệp trung bình. (TG)
Trước khi tiếp tục, tôi không thể nào không nhắc tới một trường hợp nhóm mẫu thực sự không đủ tính đại diện 1 cách quá đáng. Suốt nhiều năm nay, người ta đã nhìn nhận nó như một thực tế vững vàng rằng 10% đàn ông phương Tây đồng tính luyến ái. Hầu hết người ta tin tưởng vào số liệu này mà chẳng biết nguồn gốc của nó. Nó nằm trong cuốn Hành vi tình dục ở nam giới do Kinsey và cộng sự viết, xuất bản năm 1948. Chao ôi, 25% số người được Kinsey sử dụng cho cuộc điều tra là các tù nhân bị giam chung, bất chấp thực tế là số tù nhân lúc bấy giờ chỉ chiếm 1% số nam giới Mỹ (bây giờ là 2%). Vì họ phải sống trong môi trường toàn nam giới, các tù nhân nam dễ dàng quan hệ đồng tính hơn đàn ông bình thường.
Suy cho cùng, như thế thì cũng chẳng có nghĩa rằng số nam giới đồng tính luyến ái chiếm chưa tới 10%. Bởi trong điều tra của Kinsey có những nhóm đối tượng cạnh tranh nhau về công việc, đặc biệt là xu hướng nói dối khi động đến một hành vi lúc bấy giờ còn bị cấm đoán. Vì vậy, với tất cả những gì đọc được nghiên cứu của Kinsey, chúng ta vẫn không biết tỷ lệ phần trăm nam giới đồng tính luyến ái là như thế nào. Nhìn qua cửa sổ văn phòng tôi, tôi sẽ thiên về chỗ nghĩ rằng tỷ lệ đó lớn hơn 10%. Cơ mà, văn phòng tôi lại đặt ở Convent Garden37.38
37 Convent Garden: một quận ở London, Anh, nơi tập trung các khu vực mua sắm, các địa điểm vui chơi giải trí và các nghệ sĩ biểu diễn rong trên phố. (ND)
38 Nghiên cứu đáng tin cậy hơn do Edward Laumann tiến hành năm 1994 cho thấy tỷ lệ nam giới thường xuyên có quan hệ đồng tính là 4%. (TG)
CHỨNG BIẾNG ĂN VÀ CÁC CON SỐ TO NHỎ KHÁC
Hiệp hội Y khoa Anh kêu gọi ngành công nghiệp thời trang và truyền hình thôi tập trung sự chú ý vào những nhân vật nổi tiếng “siêu gầy”, như Kate Moss, Callista Flockhart, ngôi sao của Ally McBeal39, và Victoria Beckham trong nhóm Spice Girls, đồng thời kêu gọi Chính phủ đặt mục tiêu giảm số người mắc chứng tâm thần gây biếng ăn. 2% số nữ thanh niên mắc chứng bệnh này, và tỷ lệ tử vong là 1/5.
39 Sê-ri phim truyền hình Mỹ chiếu từ 1997 đến 2002. (ND)
Thời báo (31/5/2000)
Hiệp hội Y khoa Anh luôn luôn kêu gọi mọi người đừng như thế nọ thế kia nữa vì những tác động khủng khiếp của nó đối với sức khỏe. Thông thường, họ vướng phải sai lầm là cứ nghĩ tất cả mọi người đều lo lắng đến sức khỏe. Tôi có thể biết rằng hút thuốc lá có hại nhưng bất luận thế nào tôi vẫn cứ hút, bởi tôi thích một cuộc sống ám khói ngắn ngủi hơn cuộc sống trong lành dài lâu. Tuy nhiên, lần này, họ sai lầm với cái đáng phải thuộc về sân nhà của họ: nói cụ thể thì họ sai lầm với các thực tế và số liệu y khoa. Ý tưởng về 2% số nữ thanh niên mắc chứng biếng ăn và tỷ lệ tử vong 1/5 thật tức cười.
Có ba triệu rưỡi phụ nữ Anh ở độ tuổi 15 - 25. Nếu 2% số này mắc chứng biếng ăn, tức là 70.000. Và nếu 1/5 số người mắc tử vong, chúng ta phải hình dung đến 14.000 nữ thanh niên chết mỗi năm vì chứng biếng ăn.40
40 Tỷ lệ tử vong do một căn bệnh thông thường được tính theo hàng năm: tức là tỷ lệ phần trăm số người mắc bệnh chết trong khoảng thời gian một năm. Nếu tỷ lệ tử vong 20% của ví dụ chúng ta đang xem xét không phải tính theo hàng năm, mà tính theo khoảng thời gian lâu hơn, thì con số người chết vì chứng biếng ăn sẽ nhỏ hơn, nhưng cũng không đủ nhỏ để cứu vãn được số liệu thống kê kia khỏi sai sót nghiêm trọng. Chẳng hạn, nếu 20% số người mắc chứng biếng ăn chết trong khoảng thời gian 10 năm, thì con số phụ nữ tử vong ở độ tuổi 15 - 25 mỗi năm sẽ là 2.800 = 140.000x20%/10. 140.000 là con số phụ nữ ở độ tuổi 15 - 25 trong khoảng thời gian 10 năm. (TG)
Bạn sẽ bắt đầu ngờ vực có điều gì đó không chính xác đây, khi tôi nói với bạn rằng, năm 1999, tổng số phụ nữ tử vong trong nhóm tuổi này vì mọi nguyên nhân, bao gồm cả chứng tâm thần gây biếng ăn, là 855.Liệu chứng biếng ăn có thể nào lại thực sự giết được số nữ thanh niên cao gấp 16 lần số tử vong?
Chúng ta chẳng cần đi mò mẫm trong bóng tối. Nguyên nhân dẫn tới tử vong và các con số vốn vẫn lưu trữ ở Văn phòng Thống kê Quốc gia. Chúng ta có thể kiểm tra con số nữ thanh niên chết vì chứng biếng ăn. Con số do Hiệp hội Y khoa Anh cung cấp chắc chắn sai, bởi không căn bệnh nào lại giết được số người nhiều hơn số người chết thật. Nhưng nó sai như thế nào?
Con số 14.000 gấp hơn 1.000 lần con số thực tế. Số nữ thanh niên chết vì chứng tâm thần gây biếng ăn năm 1999 là 13. Không phải 13.000. 13.
Nếu tôi là Callista Flockhart, tôi sẽ kiện Hiệp hội Y khoa Anh và tờ Thời báo. Bằng việc kêu gọi giới truyền thông thôi tập trung sự chú ý vào cô, họ đã mưu toan phá hoại sự nghiệp cô theo đuổi, bởi cái luận điệu rởm rằng nhìn cô người ta sẽ chết vì chứng biếng ăn. Hàng triệu phụ nữ trẻ Anh xem Callista Flockhart và nhiều nhất là 13 người chết vì điều đó mỗi năm. Điều ấy khiến tiểu thư Flockhart còn an toàn hơn cả chuyện sang đường.
Tất nhiên, tôi không phải Callista Flockhart, nên tôi không kiện Hiệp hội Y khoa Anh hay tờ Thời báo.
Nhưng tôi có gửi thư cho Ban Biên tập tờ Thời báo, chỉ ra lỗi của họ. Họ chẳng thèm đăng thư của tôi, cũng chẳng thèm đăng lời đính chính, và tôi không nhận được sự giải thích nào từ họ xem làm sao mà họ lại đi đăng con số điên rồ như thế kia. Bởi vậy, tôi phải tự phỏng đoán về nguyên nhân dẫn tới sai lầm.
Tôi ngờ là Helen Rumbelow, tác giả bài viết, mắc một chứng ốm vặt vốn vẫn gây buồn phiền cho 25% số nhà báo và khiến 1/5 số này nói ra những cái rõ dớ dẩn.41 Cô ta không có khả năng xét đoán về tỷ lệ. Đứng trước các con số rất to hoặc rất nhỏ, những người mắc chứng ốm vặt này mất hết khả năng xét đoán xem chúng có hợp lý không.
41 Nếu Hiệp hội Y khoa Anh chẳng giỏi bịa các số liệu lắm, thì tôi cũng không hơn gì. (TG)
Tất cả chúng ta đều mắc chứng ốm vặt này khi gặp phải những vấn đề ngoài phạm vi quen thuộc. 40 tỷ đô-la để mua một tàu vũ trụ là một giá hời, hay như thế thì hơi cao nhỉ? Phần lớn chúng ta sẽ mù tịt. Liệu 1/100 của giây có phải khoảng thời gian hợp lý để một xung lực điện đi qua một khớp thần kinh trong não? Trừ phi là chuyên gia về tế bào não, chúng ta cũng sẽ mù tịt thôi. Còn những cái chết vì chứng biếng ăn ở phụ nữ trẻ? Chà, 2% chẳng phải nhiều nhặn gì. Và nếu chỉ 1/5 số đó tử vong, sẽ là con số rất khiêm tốn: 0,4%. Xem chừng hợp lý, phải không?
Thông thường, 0,4% là con số hết sức nhỏ. Tuy nhiên, trong trường hợp xét tới tỷ lệ tử vong ở nữ thanh niên, nó lại vô cùng lớn. Nữ giới hiếm khi chết trẻ. Nam giới chết trẻ nhiều hơn chút ít. Nhưng, nói một cách tương đối, cái chết có khả năng cao ở tuổi già. Đó là điều bạn hẳn hy vọng Hiệp hội Y khoa Anh và tờ Thời báo biết đến, và có lẽ họ cũng biết đến theo một nhận thức chung nào đấy. Cơ mà một con số hết sức nhỏ như 0,4% hoàn toàn không làm rung chuông báo động.
Nếu những con số nhỏ thực tế có thể là lớn, thì những con số lớn thực tế có thể là nhỏ. Mỗi năm, thông báo về lợi nhuận của ngân hàng Barclays lại gây ra một bài xã luận đầy căm phẫn. “Ba tỷ bảng tiền lãi! Và họ vẫn đóng cửa các chi nhánh, sa thải nhân viên. Những kẻ tham lam khốn nạn!” Bài xã luận này bỏ qua cái thực tế là Barclays là một doanh nghiệp rất lớn với hàng nghìn cổ đông. Không có duy nhất kẻ tham lam khốn nạn nào hưởng cả ba tỷ bảng ấy. Năm 2002, ba tỷ bảng chỉ là khoản lãi 15% cho các cổ đông đầu tư vào ngân hàng này. Đấy là một khoản lãi hợp lý trong thời buổi khó khăn hiện nay, chứ khó có thể là một khoản lãi đáng hổ thẹn.
Sai lầm giống hệt vậy cũng xuất hiện khi bạn nghe thấy tất cả những con số khủng khiếp về chi phí khắc phục thiệt hại sau một cơn bão, giá trị kinh tế của việc tham gia vào khu vực đồng Euro, v.v... Một khoản chi phí hoặc lợi ích trải cho biết bao nhiêu cá nhân được đem cộng lại thành một con số duy nhất, lớn phát sốc. Để khắc phục thiệt hại sau bão có thể phải mất tới 150 triệu đô-la - một con số khủng khiếp, nhưng 10 triệu người nộp thuế ở Florida sẽ cùng đóng góp, mỗi người sẽ chịu một khoản ít khủng khiếp hơn hẳn - 15 đô-la. Việc tham gia vào khu vực đồng Euro thực sự có thể làm tăng tổng sản phẩm quốc nội của Anh lên ba tỷ bảng mỗi năm, theo báo cáo mới đây do Bộ Tài chính cung cấp. Tuy nhiên, có 60 triệu người tham gia vào nền kinh tế này, vậy mỗi năm mỗi người sẽ chỉ hưởng lợi ích thêm 50 bảng, hay tương đương 1 bảng/tuần.42
42 Tôi tham khảo nhận xét này ở một bài xã luận của Anatole Kaletsky đăng trên tờ Thời báo, 10/6/2003. (TG)
Tất cả mọi người đều thích thú cảm giác sốc trước những số liệu kinh hoàng. Nhưng bạn phải có thể tin tưởng vào những số liệu ấy; niềm thích thú sẽ tan thành mây khói khi bạn khám phá ra rằng chúng là rởm. Trong lòng tôi, khoảnh khắc phấn chấn ngắn ngủi trước thông tin về tình trạng lăng nhăng của phụ nữ Anh ở Tây Ban Nha chẳng còn nữa khi tôi khám phá ra sự lựa chọn nhóm mẫu thiếu tính tin cậy. Nếu tôi đừng để ý chuyện nhóm mẫu không đủ tính đại diện, tôi sẽ có thể hào hứng với cái thực tế được khẳng định mà không được chứng minh kia lâu hơn. Không hay biết gì thì không phải băn khoăn, như người ta vốn vẫn nói. Tuy nhiên, tôi tự an ủi mình bằng việc đã không phí tiền mua vé máy bay đi Tây Ban Nha. Thiếu hiểu biết cũng có thể khiến bạn đâm tốn kém.
Đấy là giá trị thực của việc học cách nhìn xuyên thấu các số liệu rởm. Bạn sẽ không sai lầm mà hành động theo các số liệu ấy, bay sang Tây Ban Nha với ảo tưởng được tận hưởng những chuyện ái ân dễ dãi hay ủng hộ những chính sách không đâu vào đâu.