Xu hướng của những cỗ máy mới này là thay thế khả năng phán đoán của con người ở mọi cấp độ nhưng ở mức khá cao, thay vì thay thế năng lượng và sức mạnh của con người bằng năng lượng và sức mạnh của máy móc.
— Norbert Wiener, 1949
CÁCH ĐÂY KHOẢNG 20 NĂM, CÁC DOANH NGHIỆP TRÊN TOÀN THẾ GIỚI đã giải quyết sự phân chia công việc giữa con người và máy tính theo cách có vẻ khá hợp lý. Máy móc sẽ thực hiện các công việc liên quan đến toán học cơ bản, lưu trữ hồ sơ và truyền dữ liệu. Điều này sẽ giúp con người thoải mái trong việc đưa ra quyết định, thực thi phán đoán, sử dụng sự sáng tạo, trực giác và tương tác với nhau để giải quyết vấn đề và chăm sóc khách hàng.
TỪ KHO GIẤY TỜ SỔ SÁCH ĐẾN QUAN HỆ CỘNG TÁC TIÊU CHUẨN
Phương pháp này hiện nay đã phổ biến đến mức thật khó để nhớ lại thời đại của giấy tờ trước đây, khi các xe đẩy chất đầy hồ sơ giấy tờ đi lại giữa từng người và từng phòng ban. Một điều phiền phức thời đó đã xuất hiện trở lại tại “Kho giấy tờ”, một cơn ác mộng về Quản lý nhân sự kém hiệu quả của chính phủ Mỹ. Các trang web được tạo ra để xử lý các thủ tục hành chính cần thiết khi một nhân viên liên bang nghỉ hưu. Tuy nhiên, vì các bước này chưa được vi tính hóa, nên các tác vụ thông thường cần đến 600 người cùng làm việc trong một căn phòng có diện tích như một siêu thị với đầy các tủ chứa hồ sơ cao ngất ngưởng; vì những lý do kỳ dị, căn phòng này nằm sâu hơn 60m dưới lòng đất trong một mỏ đá vôi cũ. Trở lại năm 1977, thời gian trung bình để hoàn tất các thủ tục giấy tờ (theo nghĩa đen) cho nhân viên liên bang nghỉ hưu mất khoảng 61 ngày. Ngày nay, dù sử dụng các quy trình cơ bản giống nhau, chúng vẫn cần đến 61 ngày. Tiểu bang Texas, nơi đã số hóa quy trình của mình, hiện đang thực hiện công việc này chỉ trong hai ngày.
Kế hoạch trì tuệ chi tiết để tấn công vào các kho giấy tờ trên thế giới được đề cập trong cuốn Reengineering the Corporation (Tái lập Công ty), của hai tác giả Michael Hammer và James Champy, xuất bản năm 1993. Cuốn sách đã đạt được thành công vang dội với hơn 2 triệu bản được bán ra trên khắp thế giới và được Tạp chí Time bình chọn là một trong 25 cuốn sách kinh doanh có ảnh hưởng nhất mọi thời đại.
Thông điệp cơ bản của Hammer và Champy là các công ty nên nghĩ rằng họ không thực hiện các nhiệm vụ giữa các bộ phận với nhau (ví dụ như mua nguyên liệu thô trong bộ phận mua hàng), mà thay vào đó là thực hiện các quy trình kinh doanh, như tiếp nhận, lắp ráp và vận chuyển đơn đặt hàng của khách hàng, thành một chuỗi đi xuyên qua các bộ phận. Điều này nghe có vẻ rõ ràng, nhưng tại thời điểm đó nó được coi là mới lạ và khá quan trọng. Peter Drucker, chuyên gia kinh doanh xuất sắc của thế kỷ XX, cho biết: “Tái cấu trúc là điều rất mới, và nó phải được thực hiện.” Các mô hình theo quy trình thường bao gồm nhiều nhiệm vụ không cần thiết và cần phải loại bỏ, hoặc như Hammer và Champy cho rằng nên xóa sạch những khâu rườm rà đó.
Phong trào tái cấu trúc quy trình kinh doanh được đẩy nhanh vào giữa những năm 1990 bởi hai tiến bộ: hệ thống thông tin toàn doanh nghiệp và World Wide Web (mạng lưới toàn cầu). Trước khi hệ thống doanh nghiệp xuất hiện1, các công ty thường có rất nhiều phần mềm riêng biệt, và nhiều trong số đó không được liên kết với nhau. Công ty càng lớn, các phần mềm đó càng lộn xộn. Các hệ thống doanh nghiệp đã thực hiện lời hứa thay thế mớ bòng bong đó bằng một phần mềm lớn duy nhất2 được thiết kế đồng bộ để thực hiện một tập hợp các quy trình kinh doanh đa chức năng cụ thể. Phần mềm này có thể được mua trên thị trường từ các nhà cung cấp như SAP và Oracle, sau đó được cài đặt và tùy chỉnh ở các mức độ.
1. Các hệ thống doanh nghiệp sớm được biết đến bởi TLAs (three-letter acronyms - từ viết tắt của ba chữ cái đầu): ERP (enterprise resource planning – hoạch định nguồn lực doanh nghiệp), SCM (supply chain management – quản trị chuỗi cung ứng), CRM (customer relationship management – quản lý quan hệ khách hàng), HRM (human resource management – quản trị nguồn nhân lực),… (TG)
2. Hoặc, để chính xác hơn, là một vài phần mềm. Ngay cả các nhà cung cấp phần mềm cho doanh nghiệp tự tin nhất cũng cho rằng một hệ thống duy nhất sẽ đáp ứng mọi thứ mà một công ty cần. (TG)
Hệ thống doanh nghiệp nhanh chóng phát triển; theo ước tính, hơn 60% doanh nghiệp trong danh sách Fortune 1000 đã áp dụng ít nhất một trong số những phần mềm đó vào năm 1999. Và trong khi chúng có thể khá tốn kém và mất thời gian để cài đặt và bảo trì, họ vẫn thực hiện lời hứa của mình. Một nghiên cứu của Erik và các đồng nghiệp là Sinan Aral và D. J. Wu đã phát hiện ra các công ty đã áp dụng phần mềm đều có cải thiện đáng kể về năng suất lao động, doanh thu hàng tồn kho và sử dụng tài sản khi họ bắt đầu sử dụng hệ thống doanh nghiệp mới.
Sự ra đời của World Wide Web đã mở rộng phạm vi và sức mạnh của các hệ thống doanh nghiệp tới người tiêu dùng cá nhân thông qua máy tính của họ (và sau đó là máy tính bảng và điện thoại thông minh). Web ra đời vào năm 1989 khi Tim Berners-Lee phát triển một bộ giao thức cho phép đưa các phần nội dung trực tuyến như văn bản và hình ảnh liên kết với nhau vào siêu văn bản được học giả khoa học và kỹ thuật Vannevar Bush mô tả lần đầu tiên vào năm 1945 (về mặt lý thuyết là sử dụng vi phim) và người có tầm nhìn xa về máy tính Ted Nelson, với dự án Xanadu chưa từng được ra mắt.
Web nhanh chóng biến Internet từ một mạng chỉ có văn bản thành một mạng có thể xử lý hình ảnh, âm thanh và các dữ liệu khác. Kỳ quan đa phương tiện này, phong phú và dễ điều hướng hơn bất kỳ hệ thống nào trước đây, đã trở thành xu hướng chủ đạo vào năm 1994 khi Netscape phát hành trình duyệt web thương mại đầu tiên, có tên là Navigator. (Một trong những nhà đồng sáng lập của Netscape là Marc Andreessen, một lập trình viên 22 tuổi đã làm việc với các trình duyệt web trước đó. Chúng ta sẽ biết nhiều hơn về điều này từ Andreessen trong Chương 11.)1 Nó đồng nhất với việc thương mại hóa Internet, mà trước đây chủ yếu trong lĩnh vực học thuật.
1. Để công nhận công trình phát minh ra Web, Berners-Lee được Nữ hoàng Anh Elizabeth phong tước Hiệp sĩ, Huân chương Đế quốc Anh (KBE) vào năm 2004. Andreessen là một trong những người giành Giải thưởng Nữ hoàng Alizabeth về Kỹ thuật năm 2013. (TG)
Web cho phép các công ty mở rộng quy trình kinh doanh vượt ra khỏi bốn bức tường của công ty và cung cấp mọi cách thức để tiếp cận người tiêu dùng – xu hướng này được gọi là thương mại điện tử. Mọi người bắt đầu sử dụng web không chỉ để tìm kiếm và tìm hiểu về một sản phẩm của một công ty, mà còn để đặt hàng và thanh toán. Sự kết hợp hiệu quả và thuận tiện này đã chứng minh sức hấp dẫn của web. Chỉ 10 năm sau khi Netscape ra mắt, thương mại điện tử chiếm khoảng 10% doanh số bán lẻ phi thực phẩm, không tự động tại Mỹ.
Sau đó, trong hai thập kỷ, các hệ thống doanh nghiệp được web hỗ trợ đã tạo điều kiện cho rất nhiều quy trình kinh doanh bằng cách thực hiện các công việc thường ngày: theo dõi số dư tài khoản và giao dịch, tính toán đúng số lượng và thời gian cho việc vận chuyển nguyên liệu, chuyển lương cho nhân viên, cho phép khách hàng lựa chọn và trả tiền cho các sản phẩm,...
Mọi người nên sử dụng khả năng phán đoán của mình
Nhân viên nên làm gì khi các công nghệ như phần mềm doanh nghiệp và World Wide Web giúp họ thoát khỏi “kho giấy tờ”? Hammer và Champy đã đưa ra một câu trả lời rõ ràng trong cuốn Tái lập Công ty: Dù máy tính giúp chúng ta xử lý công việc hằng ngày, mọi người vẫn nên được trao quyền để thực hiện khả năng phán đoán của mình. “Hầu hết các công việc kiểm tra, đối chiếu, chờ đợi, quan sát, theo dõi – các công việc không hiệu quả – đã được loại bỏ thông qua tái cấu trúc… Cần phải trao quyền cho những người làm việc trong một quy trình tái cấu trúc. Là thành viên của quy trình, cả hai đều được phép và bắt buộc phải suy nghĩ, tương tác, sử dụng phán đoán và đưa ra quyết định.
Đây là một tuyên bố rõ ràng về một niềm tin chung rằng: ngay cả trong một thế giới chỉ toàn phần cứng, phần mềm và mạng, khả năng phán đoán của con người vẫn luôn được đánh giá cao – khả năng suy luận của họ vượt ra ngoài việc thực hiện các tính toán vẹt trên dữ liệu có sẵn. Hầu hết chúng ta chấp nhận rằng nếu tất cả những gì con người có thể hoàn thành chỉ là các nhiệm vụ đơn giản, tầm thường, thì bây giờ chúng ta có thể sẽ nghỉ việc vì máy tính làm việc này tốt hơn rất nhiều. Nhưng hầu hết chúng ta cũng tin rằng con người có khả năng cung cấp nhiều hơn những gì mà các công nghệ kỹ thuật số có thể, ngay cả khi chúng tiếp tục tạo ra lợi nhuận từ định luật Moore – sự tăng trưởng đáng kể, nhanh chóng theo thời gian về số lượng phần cứng máy tính có sẵn với cùng một mức kinh phí – và trở nên mạnh hơn theo cấp số nhân.
Trên thực tế, một nghiên cứu trong nhiều thập kỷ đã xác nhận ý tưởng mà chúng ta thực hiện suy luận theo hai cách khác nhau. Công trình đột phá này đã giúp Daniel Kahneman, người tiên phong trong lĩnh vực Kinh tế học Hành vi, nhận giải Nobel Kinh tế cùng với cộng tác viên Amos Tversky.1 Công trình của Kahneman và các đồng sự đã cho thấy tất cả chúng ta đều có hai chế độ suy nghĩ, mà ông gắn nhãn là Hệ thống 1 và Hệ thống 2.2 Hệ thống 1 khá nhanh, tự động, tiến hóa từ lịch sử và đòi hỏi ít nỗ lực; nó liên kết chặt chẽ với những gì chúng ta gọi là trực giác. Hệ thống 2 thì ngược lại: chậm, có ý thức, tiến hóa gần đây và bao gồm rất nhiều công việc. Như Kahneman đã viết trong cuốn sách Thinking, Fast and Slow (Tư duy nhanh và chậm)3:
1. Với công trình của mình, Kahneman là người không thuộc ngành kinh tế đầu tiên nhận giải Nobel Kinh tế. (TG)
2. Các nhãn “Hệ thống 1” và “Hệ thống 2” được chủ định diễn tả một cách trung lập và thông thường, để không làm dấy lên những bất đồng và tranh luận lâu dài xung quanh những vấn đề khác. (TG)
3. Cuốn sách được Alpha Books mua bản quyền và phát hành năm 2014. (BTV)
Hệ thống 1 hoạt động tự động và nhanh chóng, ít hoặc không đòi hỏi nỗ lực và không có ý thức tự kiểm soát. Hệ thống 2 phân bổ sự chú ý đến các hoạt động tinh thần đòi hỏi nỗ lực, bao gồm các tính toán phức tạp. Các hoạt động của Hệ thống 2 thường gắn liền với trải nghiệm chủ quan của cơ quan, sự lựa chọn và sự tập trung.
Cả hai hệ thống đều có thể được cải thiện theo thời gian. Hệ thống 2 được cải tiến bằng cách tham gia một khóa học về toán học hoặc logic, trong khi Hệ thống 1 ngày càng trở nên tốt hơn một cách tự nhiên và khái quát hơn, chỉ bằng kinh nghiệm trong cuộc sống và những ví dụ trực quan. Theo thời gian, lính cứu hỏa phát triển trực giác về cách lửa lan qua tòa nhà, các nhà quản lý nhân sự trau dồi trực giác về người phù hợp với công ty bằng cách phỏng vấn nhiều ứng viên, và người chơi cờ vây sẽ trở thành bậc thầy bằng cách chú tâm vào trò chơi. Tất nhiên, hai hệ thống có thể và nên được cải thiện song song với nhau. Các nhà nghiên cứu Bệnh lý học, các chuyên gia chẩn đoán bệnh cải thiện các kỹ năng của họ bằng cách nghiên cứu hóa sinh và quan sát nhiều ví dụ ở cả mô bị bệnh và mô khỏe mạnh. Việc học thường sâu hơn và nhanh hơn khi tất cả chúng ta đều hiểu các nguyên tắc cơ bản và khởi tạo chúng bằng các ví dụ hấp dẫn.
Phong cách chủ đạo của đào tạo kinh doanh là kết hợp cả hai hệ thống. Sinh viên trường kinh doanh mài giũa kỹ năng Hệ thống 2 thông qua các khóa học kế toán, tài chính và kinh tế vi mô. Họ cũng thảo luận rất nhiều các nghiên cứu tình huống về tinh thần kinh doanh, lãnh đạo, đạo đức và các lĩnh vực khác để cải thiện trực giác và kỹ năng phán đoán của Hệ thống 1. Có nhiều lớp học kết hợp cả hai phương pháp này. Các trường y và trường luật cũng áp dụng phương pháp tương tự.
Phát hiện cuối cùng về Hệ thống 1 và Hệ thống 2 là khả năng của mỗi người rất khác nhau. Một số người trong chúng ta rất giỏi trong việc giải các phương trình và các vấn đề phức tạp nhưng lại thiếu trực giác và sự nhanh nhạy trong “thế giới thực”. Số khác thì lại không thể thực hiện các phép toán một cách chắc chắn nhưng có trực giác vô cùng tuyệt vời.
Khi công nghệ ngày càng phổ biến, những người thuộc nhóm thứ hai sẽ không gặp phải bất lợi. Trên thực tế, họ còn phát triển mạnh; máy tính làm tất cả các công việc về logic, dựa trên quy tắc, do đó họ được giải phóng khỏi những việc mà Hammer và Champy đề cập: thực hiện phán đoán, đưa ra quyết định và tương tác với người khác để giải quyết vấn đề, nắm bắt cơ hội và chăm sóc khách hàng.
Thực tế, dường như trong phần lớn thế giới kinh doanh ngày nay, Hệ thống 1 đã lên ngôi. Một cựu CEO đã viết hai cuốn sách với tiêu đề Straight from the Gut (tạm dịch: Chân thật từ bản năng) và Tough Choices (tạm dịch: Lựa chọn khó khăn). “Nhà kỹ trị” ngay lập tức đã trở thành một thuật ngữ chuyên sâu dành cho một nhà lãnh đạo quá tập trung vào dữ liệu mà không quan tâm đến sự phức tạp của thế giới thực. Cuốn sách xuất bản năm 2010, Rethinking the MBA: Business Education at a Crossroads (tạm dịch: Xem xét lại bằng MBA: Đào tạo kinh doanh ở ngã tư đường), đã xác định: “xây dựng phán đoán và trực giác trong các tình huống lộn xộn, không có cấu trúc” là một trong những nhu cầu không được đáp ứng chính của các chương trình MBA1. Lập luận này cũng phù hợp với quan điểm trong cuốn Tái lập Công ty: cho phép mọi người phát triển và thực hiện trực giác cũng như phán đoán để đưa ra quyết định thông minh, trong khi máy tính thực hiện các công việc về toán học và lưu giữ hồ sơ. Chúng tôi đã nghe và thấy sự phân công lao động giữa trí tuệ và máy móc thường xuyên đến mức chúng tôi gọi đó là “Quan hệ cộng tác tiêu chuẩn”.
1. Chương trình đào tạo Thạc sĩ Quản trị Kinh doanh. (BTV)
…Trừ trường hợp nó quá tồi tệ
Quan hệ cộng tác tiêu chuẩn rất hấp dẫn, nhưng đôi khi nó không hoạt động tốt. Việc hoàn toàn thoát khỏi những phán đoán của con người – ngay cả những người có kinh nghiệm và uy tín cao nhất – và chỉ dựa vào những con số có công thức thường mang lại kết quả tốt hơn.
Đây là một kết quả hoàn toàn trái ngược. Và nó cũng là một điều không phổ biến, vì lý do rất rõ ràng. Vì vậy, chúng ta cần phải hoàn toàn ủng hộ nó. Tuy nhiên, trước khi làm điều đó, chúng ta nên nhấn mạnh rằng Hệ thống 1 không phải không có giá trị trong kinh doanh. Thật sự, nó còn có giá trị to lớn. Chúng ta sẽ thấy rằng trực giác, khả năng phán đoán và tư duy nhanh của con người vẫn đóng vai trò quan trọng, và các công ty hàng đầu đang sử dụng chúng theo những cách mới lạ và khác thường – hướng đến sự hợp tác mới mẻ và sự cải tiến giữa trí tuệ và máy móc.
Nhưng trước tiên, chúng ta phải chứng minh một số khuyết điểm của Hệ thống 1. Hãy xem xét các nghiên cứu đột phá dưới đây, chúng đã nêu lên những hạn chế đáng kể của khả năng phán đoán và trực giác của con người.
• Giáo sư Xã hội học Chris Snijder đã sử dụng 5.200 giao dịch mua thiết bị máy tính của các công ty Hà Lan để xây dựng một mô hình toán học dự đoán sự tuân thủ ngân sách, giao hàng kịp thời và sự hài lòng của người mua đối với mỗi giao dịch. Sau đó, ông đã sử dụng mô hình này để dự đoán kết quả cho một nhóm các giao dịch diễn ra ở một số ngành khác nhau và cũng yêu cầu một nhóm các nhà quản lý mua hàng trong các lĩnh vực này thực hiện điều tương tự. Mô hình Snijder đã đánh bại các quản lý, ngay cả những người khá nhất. Ông cũng nhận thấy rằng các quản lý kỳ cựu không hoàn toàn làm tốt hơn người mới, và nói chung, khả năng xem xét các giao dịch của các quản lý không tốt hơn so với những người ở vị trí khác.
• Giáo sư Kinh tế Orley Ashenfelter đã xây dựng một mô hình đơn giản – sử dụng bốn biến số có thể truy cập công khai về thời tiết để dự đoán thành công chất lượng và giá của rượu vang Bordeaux trước khi uống. Giá của các loại rượu vang còn mới này trong lịch sử đã bị ảnh hưởng mạnh mẽ bởi ý kiến của các chuyên gia rượu vang, nhưng Ashenfelter đã viết rằng: “một trong những vấn đề thú vị nhất được đưa ra bởi [nghiên cứu như vậy] là vai trò của các ý kiến từ các chuyên gia trong việc xác định giá rượu… Có bằng chứng cho thấy ý kiến từ các chuyên gia không liên quan (nghĩa là trực giao) đến các yếu tố cơ bản quyết định đến chất lượng rượu vang… Điều này đặt ra câu hỏi chưa có lời giải đáp về việc xác định tầm quan trọng của ý kiến chuyên gia.”
• Erik đã làm việc với Lynn Wu, hiện là Giáo sư tại Trường Wharton, để phát triển một mô hình đơn giản dự đoán doanh số và giá bán nhà. Họ đã sử dụng dữ liệu từ Google Trends, báo cáo mức độ thường xuyên của các từ như “đại lý bất động sản”, “khoản vay mua nhà”, “giá nhà” và những thứ tương tự được tìm kiếm hằng tháng trong một năm với 50 tiểu bang của Mỹ. Họ đã sử dụng mô hình của mình để dự đoán doanh số bán nhà trong tương lai và so sánh dự báo của họ với các dự đoán được công bố bởi các chuyên gia tại Hiệp hội Môi giới Bất động sản Quốc gia Mỹ. Khi có kết quả, mô hình của họ đã đánh bại các chuyên gia với con số đáng kinh ngạc là 23,6%, phản ánh sức mạnh của việc kết hợp dữ liệu tìm kiếm của Google vào mô hình dự đoán.
▶ Một dự án riêng của Erik đã tiếp cận lĩnh vực nhà ở, phát triển mô hình kiểu Moneyball1 cho giới học thuật. Ông đã làm việc với Dimitris Bertsimas, John Silberholz và Shachar Reichman, tất cả đều đang làm việc tại MIT, để dự đoán ai sẽ được làm việc tại các trường đại học hàng đầu. Họ đã xem xét dữ liệu lịch sử trên các hồ sơ xuất bản trước đây và các mẫu trích dẫn của các học giả trẻ, đồng thời sử dụng một số khái niệm từ lý thuyết mạng để xem xét hồ sơ nào đã viết về công việc có sức ảnh hưởng và tác động nhất. Họ đã hiệu chỉnh mô hình của mình để đưa ra dự đoán cuối cùng học giả nào sẽ được làm việc trong lĩnh vực nghiên cứu hoạt động. Mô hình của họ đồng ý 70% về thời gian với các ủy ban nhiệm kỳ, nhưng họ không đồng ý rằng dự đoán của mô hình đã đưa ra một nhóm các học giả trong tương lai là những người đã có nhiều bài báo được công bố trên các tạp chí và nghiên cứu hàng đầu, được trích dẫn thường xuyên hơn các học giả thực sự được lựa chọn bởi các ủy ban nhiệm kỳ.
1. Tên một bộ phim của đạo diễn Bennett Miller. Bộ phim miêu tả lại toàn bộ nỗ lực của nhân vật Billy Beane – Giám đốc Điều hành câu lạc bộ Oakland Athletics – để vực dậy đội bóng chày đang gặp thất bại nặng nề của mình. (BTV)
▶ Một nghiên cứu của Shai Danzinger và các đồng nghiệp đã chỉ ra rằng các thẩm phán Israel thường có xu hướng tạm tha khi bắt đầu một ngày mới và sau thời gian nghỉ ăn trưa. Và ngay trước khi các thẩm phán nghỉ giải lao – khi họ có lẽ mệt mỏi hoặc lượng đường trong máu xuống thấp – có nhiều khả năng họ sẽ đề nghị tiếp tục tuyên án phạt tù. Nghiên cứu khác ủng hộ ý kiến cho rằng các quyết định tư pháp thường bị ảnh hưởng bởi các yếu tố bên ngoài vụ kiện. Các nhà kinh tế học Ozkan Eren và Naci Mocan phát hiện ra rằng tại một tiểu bang của Mỹ, các thẩm phán tốt nghiệp từ một trường đại học nổi tiếng trong khu vực đã có những lời lẽ khắc nghiệt hơn ngay sau khi trường cũ của họ bất ngờ thua trong một trận bóng đá, và rằng những câu nói đó “đã khiến các bị cáo người da đen phải gánh chịu rất nhiều”.
ffTại học khu Hạt Broward, Florida, bước đầu tiên để xác định con cái có năng khiếu hay không xuất phát từ đề cử của cha mẹ hoặc giáo viên. Hầu hết các học sinh ở Broward là người dân tộc thiểu số, nhưng 56% trẻ em trong các chương trình dành cho học sinh có năng khiếu là người da trắng. Trong thập kỷ đầu tiên của thế kỷ XXI, học khu đã quyết định chuyển đổi phương pháp chủ quan, và thay vào đó là cố gắng tạo nên phương pháp có hệ thống và khách quan nhất có thể. Họ đã cho mọi trẻ em trong khu vực kiểm tra IQ phi ngôn ngữ. Kết quả của thay đổi này, theo tài liệu của hai nhà kinh tế học David Card và Laura Giuliano là vô cùng ấn tượng: hơn 80% người Mỹ gốc Phi và hơn 130% sinh viên gốc Tây Ban Nha được xác định là có năng khiếu.
ffHai Giáo sư Luật là Ted Ruger và Pauline Kim, cùng với hai nhà chính trị học Andrew Martin và Kevin Quinn, đã tiến hành một thử nghiệm để xem liệu mô hình sáu biến đơn giản do Martin và Quinn phát triển có thể dự đoán phán quyết của Tòa án Tối cao Mỹ trong nhiệm kỳ 2002 tốt hơn một nhóm gồm 83 luật sư nổi tiếng hay không. 38 trong số các luật sư này đã làm thư ký cho một thẩm phán Tòa án Tối cao, 33 người trong số đó là giáo sư luật, và sáu người đang và từng là trưởng khoa Luật. Tính trung bình, các dự đoán của nhóm này, phù hợp với ít hơn 60% các phán quyết của tòa án. Thuật toán đúng 75% trong số đó.
Danh sách trên đây đã điển hình và hợp lý chưa? Hay là chúng ta đang cố tình, hoặc thậm chí vô tình, tập trung vào các trường hợp khi sự phán đoán của con người đã bị mất đi theo phương pháp tiếp cận dựa trên dữ liệu thuần túy và bỏ qua các ví dụ về sự vượt trội của con người? Một cơ quan nghiên cứu đã chỉ ra rằng chúng ta không thể làm điều này.
Một nhóm được dẫn đầu bởi nhà tâm lý học William Grove đã trải qua 50 năm tìm kiếm những ví dụ được công bố, thẩm định về các so sánh trực tiếp giữa dự đoán lâm sàng và dự đoán thống kê (nghĩa là, giữa phán đoán của người có kinh nghiệm, “chuyên gia” và phương pháp tiếp cận dựa trên 100% dữ liệu) trong lĩnh vực tâm lý học và y học. Họ đã tìm thấy 136 nghiên cứu, bao gồm tất cả mọi lĩnh vực, từ dự đoán IQ đến chẩn đoán bệnh tim. 48% trong số chúng không có sự khác biệt đáng kể giữa hai nhóm; hay nói cách khác, các chuyên gia cộng lại cũng không làm tốt hơn các công thức.
Một cú đánh có tác động lớn hơn vào khái niệm về sự vượt trội của con người trong khả năng phán đoán xuất phát từ việc phát hiện ra rằng trong 46% nghiên cứu được xem xét, các chuyên gia đã thật sự thua kém đáng kể so với các con số và công thức. Điều này có nghĩa là con người chỉ vượt trội trong 6% các trường hợp đó. Và các tác giả đã kết luận rằng trong hầu hết những nghiên cứu mà con người thực hiện tốt hơn, “các phán đoán lâm sàng nhận được nhiều dữ liệu hơn dự đoán cơ học”. Paul Meehl, nhà tâm lý học huyền thoại bắt đầu sự nghiệp vào đầu những năm 1950 để ghi chép và mô tả hồ sơ theo dõi ít ỏi về phán đoán của các chuyên gia, đã tóm tắt như sau:
Không có tranh luận nào trong ngành khoa học xã hội cho thấy một khối lượng lớn các nghiên cứu khác nhau về chất lượng đưa ra một cách thống nhất theo cùng một hướng như thế này [tính hợp lệ tương đối của phán đoán lâm sàng và thống kê]. Khi bạn đang đẩy mạnh 100 cuộc điều tra, đang dự đoán mọi thứ từ kết quả của các trận bóng đá đến chẩn đoán bệnh gan và khi bạn khó có thể đưa ra một nửa tá nghiên cứu chỉ ra xu hướng yếu hơn nghiêng về phán đoán lâm sàng, thì đã đến lúc bạn nên rút ra một kết luận thực tế.
Kết luận thực tế đó là chúng ta không nên dựa quá nhiều vào các đánh giá và dự đoán của chuyên gia.
Ngày càng có nhiều công ty Mỹ có cùng một kết luận. Làm việc với Cơ quan Thống kê Dân số Mỹ, Erik và Kristina McElheren, hiện là Giáo sư tại Đại học Toronto, đã khảo sát một mẫu đại diện 18.000 nhà máy sản xuất và thấy rằng áp dụng việc đưa ra quyết định dựa trên dữ liệu đang gia tăng nhanh chóng, được xúc tiến bởi việc sử dụng công nghệ thông tin ngày càng tăng. Các công ty đã áp dụng phương pháp này cũng cải thiện đáng kể về hiệu suất.
Mặc dù những ví dụ này rất hấp dẫn, nhưng chúng ta vẫn phải tiết chế những thành công về thuật toán với một số năng lực quan trọng. Để so sánh phán đoán của con người với một mô hình toán học, rõ ràng mô hình cần được tồn tại ngay từ đầu. Điều đó không phải lúc nào cũng có thể xảy ra, như Nghịch lý Polanyi đã đề cập. Các mô hình như vậy phải được kiểm tra và cải tiến trên các tập dữ liệu với nhiều ví dụ tương tự – một tình huống chỉ mô tả một tập hợp con của các quyết định mà con người phải đưa ra. Nhưng mô hình tổng thể rất rõ ràng: quá nhiều trường hợp cho thấy khi một mô hình được xây dựng và thử nghiệm, nó có xu hướng thực hiện tốt hoặc tốt hơn là các chuyên gia trong việc đưa ra các quyết định tương tự. Tuy nhiên, chúng ta vẫn phải tiếp tục dựa vào phán đoán của con người trong khi máy móc có thể làm tốt hơn.
TRÍ ÓC CON NGƯỜI: THÔNG MINH NHƯNG NHIỀU LỖ HỔNG
Làm thế nào để một cách tiếp cận chỉ dựa trên Hệ thống 2 – hệ thống bao gồm các tính toán lý trí và logic thuần túy được thực hiện dựa trên dữ liệu số, có thể tốt hơn một cách tiếp cận sử dụng cả Hệ thống 2 và Hệ thống 1 – một hệ thống sử dụng tư duy sâu sắc và bẩm sinh mà mọi người đều có? Dù sao đi nữa thì Hệ thống 1 đã đủ hiệu quả để giúp chúng ta tồn tại và vượt qua tất cả thử thách tiến hóa tàn nhẫn của Darwin1 (chúng ta vẫn tồn tại, tất cả 7,5 tỷ người). Vậy, tại sao hệ thống này có thể làm chúng ta thất vọng đến thế?
1. Charles Darwin (1809-1882): Nhà khoa học tự nhiên nổi tiếng với Học thuyết tiến hóa Darwin (Darwinism). Học thuyết chứng minh rằng, mọi loài sinh vật sinh ra không phải do Chúa, Trời, hay Thần Thánh mà đều xuất hiện, tiến hóa từ những tổ tiên chung qua quá trình chọn lọc tự nhiên. (BTV)
Những câu hỏi này không thể được giải quyết chỉ trong một cuốn sách, nói chi đến một chương. Nhưng trong cuốn Tư duy nhanh và chậm, Kahneman đã tóm tắt ngắn gọn về rất nhiều nghiên cứu (phần lớn trong số đó do ông thực hiện):
Do Hệ thống 1 hoạt động theo cơ chế tự động và chúng ta cũng không thể tắt nó theo ý muốn, nên các lỗi về suy nghĩ trực quan thường rất khó để ngăn chặn. Không phải lúc nào chúng ta cũng tránh được các sai số do Hệ thống 2 có thể không biết về lỗi này.
Tóm lại, Hệ thống 1 rất tuyệt vời nhưng nó vẫn còn nhiều lỗ hổng. Nó thường dùng các lối tắt thay vì suy luận một cách kỹ lưỡng. Và nó cũng có nhiều sai số đến mức đáng ngạc nhiên. Các nhà nghiên cứu làm việc trong ngành tâm lý học và kinh tế học hành vi đã xác định và đặt tên cho rất nhiều hạt sạn trong Hệ thống 1 nhờ phương pháp do Kahneman tìm ra.
Danh sách đầy đủ về chúng sẽ chỉ khiến cho bạn chán nản và thất vọng; cuốn sách The Art of Thinking Clearly (Nghệ thuật tư duy rành mạch) của Rolf Dobelli có 99 chương về chủ đề này và 175 bài (theo lần tính gần nhất) về “Danh sách các sai số nhận thức” của Wikipedia. Buster Benson – Quản lý sản phẩm tại công ty phần mềm Slack đã đưa ra một phương pháp tuyệt vời để nhóm những sai số này và hãy nhớ những vấn đề chúng đặt ra cho chúng ta:1
1. Chúng ta tích cực sàng lọc thông tin để tránh tình trạng quá tải… [Nhưng] một số thông tin bị sàng lọc và loại bỏ lại thực sự hữu ích và quan trọng.
2. Thiếu ý nghĩa gây nên sự khó hiểu, vì vậy chúng ta bổ sung và hoàn thiện… [Nhưng] việc tìm kiếm ý nghĩa có thể tạo nên các ảo tưởng. Đôi khi, chúng ta tưởng tượng ra các chi tiết từ giả định của bản thân, từ đó xây dựng ý nghĩa và câu chuyện không thực sự tồn tại.2
3. [Chúng ta] hành động nhanh vì sợ mất đi cơ hội, vì thế mà chúng ta nhanh chóng đi đến kết luận… [Nhưng] các quyết định vội vàng có thể có những sai sót nghiêm trọng. Một số phản ứng và quyết định mà chúng ta đưa ra nhanh chóng lại không công bằng, ích kỷ và gây phản tác dụng.
4. Điều này càng ngày càng khó, vì vậy chúng ta sẽ cố gắng ghi nhớ những thứ quan trọng… [Nhưng] bộ nhớ củng cố các lỗi. Một số thứ chúng ta ghi nhớ sau này chỉ làm cho tất cả các hệ thống ở trên chứa nhiều sai số hơn và gây bất lợi nhiều hơn cho quá trình tư duy của chúng ta.
1. Benson đã tìm ra cách phân loại này sau khi nghiên cứu danh sách các sai số nhận thức của Wikipedia khi ông được nghỉ phép do vợ sinh con, sau đó ông đã đăng chúng trên trên trang blog về các mẹo vặt cuộc sống của Better Humans (http://betterhumans.net). Đó là một ví dụ tuyệt vời về một tầm nhìn sâu sắc đến từ cộng đồng trực tuyến, một hiện tượng chúng ta sẽ thảo luận kỹ hơn trong phần ba của cuốn sách này. (TG)
2. Có một cái tên mỹ miều cho điều này: “Apopenia”. Các mô hình trong thống kê và học máy có thể mắc lỗi tương tự, trong trường hợp đó lỗi này thường được gọi là “quá khớp” với dữ liệu. (TG)
Chúng tôi muốn kêu gọi sự chú ý đến một vấn đề nghiêm trọng khác trong khả năng nhận thức của bản thân: không có cách nào để nhận biết khi nào Hệ thống 1 sẽ hoạt động tốt và khi nào vấn đề sẽ xảy ra. Nói cách khác, chúng ta có cái nhìn tệ hại về trực giác của chính mình. Chúng ta không biết liệu một phán quyết hay một quyết định nhanh chóng của bản thân có chính xác hay đã bị bóp méo bởi một hoặc nhiều sai số. Vì vậy, đi ngược với Nghịch lý Polanyi, chúng ta biết ít hơn những gì chúng ta có thể nói ra – và ít hơn về các sản phẩm mà Hệ thống 1 tạo ra. Các tính toán dựa trên lý trí của Hệ thống 2 thường có thể được kiểm tra lại lần nữa, nhưng Kahneman đã chỉ ra rằng Hệ thống 1 thực sự không thể làm được điều đó – cụ thể là bản thân chúng ta không thể.
Nghiên cứu gần đây đã tiết lộ một sai số sâu sắc cụ thể liên quan đến khía cạnh này của Nghịch lý Polanyi: Hệ thống 1 thường đưa ra kết luận, sau đó phác thảo để Hệ thống 2 giải thích. Nhà Tâm lý học Jonathan Haidt lập luận rằng: “Phán đoán và biện minh là hai quá trình riêng biệt.” Hành động phán đoán do Hệ thống 1 thực hiện xảy ra gần như ngay lập tức. Sau đó, nó biện minh bằng thứ ngôn ngữ hợp lý và lý trí do Hệ thống 2 đưa ra.1 Luận điệu này vẫn thường đánh lừa không chỉ những người khác mà ngay cả những người nghĩ ra nó. Theo hai nhà tâm lý học Richard Nesbitt và Timothy DeCamp Wilson, chúng ta thường “nói nhiều hơn những gì chúng ta biết.” Các hành vi mà chúng ta dán nhãn là hợp lý hóa và tự biện minh không phải lúc nào cũng là sự luyện tập cho việc ngụy biện. Về một phương diện nào đó, chúng đóng vai trò cơ sở: chúng là Hệ thống 1 ở chế độ đang hoạt động.
1. Trong cuốn The Happiness Hypothesis (Tạm dịch: Giả thuyết Hạnh phúc) của mình, Jonathan Haidt giải thích rằng: “Phát hiện này được gọi là ‘Chứng bịa chuyện’, điều mà người ta sẽ sẵn sàng thêu dệt nên những lý do để giải thích hành vi của chính họ. Chứng bịa chuyện thường xuyên xảy ra ở các bệnh nhân có não bị tách đôi (hai bán cầu não bị cắt đứt liên lạc với nhau) và những người bị tổn thương não đến mức [nhà tâm lý học Michael] Gazzaniga gọi các trung tâm ngôn ngữ ở bên não trái là mô-đun phiên dịch có nhiệm vụ thuyết minh cho bất cứ điều gì mà một người đang làm, mặc dù nó không biết được nguyên nhân thật sự hoặc động cơ của hành vi mà bản thân đang thực hiện. Ví dụ, nếu từ ‘đi’ lóe lên trong bán cầu não phải, bệnh nhân có thể đứng dậy và bỏ đi. Khi được hỏi lý do tại sao một người thức dậy, họ có thể nói: ‘Tôi sẽ lấy một lon coca cola.’ Mô-đun phiên dịch rất giỏi trong việc giải thích nhưng lại không biết nó đã làm như vậy.” (TG)
Năm 2006, Avinash Kaushik và Ronny Kohavi, hai chuyên gia phân tích dữ liệu làm việc tại Intuit và Microsoft lúc bấy giờ, đã đưa ra từ viết tắt HiPPO để tóm tắt phong cách đưa ra quyết định tại hầu hết các công ty. HiPPO là viết tắt của “highest-paid person’s opinion” – “ý kiến của người được trả lương cao nhất”. Chúng ta rất yêu thích và sử dụng cách viết tắt này thường xuyên bởi nó minh họa một cách sinh động một mối Quan hệ cộng tác tiêu chuẩn. Ngay cả khi các quyết định không được đưa ra bởi những người được trả lương cao nhất, chúng vẫn thường xuyên – quá thường xuyên – dựa trên ý kiến, phán đoán, trực giác, bản năng và Hệ thống 1. Có bằng chứng rất rõ ràng là cách tiếp cận này thường không hiệu quả và HiPPO rất thường xuyên phá hủy các giá trị.
HƯỚNG ĐẾN MỐI QUAN HỆ ĐỐI TÁC TRÍ ÓC - MÁY MÓC MỚI
Làm cách nào để chúng ta sử dụng hết kiến thức về sai số và các lỗ hổng trong Hệ thống 1 và Hệ thống 2? Làm thế nào để những kiến thức này có thể giúp chúng ta thông minh hơn trong việc đưa ra quyết định và quyết định một cách sáng suốt hơn? Cách tiếp cận rõ ràng nhất là cho phép máy móc đưa ra quyết định trong những tình huống và thời điểm chúng có thể, nghĩa là cho phép các các bản sao kỹ thuật số thuần túy của Hệ thống 2 – được xây dựng dựa trên định luật Moore và được duy trì bởi một dòng dữ liệu có sẵn – tìm ra câu trả lời mà không cần dữ liệu đầu vào từ Hệ thống 1. Theo thời gian, ngày càng có nhiều công ty sử dụng cách tiếp cận này.
“Nền kinh tế thứ hai” tự động
Một trong những ví dụ đầu tiên về việc ra quyết định hoàn toàn tự động mà chúng ta biết đã xuất hiện vào đúng thời điểm khởi đầu của thời đại điện toán doanh nghiệp, đó là sự phát triển điểm số phản ánh mức độ tín nhiệm của mọi người: khả năng hoàn nợ ở một quy mô nhất định. Đây rõ ràng là quyết định quan trọng được đưa ra bởi các chuyên viên thẩm định tín dụng làm việc tại các chi nhánh ngân hàng địa phương, họ đã đánh giá đơn xin vay vốn dựa trên kinh nghiệm bản thân, đôi khi kết hợp với các quy tắc hoặc hướng dẫn. Nhưng Bill Fair và Earl Isaac nghĩ rằng dữ liệu có thể thực hiện công việc này hiệu quả hơn. Họ thành lập Tập đoàn Fair Isaac vào năm 1956 và bắt đầu tính điểm tín dụng FICO.
Đánh giá điểm tín dụng tự động đã nhanh chóng trở thành tiêu chuẩn. Đến năm 1999, tờ American Banker báo cáo rằng “[Con người] không còn phải xem xét bất kỳ [yêu cầu vay vốn] nào với mức 50.000 đô-la hoặc thấp hơn nữa, máy tính đã làm toàn bộ công việc đó.” FICO và các công ty cùng ngành đã chứng minh năng lực dự đoán khả năng hoàn nợ rất đáng tin cậy, và vì khối lượng và độ đa dạng của thông tin kỹ thuật số về một người đã được mở rộng trong những năm gần đây, “dữ liệu khủng” này đã được sử dụng để nâng cao và mở rộng điểm tín dụng.
Các nhà phát triển điểm tín dụng phải đảm bảo rằng họ không tham gia vào việc tái cấu trúc kỹ thuật số – hành vi từ chối hoặc giảm số tiền cho vay một cách bất hợp pháp đối với các khu vực địa lý nhất định dựa trên chủng tộc hoặc dân tộc – nhưng nhìn chung, họ đang cung cấp một dịch vụ có giá trị bằng cách mở ra các cơ hội tín dụng cho nhiều người hơn và cho phép người cho vay tự tin mở rộng phạm vi kinh doanh. Và có bằng chứng cho rằng việc tái cấu trúc thật sự được giảm bớt khi các quyết định tín dụng trở nên tự động hơn. Vào năm 2007, Cục Dự trữ Liên bang Mỹ báo cáo mô hình chấm điểm tín dụng đã “hạn chế hành vi phân biệt đối xử bất hợp pháp... [và] có thể giúp làm giảm khả năng các quyết định cho vay bị ảnh hưởng bởi các đặc điểm mang tính cá nhân hoặc các yếu tố khác bị cấm theo luật, bao gồm chủng tộc hoặc sắc tộc.”
Ngày nay, có thể dễ dàng tìm thấy các ví dụ về quyết định chất lượng cao và tự động 100% ở xung quanh chúng ta. Amazon và các trang web thương mại điện tử khác đưa ra các đề xuất cho người mua hàng trong mỗi lần truy cập vào trang. Mặc dù nhiều đề xuất không đúng khách hàng mục tiêu, nhưng cũng có những đề xuất khác khá hấp dẫn. Chẳng hạn, Amazon ước tính rằng 35% doanh số bán hàng của họ là từ các hoạt động bán chéo như giới thiệu các mặt hàng. Giá của các chuyến bay và phòng khách sạn luôn thay đổi theo cách mà cung và cầu phát triển cũng như cách chúng thật sự thay đổi theo từng phút. Cách tiếp cận về giá này, hay còn gọi là quản lý doanh thu, đóng vai trò cực kỳ quan trọng đối với các công ty (chúng ta sẽ quay lại chủ đề này trong Chương 8), nhưng nó lại không mang lại hiệu quả đáng kể nếu bất kỳ mức giá nào được tạo ra, bởi thuật toán quản lý doanh thu do con người kiểm tra lại lần nữa trước khi mức giá đó được đề xuất cho khách hàng. Hàng hóa hữu hình hiện tại cũng phải chịu sự thay đổi giá tự động. Amazon và Walmart đã điều chỉnh giá lần lượt là 16% và 13% cho toàn bộ hàng tồn kho tại Mỹ sau ngày lễ Tạ ơn năm 2015.
Trên thực tế, có rất nhiều quyết định hoàn toàn tự động đang diễn ra xung quanh chúng ta, nhà kinh tế học Brian Arthur ví chúng như hình ảnh của một “nền kinh tế thứ hai”, trong đó các giao dịch diễn ra mà không có sự can thiệp của con người một cách “rộng rãi, lặng lẽ, có liên kết, vô hình và độc lập”. Nền kinh tế thứ hai tự động này đang xâm lấn nền kinh tế quen thuộc của con người theo thời gian bằng các thuật toán chiếm lĩnh từ các chuyên gia và HiPPO. Khi ngày càng có nhiều thông tin trên thế giới được số hóa, nó giúp cải thiện và chuyển việc đưa ra quyết định từ dựa trên trực giác sang dựa trên dữ liệu.
Các công ty quảng cáo không chỉ giúp khách hàng sáng tạo và thiết kế các quảng cáo mới mà còn tìm ra thời gian và địa điểm chính xác để chiếu quảng cáo: xác định chương trình truyền hình, thị trường theo vị trí địa lý hay thời điểm nào là tốt nhất và phù hợp với mục tiêu, ngân sách của nhà quảng cáo. Dữ liệu và công nghệ đã được sử dụng cho công việc này từ lâu – công ty sản xuất bộ phim truyền hình ăn khách Mad Men (tạm dịch: Gã điên) mua chiếc máy tính đầu tiên, IBM System 360, vào năm 1969 để các chương trình quảng cáo có nơi xuất hiện tốt hơn (và gây ấn tượng với khách hàng) – nhưng phần lớn mục đích này được thúc đẩy bởi phán đoán và quyết định của con người.
Trong khi công tác tại vị trí nhà phân tích cao cấp trong chiến dịch tái tranh cử thành công năm 2012 của Barack Obama, Dan Wagner đã nhận thấy khả năng dự đoán chính xác cao hơn và việc đó có lợi như thế nào. Wagner và các đồng nghiệp của ông đã xây dựng một danh sách cử tri ở Mỹ. Sử dụng học máy (một kỹ thuật chúng ta sẽ thảo luận nhiều hơn trong chương tiếp theo), nhóm chuyên gia phân tích của Obama đã tạo ra ba “điểm” riêng cho tất cả các cử tri trong danh sách: “điểm ủng hộ” dự đoán khả năng mỗi người sẽ ủng hộ Obama (so với đối thủ là ông Mitt Romney), “điểm bỏ phiếu” dự đoán khả năng mỗi người thực sự đi bầu cử và bỏ phiếu vào tháng 11, và “điểm thuyết phục” dự đoán khả năng yêu thích, ủng hộ Obama sau chiến dịch tuyên truyền của ông.
Trong nhiều năm, dữ liệu nhân khẩu học đã giúp dự đoán được rất nhiều điều cho mỗi tập phim truyền hình.Ví dụ, có bao nhiêu nam giới từ 18 đến 24 tuổi sống tại khu vực Denver xem chương trình phát lại của phim hoạt hình Family Guy lúc 10:00 tối thứ Ba. Những người mua quảng cáo và chiến lược gia truyền thông thường dựa rất nhiều vào thông tin này khi đưa ra quyết định. Nếu chiến dịch Obama năm 2012 muốn truyền tải thông điệp của mình đến đối tượng là nam giới độ tuổi từ 18 đến 24 sống tại Colorado, có rất nhiều công ty và người dân sẵn sàng tư vấn cho họ về việc có nên chạy quảng cáo trong các chương trình phát lại của phim hoạt hình Family Guy vào tối thứ Ba hay không.
Tuy nhiên, giống như hầu hết những người mua quảng cáo khác, nhóm phân tích của Obama biết rằng việc dựa vào nhân khẩu học là không chính xác. Đối tượng xem quảng cáo có thể là những người hết lòng ủng hộ Romney, hoặc những người đã quyết định bỏ phiếu cho Obama, và điều này thật lãng phí. Dựa trên dữ liệu nhân khẩu học có nghĩa là đang dựa vào các phán đoán và ước tính thô không khác gì đoán mò: rằng những nam giới từ 18 đến 24 tuổi được coi là một nhóm đối tượng trong cuộc bầu cử, hoặc là nhóm người xem Family Guy, hay phim hoạt hình nói chung sẽ dễ dàng tiếp nhận các thông điệp trong chiến dịch của Obama.
Wagner và các đồng nghiệp của ông nhận ra rằng danh sách toàn bộ cử tri đã giúp họ đi được nửa chặng đường trong việc chọn cách tiếp cận tốt hơn khi mua quảng cáo. Theo đó, chiến dịch có thể xác định hai nhóm người mà họ muốn tiếp cận nhất: nhóm thứ nhất là những người ủng hộ Obama – những người cần được thuyết phục để thực sự đi đến điểm bỏ phiếu và bỏ phiếu vào Ngày bầu cử; và nhóm thứ hai là những cử tri đang phân vân về Obama – có thể được thuyết phục để ủng hộ ông. Nhóm đầu là nhóm “Lực lượng ủng hộ” (“Get out the vote” – GOTV); nhóm thứ hai là “Những người có thể thuyết phục” (Persuadables). Nhóm chuyên gia phân tích thấy rằng các đối tượng trong cả hai nhóm có đặc điểm nhân khẩu học rất khác nhau, do đó, việc chọn chương trình chỉ dựa trên cơ sở nhân khẩu học sẽ bỏ sót những đối tượng mà họ muốn tiếp cận. Nhóm chuyên gia phân tích cũng nghiên cứu được từ các thử nghiệm ban đầu rằng hai nhóm phản ứng tốt với các loại quảng cáo khác nhau, vì vậy họ cần phân biệt các nhóm khi mua thời lượng quảng cáo trên các chương trình truyền hình.
Vào năm 2012, một số công ty đánh giá tỷ suất người xem đã thành công trong việc xác định cụ thể những cá nhân nào đang xem các chương trình truyền hình, thay vì chỉ thu thập dữ liệu nhân khẩu học.1 Đây chính xác là loại dữ liệu thứ hai mà Wagner và các đồng nghiệp cần. Họ đã đưa cho các công ty này danh sách nhóm Lực lượng ủng hộ và nhóm Những người có thể thuyết phục của chiến dịch, sau đó lấy lại thông tin về số lượng người trong mỗi nhóm đã xem mỗi chương trình.2 Điều này cho phép họ dễ dàng xác định các chương trình sẽ mang lại cho họ nhiều cử tri thuộc nhóm Lực lượng ủng hộ hoặc nhóm Những người có thể thuyết phục được tương xứng với số tiền bỏ ra để quảng cáo. Như Wagner đã nói: “Rốt cuộc chúng tôi đã mua chương trình đêm khuya trên TV Land, và điều này thực sự kỳ lạ. Nó chỉ bỗng dưng xuất hiện và lý do mà nó bỗng dưng xuất hiện là vì giá quá rẻ. Và những chương trình đó lại có rất nhiều cử tri thuộc nhóm Những người có thể thuyết phục, nên chúng tôi đã mua nó.”
1. Thông tin này được thu thập từ các hộp đen mà người dân đã đồng ý đặt trong nhà của họ. (TG)
2. Để bảo vệ quyền riêng tư, bên thứ ba đã xử lý quy trình đối sánh sao cho cả chiến dịch Obama và công ty đánh giá tỷ suất người xem đều không nhìn thấy các danh sách của nhau. (TG)
Sau cuộc bầu cử, Wagner đã thành lập một công ty có tên là Civis Analytics để chuyển đổi cách tiếp cận chủ yếu dựa trên dữ liệu thứ hai này thành sản phẩm và cung cấp cho các công ty, tổ chức khác. Ông tin rằng bây giờ là thời điểm thích hợp để đưa ra các sản phẩm của Civis, lý do chủ yếu là vì rất nhiều công ty có các danh sách rất phong phú về: khách hàng tiềm năng, khách hàng hiện tại có khả năng sẽ thực hiện thêm giao dịch,… Ông nói rằng: “Nếu bạn bán lốp xe hạng sang, thì có một bộ phận dân cư sẵn sàng chi nhiều tiền cho những chiếc lốp xe này và 90% còn lại thực sự không quan tâm vì họ không lái xe hoặc họ sẽ không bao giờ mua những chiếc lốp xe đắt tiền. Bạn có một ý tưởng khá hay về đối tượng mục tiêu, nhưng bạn không bao giờ có thể biết chính xác và chắn chắn những chương trình truyền hình mà họ đang xem. Ồ, bây giờ thì bạn có thể rồi.” Đối với các nhà quảng cáo, việc đưa quảng cáo lên truyền hình là một quyết định quan trọng, đây là quyết định được đưa ra dựa trên một số dữ liệu và rất nhiều phán đoán. Civis đang thay đổi điều này và biến việc mua quảng cáo thành một cái gì đó gần với việc áp dụng chiến lược tối ưu hóa hơn là trực giác.
Tất nhiên, ngay cả một hệ thống điều khiển bằng dữ liệu đã được tinh chỉnh cũng không thể hoàn hảo, đặc biệt là nếu chất lượng của dữ liệu đầu vào có vấn đề. Vào năm 2016, chiến dịch của Hillary Clinton đã sử dụng nhiều phương pháp tương tự nhưng bà đã thua trong cuộc bầu cử, một phần do dữ liệu bỏ phiếu không chính xác đã đưa ra dự đoán là bà có ưu thế lớn ở ba tiểu bang trung tây, trong khi cuối cùng bà thua sít sao ở các bang này.
Một rủi ro phổ biến khác là những người ra quyết định không phải lúc nào cũng tối ưu hóa đúng mục tiêu cuối cùng, hay những gì mà Ronny Kohavi (người tạo ra thuật ngữ “HiPPO”) gọi là “tiêu chí đánh giá tổng thể”. Ngay cả khi nhóm phân tích của Wagner có thể tối ưu hóa vị thế dẫn đầu của Clinton trong các cuộc thăm dò toàn quốc, đó cũng không phải là mục tiêu đúng. Các cuộc bầu cử Tổng thống Mỹ được xác định bởi phiếu Đại cử tri chứ không phải các phiếu bầu cử phổ thông trên toàn quốc, và điều đó đòi hỏi một chiến lược tinh tế hơn theo từng giai đoạn. Tương tự, việc đếm lượt xem trang hoặc nhấp chuột vào một chiến dịch quảng cáo trực tuyến là rất dễ dàng, nhưng hầu hết các công ty quan tâm nhiều hơn đến doanh số dài hạn và điều này thường được tối đa hóa bởi một loại chiến dịch khác. Việc lựa chọn cẩn thận các dữ liệu đầu vào và các số liệu hiệu suất phù hợp, đặc biệt là tiêu chí đánh giá tổng thể, là đặc điểm chính của những người đưa ra quyết định thành công dựa trên dữ liệu.
Các thuật toán hoạt động tệ hại
Việc chuyển quyền quyết định sang cho máy móc có thể khiến sai số trong các hệ thống thuật toán được duy trì hoặc thậm chí phóng đại một số sai số có hại đang tồn tại trong xã hội của chúng ta. Chẳng hạn như Latanya Sweeney, một Giáo sư rất nổi tiếng tại Đại học Harvard, đã có một trải nghiệm không mấy dễ chịu khi cô nhập tên mình vào công cụ tìm kiếm Google. Bên cạnh kết quả, xuất hiện một quảng cáo:
Latanya Sweeney, Bị bắt? 1) Nhập tên và tiểu bang 2) Truy cập lý lịch đầy đủ. Kiểm tra liên tục www.instantcheckmate.com
Quảng cáo cho rằng cô đã có tiền án, nhưng trong thực tế, cô chưa bao giờ bị bắt.
Khi nghiên cứu sâu hơn, Sweeney phát hiện ra rằng các tìm kiếm về tên phổ biến với người Mỹ gốc Phi, như Trevon hoặc Lakisha, hay như Latanya là những cái tên có nhiều khả năng sẽ hiển thị cùng với dòng “Bị bắt giữ?” hơn là các tên phổ biến của người da trắng, như Laurie hoặc Brendan. Trong khi chúng ta vẫn chưa biết chắc chắn tại sao mô hình này xuất hiện, Sweeney đã đưa ra lời giải thích đáng lo ngại: Thuật toán phân phát quảng cáo tự động của Google có thể nhận thấy rằng các quảng cáo được liên kết với những cái tên nghe có vẻ như của người da đen có nhiều khả năng được nhấp vào hơn. Do đó, thay vì phản ánh sự phân biệt theo nhận thức của bất kỳ ai chạy quảng cáo hoặc trên Google, định kiến về chủng tộc này có thể phản ánh và khuếch đại mô hình đưa ra quyết định dựa trên sự phân biệt đối xử trong toàn xã hội của hàng triệu người nhấp vào quảng cáo. Tương tự như vậy, vào tháng 01 năm 2017, vô số hình ảnh của người da trắng hiện ra khi gõ từ khóa “nhà khoa học” hoặc “bà” vào thanh tìm kiếm hình ảnh của Google.
Trong một bài báo trên Tạp chí Nature, Kate Crawford và Ryan Calo đã lưu ý đến nguy cơ “trong một số bối cảnh hiện tại, nhược điểm của các hệ thống trí tuệ nhân tạo có ảnh hưởng không tương xứng đối với các nhóm vốn đã bị thiệt thòi bởi các yếu tố như chủng tộc, giới tính và trình độ kinh tế xã hội”, đồng thời nhấn mạnh tầm quan trọng của việc xem xét các tác động về mặt xã hội của các hệ thống này, kể cả trong và ngoài dự kiến.
Chúng ta chia sẻ những mối bận tâm và đồng thời nắm bắt được cả thách thức cùng với cơ hội khi việc đưa ra quyết định phụ thuộc vào các thuật toán ngày càng gia tăng. Thách thức đó là cách tiếp cận này có thể ghi lại và duy trì những sai số không công bằng, có hại và không mong muốn. Điều tồi tệ hơn là những sai số này có thể xuất hiện dù các nhà thiết kế thuật toán có ý định cố gắng tạo ra các hệ thống không sai số, và có thể khó xác định các sai số nếu không thử nghiệm rộng rãi. Tất cả thiết kế hệ thống đều phải đối mặt với thách thức này.
Cơ hội của chúng ta là các hệ thống dựa trên máy móc thường có thể được kiểm tra và hoàn thiện. Và một khi được điều chỉnh, máy móc khó có thể mắc lại lỗi sai tương tự. Ngược lại, con người sẽ rất khó có thể thừa nhận các định kiến của họ (bạn có biết có bao nhiêu người phân biệt chủng tộc hoặc giới tính không?), nói chi đến việc thực hiện những công việc khó khăn để vượt qua các thách thức. Tiêu chuẩn cuối cùng cho việc áp dụng một hệ thống ra quyết định là – cho dù dựa trên máy móc, hoặc con người, hay dựa trên sự kết hợp của cả hai – trên thực tế, chúng không thể hoàn hảo. Bất kỳ hệ thống nào cũng có khả năng mắc lỗi và có sai số. Thay vào đó, mục tiêu là chọn một cách tiếp cận giảm thiểu sai số và lỗi, đồng thời cho phép các sai số và lỗi được điều chỉnh dễ dàng và nhanh chóng.
Đưa trí tuệ con người vào vòng lặp một cách thông minh
Con người nên đóng vai trò gì trong việc đưa ra quyết định? Với tất cả kiến thức về sai số và lỗi của Hệ thống 1 cùng với vô vàn dữ liệu cũng như khả năng tính toán có sẵn, có vẻ như nền kinh tế thứ hai sẽ tiếp quản nền tảng thứ nhất và Hệ thống số 2 của chúng ta sẽ sớm đưa ra hầu hết các quyết định. Có một câu nói đùa cũ rích rằng nhà máy của tương lai sẽ gồm hai nhân viên: một người và một chó. Công việc của con người sẽ là cho chó ăn, và công việc của con chó sẽ là giữ cho con người không chạm vào bất kỳ máy móc nào. Đó có thật sự là bộ mặt của các công ty trong tương lai?
Chúng tôi không nghĩ vậy. Mặc dù thực tế là chúng ta mắc những định kiến mà máy tính không mắc, nhưng chúng ta cũng có những điểm mạnh mà máy tính không thể nào có. Nhưng có một điều chắc chắn là chúng ta nhận được một lượng dữ liệu khổng lồ từ các giác quan và chúng ta không chọn trước chúng; chúng ta chỉ tiếp nhận tất cả thông tin như cách mà chúng xuất hiện. Chúng ta gặp khó khăn khi chỉ nghe một số âm thanh nhất định hoặc nhìn thấy một số thứ nhất định, ngay cả trong một thời gian ngắn. Máy tính làm điều hoàn toàn ngược lại; nó gặp khó khăn lớn trong việc thu thập thêm dữ liệu hay thu thập các dữ liệu khác ngoài những gì người thiết kế và lập trình viên cho phép.
Sự khác biệt này làm phát sinh một công việc quan trọng cho những người mà Meehl gọi là “vai trò của cái chân gãy”. Hãy xem ví dụ của ông về một vị giáo sư, người này có thói quen đi xem phim vào mỗi tối thứ Ba hàng tuần trong vài năm. Việc một mô hình máy tính dự đoán rằng vị giáo sư này sẽ đi xem phim vào tuần tới là hợp lý. Thật không may, vị giáo sư này bị gãy chân vào sáng thứ Ba và sẽ phải bó bột, điều này khiến bà không thể đến rạp chiếu phim (ví dụ này đã được nghĩ ra vào năm 1954). Ai cũng sẽ biết ngay rằng vị giáo sư không thể đi xem phim vào buổi tối, nhưng “sức mạnh đặc biệt này” không dễ gì được sao chép bởi một thuật toán máy tính. Đơn giản là tồn tại quá nhiều “yếu tố khác biệt, bất ngờ” có thể ảnh hưởng đến hành vi của vị giáo sư đó. Bất cứ ai thiết kế hệ thống máy tính đều không thể thu thập dữ liệu về tất cả các yếu tố này để chương trình có thể xem xét. Cách duy nhất để làm điều đó là xây dựng một mô hình toàn diện hơn nhiều so với bất kỳ hệ thống máy tính nào trên thế giới.
Một lợi thế lớn khác của con người là kiến thức thông thường. Một số trong chúng ta có nhiều thứ hơn những người khác, nhưng tất cả chúng ta đều có kiến thức nhiều hơn những máy tính tiên tiến nhất. Ngay khi chúng ta được sinh ra, chúng ta đã bắt đầu học hỏi những điều cơ bản về cách thế giới này vận hành, và học chúng một cách nhanh chóng. Mặc dù đã tiến hành nghiên cứu trong nhiều thập kỷ, chúng ta vẫn chưa thể hiểu rõ cách con người có được kiến thức thông thường và những nỗ lực để thấm nhuần những kiến thức này vào máy tính cho đến nay đều thất bại thảm hại, chúng ta sẽ thảo luận nhiều hơn về vấn đề này trong chương tiếp theo.
Do đó, trong nhiều trường hợp, việc có một người kiểm tra các quyết định của máy tính để đảm bảo tính hợp lý là một ý tưởng hay. Thomas Davenport, một học giả lâu năm về phân tích và công nghệ, gọi việc này là “một cái nhìn ra ngoài cửa sổ”. Cụm từ này không đơn thuần là một phép ẩn dụ gợi mở. Nó được lấy cảm hứng từ một phi công mà ông từng gặp. Người phi công này đã mô tả cách anh phụ thuộc rất nhiều vào thiết bị trên máy bay để quan sát, nhưng bản thân anh cũng nhận thấy việc thỉnh thoảng tự quan sát đường chân trời là cần thiết. Cách tiếp cận này có thể mang lại lợi ích rất lớn, không chỉ để ngăn ngừa lỗi mà còn giúp quản lý uy tín của công ty.
Dịch vụ thuê xe Uber đã có một bài học đắt giá về điều này vào cuối năm 2014. Vào thời điểm đó, công ty nổi tiếng với việc tăng giá đột biến (tăng giá vé tạm thời trong các khung giờ cao điểm), một chiến thuật mà nhiều người tiêu dùng không thể chấp nhận được. Uber khăng khăng (và chúng tôi đồng ý) rằng tăng giá có lợi cho việc cân bằng cung và cầu trong những thời điểm này. Các thuật toán của công ty đã tăng giá để khuyến khích nhiều tài xế tham gia khi nguồn cung cấp xe thực tế hoặc dự đoán không theo kịp nhu cầu của người tiêu dùng.
Cách làm này khiến công ty bị báo chí chỉ trích khi một tu sĩ người Iran bắt 18 người làm con tin tại một quán cà phê ở Sydney, Úc vào tháng 12 năm 2014. Nhiều người đã bỏ trốn khỏi khu vực xảy ra vụ việc và một số người đã cố gắng sử dụng dịch vụ Uber để bỏ trốn. Các hệ thống máy tính của Uber đã phản ứng với nhu cầu tăng đột biến này bằng cách bắt đầu tăng giá. Đối với nhiều người, đây là một phản ứng cực kỳ không phù hợp trong một tình huống khủng hoảng như vậy, và điều này khiến công ty phải đối mặt với sự chỉ trích dữ dội.
Uber đã đưa ra tuyên bố: “Chúng tôi đã không ngừng việc tăng giá ngay lập tức [trong cuộc bao vây tại Sydney]. Đây là một quyết định sai lầm.” Công ty cũng lập trình khả năng khống chế hành động tăng giá đột biến trong một số trường hợp. Bắt đầu vào tối ngày 13 tháng 11 năm 2015, những kẻ khủng bố Hồi giáo đã thực hiện một loạt các cuộc tấn công trên khắp Paris. Trong vòng 30 phút kể từ khi tiếng súng đầu tiên nổ ra, Uber đã khống chế lệnh tăng giá đột biến trong thành phố và cảnh báo tất cả người dùng về tình trạng khẩn cấp.1
1. Dù vậy, tin đồn về việc Uber tiếp tục tăng giá trong thời gian diễn ra cuộc tấn công ở Paris vẫn lan truyền rộng rãi. (TG)
Các ví dụ như thế này cho thấy sự khôn ngoan trong việc kết hợp phán đoán của con người và các thuật toán. Tuy nhiên, khi các công ty áp dụng phương pháp này, họ sẽ cần phải cẩn thận. Bởi vì bản thân con người rất thích các phán đoán của chính mình và quá tự tin vào nó, nhiều người, nếu không muốn nói là hầu hết chúng ta, thường đưa ra phán đoán quá vội vàng để khống chế lệnh của máy tính, ngay cả khi câu trả lời của nó là tốt hơn. Nhưng Chris Snijder – người thực hiện nghiên cứu về dự đoán của các nhà quản lý mua sắm đã được nhấn mạnh trong chương trước đó – nhận thấy rằng “những gì bạn thường thấy [đó là] sự phán đoán của các chuyên gia được hỗ trợ nằm đâu đó giữa một mô hình và một chuyên gia không được hỗ trợ. Vì vậy, các chuyên gia sẽ làm tốt công việc của họ hơn nếu bạn cung cấp cho họ một mô hình. Nhưng bản thân mô hình vẫn hoạt động tốt hơn.”
Chúng tôi ủng hộ việc con người tham gia vào vòng lặp chính vì những lý do mà Meehl và Davenport đã mô tả, nhưng chúng tôi cũng ủng hộ việc các công ty có thể “ghi điểm” bất cứ khi nào có thể – họ theo dõi độ chính xác của các quyết định của thuật toán so với quyết định của con người theo thời gian. Nếu phần khống chế của con người hiệu quả hơn thuật toán cơ bản, mọi thứ sẽ hoạt động như bình thường. Nếu không, mọi thứ cần phải thay đổi, và bước đầu tiên là làm cho mọi người nhận thức được tỷ lệ thành công thật sự.
Phản hồi này cực kỳ quan trọng bởi đó là cách thức Hệ thống 1 học hỏi và cải thiện. Như Kahneman và nhà tâm lý học Gary Klein đã viết: “Đừng bao giờ tin vào trực giác của bản thân. Bạn cần coi trực giác của mình là một điểm dữ liệu quan trọng, nhưng cũng phải đánh giá một cách có chủ ý và có ý thức để xem trực giác đó có ý nghĩa gì trong bối cảnh này hay không.” Cách tốt nhất để cải thiện độ chính xác và giảm sai số của Hệ thống 1 là cung cấp cho nó nhiều ví dụ, đưa ra phản hồi thường xuyên và nhanh chóng về độ chính xác của nó.
Một mối quan hệ cộng tác đảo ngược dẫn đến một ranh giới rõ ràng
Một kỹ thuật giá trị cuối cùng, và là một kỹ thuật mà một số công ty bắt đầu sử dụng, là biến đổi hoàn toàn sự sắp xếp tiêu chuẩn: thay vì dùng máy móc cung cấp dữ liệu đầu vào cho phán đoán của con người, họ có những phán đoán đóng vai trò là đầu vào cho một thuật toán. Google đang tiên phong áp dụng phương pháp này trong tuyển dụng, một lĩnh vực quan trọng đối với công ty, nhưng một phân tích kỹ thuật cho thấy sự sắp xếp tiêu chuẩn đang hoạt động kém hiệu quả.
Trong khi là người đứng đầu bộ phận Vận hành Nhân sự tại Google, Laszlo Bock nhận ra rằng hầu hết các kỹ thuật được sử dụng để tuyển dụng nhân viên mới đều gần như vô dụng. Khi nhóm của ông xem xét đâu là lý do dẫn đến sự khác biệt trong hiệu suất làm việc tại công ty, họ thấy rằng kiểm tra thông tin trước khi tuyển dụng chỉ giải thích được khoảng 7% sự khác biệt, nhận định dựa trên kinh nghiệm nhiều năm chiếm 3% lý do và chỉ 14% bắt nguồn từ các cuộc phỏng vấn việc làm không có cấu trúc – loại phỏng vấn vẫn còn phổ biến nhất, bắt đầu bằng các câu hỏi như “Thế mạnh lớn nhất của bạn là gì?” hay “Vui lòng giới thiệu về bản thân bạn”. Theo Bock, vấn đề với các cuộc phỏng vấn này là:
Họ tạo ra một tình huống phỏng vấn để cố gắng xác nhận những gì họ nghĩ về ai đó, thay vì thật sự đánh giá người đó. Các nhà tâm lý học gọi đây là thiên kiến xác nhận. Dựa trên sự tương tác nhỏ nhất, chúng ta nhanh chóng đưa ra một đánh giá, vô thức bị ảnh hưởng nặng nề bởi chính những định kiến và niềm tin hiện có của bản thân. Vì không nhận ra điều đó, chúng ta vô hình chuyển từ đánh giá một ứng viên sang tìm kiếm bằng chứng xác nhận ấn tượng ban đầu của mình.
Ở đây, một lần nữa, Hệ thống 1 đang hoạt động, đưa những định kiến và sai sót nhỏ thành một quyết định quan trọng.
Vậy đâu là phương pháp tuyển dụng tốt hơn? Google đã dựa rất nhiều vào các cuộc phỏng vấn có cấu trúc, điều này giải thích 25% lý do dẫn đến hiệu suất công việc. Các cuộc phỏng vấn có cấu trúc bao gồm một bộ câu hỏi có sẵn để đánh giá, ví dụ, khả năng nhận thức chung của một người. Google đã áp dụng một quy trình tuyển dụng mà trong đó, tất cả nhân viên tuyển dụng đều sử dụng các cuộc phỏng vấn có cấu trúc, đưa ra đa số các câu hỏi tương tự, và, như Bock giải thích: “Sau đó, chúng tôi chấm điểm nhân viên tuyển dụng một phiếu tự đánh giá phù hợp… Người phỏng vấn phải chỉ ra cách thể hiện của ứng viên, mỗi cấp độ thể hiện được xác định rõ ràng... Một phiếu tự đánh giá súc tích có thể tinh chọn các tình huống công việc lộn xộn, mơ hồ và phức tạp thành các kết quả có thể đo lường và có thể so sánh được.”
Theo cách tiếp cận này, phán đoán của từng nhân viên tuyển dụng vẫn có giá trị, nhưng chúng đã được định lượng và sử dụng để gán điểm số cho ứng viên xin việc. Bock tin rằng thay vì tầm thường hóa và phi nhân hóa quá trình phỏng vấn, phương pháp này lại làm điều ngược lại. Bản thân các ứng viên đánh giá cao việc được đối xử khách quan và công bằng (80% ứng viên bị từ chối đã cho biết họ sẽ khuyến khích bạn bè nộp đơn vào Google), từ đó, việc đưa ra quyết định tuyển dụng trở nên dễ dàng hơn. Như Bock nói: “Bạn sẽ thấy được một ranh giới rõ ràng giữa người vĩ đại và kẻ tầm thường.”
Quyết định quá quan trọng để con người có thể tự định đoạt
Ý tưởng về những thay đổi đáng kể trong việc sắp xếp tiêu chuẩn giữa trí óc và máy móc – trong một số trường hợp, ngay cả khi đảo ngược sự sắp xếp đó – cũng khiến nhiều người khó chịu. Hầu hết chúng ta đều có niềm tin vào trực giác, phán đoán và khả năng ra quyết định của con người, đặc biệt của chính chúng ta (chúng tôi đã thảo luận về chủ đề này với rất nhiều khán giả và hầu như chưa bao giờ nghe ai thừa nhận bản thân có trực giác hoặc mức độ phán đoán dưới trung bình). Nhưng bằng chứng về chủ đề này rất rõ ràng và không thể chối cãi: dựa trên dữ liệu, các quyết định thuộc Hệ thống 2 tốt hơn so với các quyết định phát sinh từ việc kết hợp Hệ thống 1 và Hệ thống 2 trong bộ não của chúng ta trong những trường hợp tồn tại cả hai lựa chọn. Không phải quyết định và phán đoán của chúng ta là vô dụng; mà chính là việc cải thiện chúng. Các cách tiếp cận rộng rãi mà chúng ta phát hiện ở đây – như cho phép các thuật toán, hệ thống máy tính đưa ra quyết định, đôi khi nhờ vào dữ liệu đầu vào là các phán đoán của con người và cho phép mọi người ghi đè lên chúng nếu phù hợp – là cách để thực hiện điều này.
Cách tiếp cận này từng được mô tả là phi nhân đạo. Một số người cảm thấy để máy tính nắm quyền đưa ra quyết định sẽ đẩy con người đến đường cùng và giới hạn họ. Chúng tôi đồng ý rằng việc đánh mất quyền quyết định mà bạn từng nắm giữ là một điều không thoải mái1, và rằng không ai thích cảm giác phải phục vụ máy tính. Nhưng điều này có nghĩa là các tù nhân vô tội nên được trả tự do hoặc bị giam giữ trong tù, chỉ để cho các thẩm phán và hội đồng đặc xá có thể tiếp tục nghĩa vụ của họ như trước đây? Hoặc rằng tỷ lệ chẩn đoán y tế sai lầm lên cao hơn mức thông thường, chỉ để cho các bác sĩ và nhà tâm lý học tiếp tục công việc thường ngày của họ? Rằng các công ty nên thuê nhầm người, chỉ để nhân viên tuyển dụng tiếp tục cảm thấy họ thông minh?
1. Trên thực tế, trong một thí nghiệm, nhà Tâm lý học Sebastian Bobadilla-Suarez và các đồng nghiệp của ông đã phát hiện ra rằng mọi người sẵn sàng trả tiền để thuê người có khả năng đưa ra quyết định phân bổ tiền, mặc dù họ biết rằng, nếu cho phép quyết định được đưa ra tự động, họ sẽ nhận được nhiều hơn số đó. Mọi người đều thích sở hữu quyền quyết định. (Sebastian Bobadilla-Suarez, Cass R. Sunstein, và Tali Sharot, The Intrinsic Value of Control: The Propensity to Under-delegate in the Face of Potential Gains and Losses (tạm dịch: Giá trị nội tại của kiểm soát: Mức độ ủng hộ của đại biểu khi đối mặt với lợi nhuận và tổn thất tiềm năng), SSRN, ngày 17 tháng 02 năm 2016, https://papers.ssrn.com/sol3/papers2. cfm?abstract_id=2733142.) (TG)
Đối với chúng tôi, câu trả lời cho những câu hỏi này là không. Các quyết định hợp lý có tầm ảnh hưởng rất lớn đối với các xã hội hoạt động hiệu quả: chúng giúp xác định các nguồn lực phù hợp, từ công việc đến chăm sóc sức khỏe, đưa đúng người đến đúng nơi vào đúng thời điểm. Quan hệ cộng tác tiêu chuẩn do Hammer và Champy ủng hộ – trong đó máy tính thực hiện việc lưu trữ hồ sơ trong khi HiPPO tiến hành phán đoán và đưa ra quyết định – thường không phải là cách tốt nhất để có thể đưa ra quyết định sáng suốt.
Tại thời điểm này, bạn có thể không mấy ngạc nhiên khi biết rằng con người chúng ta cũng khá tệ trong việc dự đoán tương lai. Xét cho cùng, dự đoán và quyết định gần như là những hoạt động không thể tách rời (để có một quyết định đúng đắn, chúng ta thường cần một dự đoán chính xác về một khía cạnh nào đó trong tương lai, cụ thể là điều gì sẽ xảy ra nếu chúng ta quyết định theo cách này hay cách khác). Vì vậy, nếu chúng ta kém ở một mặt nào đó, thì chúng ta cũng có thể kém ở mặt khác. Và chắc chắn, nhiều lối tắt và hạt sạn trong Hệ thống 1 sẽ ngăn chúng ta đưa ra một dự đoán tốt.
Bắt đầu từ năm 1984, nhà chính trị học Philip Tetlock và các đồng nghiệp của ông đã thực hiện một dự án kéo dài hàng thập kỷ để đánh giá tính chính xác của các dự đoán trong nhiều lĩnh vực như chính trị, kinh tế và các vấn đề quốc tế. Ở đây, một lần nữa, các kết luận đều rõ ràng và nổi bật. Trong một thử nghiệm liên quan đến hơn 82.000 dự đoán, Tetlock đã phát hiện ra rằng “loài người hầu như tệ hơn [một] con tinh tinh” ở khoản dự đoán các kết quả có thể xảy ra.
Điều này nên được quan tâm vì môi trường kinh doanh luôn đầy những dự đoán về tương lai. Nhiều trong số đó được trình bày rõ ràng theo bản chất: dự báo về khả năng hoạt động tốt của một cổ phiếu cụ thể, hay xu hướng và mức độ biến động của lãi suất trong tương lai, hoặc số lượng điện thoại thông minh bán ra tại một quốc gia nhất định trong năm tới. Trong nhiều trường hợp khác, dự báo được ngầm đưa ra trong đề xuất kế hoạch hành động. Ví dụ, việc thiết kế lại trang web chứa dự đoán ngầm rằng khách hàng truy cập sẽ thích diện mạo trang web mới hơn, cũng như việc thiết kế lại một văn phòng chi nhánh ngân hàng cũng được dự đoán rằng sẽ khiến khách hàng thoải mái hơn. Một buổi giới thiệu sản phẩm hấp dẫn được xây dựng dựa trên dự đoán rủi ro cao rằng khách hàng sẽ thích nó và chiến dịch marketing đi kèm với các dự đoán về cách có thể định hình sở thích của khách hàng.
LÀM THẾ NÀO ĐỂ CÓ NHỮNG DỰ ĐOÁN TỐT
Tất nhiên, không phải tất cả những dự đoán này đều sai. Tetlock nhận thấy rằng một số người mà ông gọi là nhà siêu dự báo thật sự có khả năng dự báo một cách chính xác hơn so với cơ hội dự đoán. Họ có xu hướng tiếp nhận thông tin từ nhiều nguồn và có lẽ quan trọng hơn, cho thấy khả năng chấp nhận nhiều quan điểm khác nhau khi nhìn vào một tình huống. Trong khi đó, các nhà dự báo có năng lực kém thường sử dụng một quan điểm cố định trong các phân tích của họ (ví dụ, cả những đảng viên Đảng Bảo thủ hoạt động hăng hái và những người tự do cực đoan đều có xu hướng đưa ra những dự đoán chính trị thiếu chính xác). Tetlock gọi nhóm người trước (những người dự đoán đa góc độ và thành công hơn) là “cáo” và nhóm sau là “nhím”, cách gọi này được ông lấy cảm hứng từ câu cách ngôn của nhà thơ Hy Lạp cổ đại Archilochus: “Con cáo ma mãnh biết rất nhiều thứ, còn con nhím lù đù thì chỉ thuộc nằm lòng một thứ thôi.”1
1. Loài cáo và loài nhím, cũng là tiêu đề một bài tiểu luận của nhà triết học Isaiah Berlin về việc phân chia các nhà tư tưởng trong suốt lịch sử thành hai loại: những người theo đuổi một lý tưởng lớn trong suốt sự nghiệp và những người theo đuổi nhiều lý tưởng khác nhau. (BTV)
Sau đó, một phần hướng dẫn phụ thuộc vào cáo thay vì nhím ở bất cứ nơi nào có thể. Cáo có thể bị tác động bởi các lý luận và phân tích đa chiều, đa viễn cảnh mà chúng trình bày. Chúng cũng có thể bị ảnh hưởng bởi hồ sơ theo dõi của mình. Những người có bằng chứng lịch sử chứng minh sự chính xác của các dự đoán có khả năng là cáo.
Giảm dự đoán, tăng thử nghiệm
Đặt sự tồn tại của các nhà siêu dự báo sang một bên, về cơ bản, chúng tôi khuyên bạn nên bớt phụ thuộc vào các dự đoán. Thế giới của chúng ta ngày càng phức tạp, hỗn loạn và luôn luôn vận động. Điều này làm cho việc dự báo một điều gì đó vô cùng khó khăn và thật sự là không thể, với sự chuyển đổi mạnh mẽ của vế sau khi trục thời gian ngày càng kéo dài hơn.
Một sự chuyển đổi cơ bản đang diễn ra trong số các công ty xuất chúng: từ bỏ việc đưa ra các dự báo dài hạn, kế hoạch dài hạn và đặt cược lớn, thay vào đó hướng tới sự lặp lại, thử nghiệm và kiểm chứng ngắn hạn liên tục. Các tổ chức này làm theo lời khuyên vĩ đại của nhà khoa học máy tính Alan Kay rằng cách tốt nhất để dự đoán tương lai là tạo ra nó. Họ thực hiện điều này với nhiều bước nhỏ, nhận phản hồi và điều chỉnh khi cần thiết, thay vì bí mật làm việc hướng đến một sự kiện xa xôi có kết quả được dự đoán một cách tự tin.
Việc thực tế hóa tầm nhìn này tương đối đơn giản đối với một trang web. Vì chúng có thể thu thập khối lượng dữ liệu phong phú từ các hoạt động của người dùng, từ đó dễ dàng xem xét liệu một thay đổi nhất định có tốt hơn không. Một số trang web thương mại điện tử rất nghiêm túc trong việc thay đổi bản thân theo thời gian và thử nghiệm tất cả thay đổi. Trang web du lịch Priceline là trang web nổi bật trong làn sóng hào hứng đầu tiên về web vào cuối những năm 1990. Giống như nhiều công ty có tham vọng lớn khác thời bấy giờ, Priceline đã sụp đổ sau những bước ngoặt của thế kỷ này, phần lớn là do người dùng cảm thấy không hài lòng với mô hình Hãy nói giá của bạn.
Công ty đã tự đổi mới, trở thành nơi tập hợp các trang web du lịch thông thường trong những năm giữa thập kỷ đầu tiên của thế kỷ này. Tuy nhiên, điều cho phép công ty phát triển mạnh mẽ chính là việc thử nghiệm theo dữ liệu liên tục. Như Matt Marshall, phóng viên của Tạp chí VentureBeat đã nói: “Đó là những ý tưởng nhỏ dẫn đến từng đợt tăng trưởng, giống như việc cải thiện trải nghiệm hiện tại thông qua những chiến thắng nhỏ bé – bằng cách tinh chỉnh những thứ như màu sắc, cách diễn đạt và sắp xếp dữ liệu trên trang web chỉ để có được những mức giá gia tăng... Priceline.com nhận thấy việc thay đổi từ ngữ trong việc mô tả một trong các thuộc tính của trang web từ ‘bãi đậu xe’ thành ‘bãi đậu xe miễn phí’ đã cải thiện 2% trong chuyển đổi - ngay cả khi từ đó nằm trong phần không nổi bật của trang và hầu như không được chú ý bởi đa số người đọc.” Tất cả những thuộc tính khác đều cho lợi ích tương tự khi có sự điều chỉnh. Bằng giao thức thử nghiệm trực tuyến phổ biến có tên A/B, trong đó một nửa khách truy cập nhìn thấy tùy chọn A khi họ truy cập một trang web trong khi nửa còn lại nhìn thấy tùy chọn B, công ty đồ lót Adore Me thấy rằng hình ảnh người mẫu đặt tay lên mái tóc thay vì đặt lên hông có thể gia tăng gấp đôi doanh số cho một số mặt hàng. Thay vì dành hàng tuần, hằng ngày hoặc thậm chí hàng giờ để các chuyên gia có thể phân tích và tranh luận về một đề xuất thay đổi, việc thử nghiệm đơn giản các tùy chọn trực tuyến thường nhanh và chính xác hơn. Thông thường thì kết quả sẽ khiến chúng ta vô cùng bất ngờ.
Và việc thử nghiệm không chỉ giới hạn trong không gian trực tuyến. Nó có thể hiệu quả hơn khi áp dụng vào các môi trường thực tế. Nhiều công ty lớn được giáo sư trường kinh doanh David Garvin gọi là “doanh nghiệp đa ngành” (MUE – multiunit enterprises). Các tổ chức này có nhiều địa điểm tiếp cận khách hàng với cùng một hình thức và cách thức hoạt động. Nhiều ngân hàng thương mại, chuỗi nhà hàng, nhà bán lẻ và doanh nghiệp dịch vụ đều là MUE. Theo một ước tính về 100 công ty hàng đầu do Tạp chí Fortune xếp hạng, ở mức độ nào đó, 20% trong số này là các doanh nghiệp đa ngành.
Nhiều địa điểm của một doanh nghiệp đa ngành cung cấp cơ hội thử nghiệm tuyệt vời. Theo học giả đổi mới Stefan Thomke và nhà thử nghiệm doanh nghiệp Jim Manzi, cửa hàng bách hóa Kohl đã thực hiện một thử nghiệm với sự tham gia của hàng trăm cửa hàng để tìm hiểu xem liệu việc mở cửa trễ hơn một giờ vào các ngày trong tuần có ảnh hưởng đến doanh số hay không. Tin tốt cho các nhà bán lẻ là thời gian mở cửa ngắn hơn không làm giảm đáng kể doanh số. Tuy nhiên, tin tức ít được chào đón hơn đến từ một thử nghiệm khác liên quan đến 70 cửa hàng Kohl về tác động của việc kinh doanh đồ nội thất trong thời gian đầu. Thử nghiệm này phát hiện ra rằng, vì đồ nội thất chiếm quá nhiều diện tích sàn so với các sản phẩm khác, nên tổng doanh số của cửa hàng và lượng khách hàng thật sự giảm. Mặc dù nhiều giám đốc điều hành bày tỏ sự lạc quan về mặt hàng mới này, công ty vẫn quyết định căn cứ theo bằng chứng từ kết quả thử nghiệm và quyết định dừng việc kinh doanh đồ nội thất. Việc điều hành đồng thời mọi thứ tại mọi địa điểm trong MUE là bất khả thi, do đó, việc triển khai theo giai đoạn tạo ra cơ hội thử nghiệm tự nhiên. Bằng một vài kế hoạch, các doanh nghiệp này có thể học được nhiều điều từ những triển khai theo giai đoạn, đối chiếu các địa điểm hoạt động theo chính sách mới so với các địa điểm vẫn thực hiện mọi thứ theo cách cũ.
So với quyết định, dự đoán và thử nghiệm không thể dễ dàng tự động hóa. Nhưng chúng rất dễ điều chỉnh theo dữ liệu và các phân tích nghiêm ngặt. Đó là những công cụ chính của Hệ thống 2, và cũng thuộc thời đại máy móc thứ hai. Trong khi đó, Hệ thống 1 và các thành phần của nó như trực giác, phán đoán và kinh nghiệm tích lũy cá nhân cần rút lui khỏi việc đưa ra dự đoán chính xác, ít nhất là như việc đưa ra quyết định hợp lý. Tóm lại, cần phải loại trừ các HiPPO trong các tổ chức.
TÓM TẮT CHƯƠNG
▶ Quan hệ cộng tác tiêu chuẩn kéo dài 20 năm giữa trí óc và máy móc thường chú trọng quá nhiều vào sự phán đoán, trực giác của con người và “bản năng”.
▶ Tại sao phán đoán của con người thường rất tệ? Bởi phong cách lập luận nhanh chóng và hời hợt của “Hệ thống 1” khiến chúng ta phải chịu nhiều kiểu thành kiến khác nhau. Tệ hơn nữa, nó không nhận thức được khi nào nó mắc lỗi, do đó chiếm quyền điều khiển Hệ thống 2 để biện minh và thuyết phục cho một phán đoán vội vàng.
▶ Các bằng chứng được tìm ra cho thấy trong bất cứ chọn lựa nào, việc chỉ dựa vào dữ liệu và thuật toán thường dẫn đến các quyết định và dự báo tốt hơn là dựa vào phán đoán của những người thậm chí có “kinh nghiệm” và khả năng.
▶ Nhiều quyết định, phán đoán và dự báo hiện nay do con người đưa ra nên được chuyển sang cho các thuật toán. Trong một số trường hợp, mọi người nên có mặt trong vòng lặp để kiểm tra kiến thức chung. Ở những trường hợp khác, họ nên được tách hoàn toàn khỏi vòng lặp.
▶ Trong các trường hợp khác, vẫn nên sử dụng các phán đoán chủ quan của con người, nhưng trong quan hệ cộng tác tiêu chuẩn đảo ngược: các phán đoán nên được định lượng và đưa vào các phân tích định lượng.
▶ Các quy trình ra quyết định không nên được thiết lập chỉ để những người ra quyết định cảm thấy tốt về bản thân. Chúng nên được hình thành để đưa ra các quyết định tốt nhất dựa trên các mục tiêu phù hợp và số liệu rõ ràng.
▶ Thuật toán là không hoàn hảo. Nếu chúng dựa trên dữ liệu không chính xác hoặc sai lệch, chúng sẽ đưa ra những quyết định không chính xác hoặc sai lệch tượng tự. Những định kiến có thể khó phát hiện và nằm ngoài ý muốn của chúng ta. Tiêu chí áp dụng không phải là liệu các thuật toán có hoàn hảo hay không, mà là liệu chúng có vượt trội hơn các lựa chọn thay thế có sẵn trên các số liệu liên quan, cũng như liệu chúng có thể được cải thiện theo thời gian hay không.
▶ Công nghệ trở nên phổ biến sẽ mang lại cơ hội vượt qua Quan hệ cộng tác tiêu chuẩn cũng như sự phụ thuộc quá mức vào HiPPO con người, và tiến tới việc ra quyết định dựa trên dữ liệu nhiều hơn. Dữ liệu cho thấy các công ty làm điều này thường có một lợi thế lớn hơn rất nhiều so với những công ty khác.
▶ Những người có thể nhìn nhận một vấn đề từ nhiều quan điểm, các công ty có thể lặp đi lặp lại và thử nghiệm hiệu quả sẽ hoạt động tốt hơn so với số còn lại.
CÂU HỎI
1. Bạn có theo dõi một cách có hệ thống và chặt chẽ hiệu suất theo thời gian của các quyết định, phán đoán, dự báo của bạn do con người thực hiện với các thuật toán trong tổ chức của bạn không? Bạn có biết bên nào đang thực hiện tốt không?
2. HiPPO đưa ra quyết định phổ biến nhất ở bộ phận nào trong tổ chức của bạn? Tại sao lại như vậy?
3. Bạn có cơ hội lật ngược hoàn toàn quan hệ cộng tác tiêu chuẩn ở đâu, để kết hợp đánh giá chủ quan của mọi người vào các phân tích dựa trên dữ liệu, thay vì ngược lại?
4. Theo bạn, cái nào thường bị ảnh hưởng bởi định kiến nhiều hơn: thuật toán hay con người?
5. Loài nào thuyết phục bạn hơn: cáo hay nhím?
6. Tổ chức của bạn có xu hướng thực hiện một số lượng nhỏ các dự án dài hạn, dự án rủi ro cao hay một số lượng lớn các dự án ngắn hạn, lặp đi lặp lại nhiều hơn?