Dữ liệu đang làm thay đổi thế giới của chúng ta, cũng như cách chúng ta sống và làm việc, với tốc độ chưa từng có. Tùy thuộc vào quan điểm của bạn, chúng ta hoặc là đang bắt đầu một thứ gì đó hứng thú đến kinh ngạc, hoặc là đang bước vào một kỷ nguyên của Kẻ độc tài (Big Brother), nơi mà nhất cử nhất động của chúng ta đều có thể bị theo dõi – và thậm chí bị dự đoán (cả hai quan điểm đều có lý lẽ riêng). Tuy nhiên, các nhà lãnh đạo và các nhà quản lý doanh nghiệp có khá ít thời gian cho sự hoài nghi về dữ liệu. Dữ liệu đang cách mạng hóa cách thức hoạt động của các công ty và nó sẽ trở nên ngày càng quan trọng đối với các tổ chức trong những năm tới. Những công ty nhìn nhận dữ liệu như là một tài sản chiến lược là những công ty sẽ tồn tại và phát triển mạnh. Với sự tăng trưởng mạnh mẽ về dữ liệu lớn và Internet kết nối vạn vật (IoT), cộng với việc phát triển nhanh chóng của các phương thức phân tích dữ liệu, tầm quan trọng của dữ liệu đối với mọi mặt của doanh nghiệp sẽ chỉ tăng lên.
Sự tăng trưởng đáng kinh ngạc của dữ liệu lớn và Internet kết nối vạn vật
Cứ mỗi hai ngày chúng ta lại tạo ra được lượng dữ liệu tương đương với lượng dữ liệu được tạo ra từ những ngày đầu cho đến năm 2003. Vâng, là mỗi-hai-ngày. Và với việc lượng dữ liệu chúng ta đang tạo ra tiếp tục tăng nhanh, đến năm 2020, lượng thông tin số sẽ tăng từ khoảng 5 zettabyte hiện nay lên tới 50 zettabyte. Hầu hết ở mỗi hoạt động, chúng ta đều để lại một dấu vết về dữ liệu số – lướt web trực tuyến, mua hàng trong một cửa hàng trực tiếp với thẻ tín dụng, gửi e-mail, chụp một bức ảnh, đọc một bài báo trực tuyến, thậm chí cả việc dạo phố nếu bạn đang mang theo điện thoại di động hoặc có hệ thống camera giám sát CCTV trong vùng lân cận.
Thuật ngữ “dữ liệu lớn” đề cập đến việc thu thập tất cả dữ liệu đó và khả năng của chúng ta trong việc tận dụng nó để mang lại lợi thế của mình trên nhiều lĩnh vực, bao gồm cả việc kinh doanh. Bản thân dữ liệu không phải là một phát minh mới. Quay lại thời điểm trước khi có máy tính và các cơ sở dữ liệu, chúng ta vẫn sử dụng dữ liệu để theo dõi những hoạt động và đơn giản hóa các quy trình – hãy nghĩ đến các bản ghi giao dịch bằng văn bản và các hồ sơ lưu trữ bằng giấy. Máy tính, đặc biệt là các bảng tính và cơ sở dữ liệu, đã mang đến cho chúng ta một phương pháp lưu trữ và tổ chức dữ liệu trên quy mô lớn, theo một cách dễ dàng tiếp cận. Đột nhiên, thông tin đã có sẵn chỉ với một cú nhấp chuột.
Cho đến gần đây, mặc dù dữ liệu đã được giới hạn trong bảng tính hoặc cơ sở dữ liệu – tất cả đều rất trật tự và rõ ràng. Bất kỳ dữ liệu nào không được sắp xếp thành hàng và cột một cách dễ dàng sẽ gây khó khăn cho việc xử lý và bị bỏ qua. Tuy nhiên, giờ đây, những tiến bộ trong việc lưu trữ và phân tích đã cho thấy chúng ta có thể thu thập, lưu trữ và làm việc với nhiều, rất nhiều loại dữ liệu khác nhau. Kết quả là, dữ liệu ngày nay có thể bao gồm mọi thứ từ bảng tính đến những hình ảnh, video, bản ghi âm, văn bản và dữ liệu cảm biến.
Không còn nghi ngờ gì nữa khi cho rằng lượng dữ liệu tuyệt vời mà chúng ta đang tạo ra là rất lớn. Nhưng thành thật mà nói, tôi chưa bao giờ cảm thấy hoàn toàn dễ chịu với thuật ngữ “dữ liệu lớn”. Nó tạo ra cảm giác quá đơn giản đối với tôi, thuật ngữ này chỉ tập trung vào khối lượng của dữ liệu hơn là những cơ hội đáng kinh ngạc mà dữ liệu này tạo ra. Tôi ước gì có một thuật ngữ tốt hơn để mô tả sự dịch chuyển lớn lao này trong công nghệ, văn hóa và thế giới của chúng ta. Đó là lý do tại sao, trong cuốn sách này, tôi gọi nó là “dữ liệu” ở mọi ý nghĩa, dù lớn hay nhỏ – bởi vì không quan trọng là bạn có bao nhiêu dữ liệu, mà quan trọng là liệu bạn có sử dụng nó thành công hay không.
Một thế giới mới đầy thử thách (theo định hướng dữ liệu)
Dữ liệu lớn biết rất nhiều điều về bạn. Nó vượt xa việc Google biết những gì bạn đã tìm kiếm trực tuyến, và việc Facebook biết ai là bạn bè của bạn. Nhà cung cấp dịch vụ Internet của bạn biết mọi trang web mà bạn đã từng truy cập. Đã từng. Ngay cả khi bạn duyệt web ở chế độ riêng tư. Google biết tuổi tác và giới tính của bạn (ngay cả khi bạn chưa bao giờ tiết lộ với họ về điều này) và bạn có thể chắc rằng họ có một hồ sơ toàn diện về bạn, cũng như những sở thích của bạn, để họ có thể quyết định hiển thị quảng cáo nào cho bạn. Facebook rõ ràng biết những người bạn của bạn là ai và bạn đang ở trong mối quan hệ với người nào. Nhưng bạn có biết rằng Facebook cũng có thể dự đoán mối quan hệ của bạn sẽ kéo dài trong bao lâu hay không, hoặc nếu bạn đang độc thân thì khi nào bạn sẽ có một mối quan hệ tình cảm (và với ai)? Facebook cũng có thể cho biết mức độ thông minh của bạn, dựa trên phân tích về những lần ấn “thích” của bạn (Trong trường hợp bạn đang băn khoăn, thì việc “thích” chương trình Curly Fries, Science, Mozart, Thunderstorms hoặc The Daily Show được dự đoán là có trí thông minh cao, trong khi việc “thích” Harley Davidson, Lady Antebellum và I Love Being a Mom được dự đoán là có trí thông minh thấp).
Cảnh sát biết bạn đang lái xe ở đâu, điều này dĩ nhiên là ở nước Anh, nơi họ có thể truy cập hàng nghìn camera giám sát CCTV được kết nối mạng trên toàn quốc để quét biển số xe cũng như chụp lại hình ảnh của những chiếc xe hơi và tài xế của nó. Tại Mỹ, nhiều thành phố cũng sử dụng camera giao thông. Điện thoại của bạn cũng cho biết tốc độ khi bạn đang lái xe. Hiện tại, thông tin đó không được chia sẻ với cảnh sát, nhưng ngày càng có nhiều công ty bảo hiểm bắt đầu sử dụng dữ liệu điện thoại thông minh để suy đoán ai là người lái xe an toàn và ai là khách hàng tiềm năng với nhiều rủi ro hơn.
Thẻ khách hàng thân thiết từ cửa hàng tạp hóa của bạn theo dõi các thương hiệu mà bạn ưa thích và thu thập rất nhiều thông tin về các thói quen, sở thích mua hàng của bạn. Các nhà bán lẻ không những sử dụng dữ liệu này để cá nhân hóa trải nghiệm mua sắm của bạn, mà nó còn được sử dụng để dự đoán những sản phẩm mà bạn có thể muốn mua trong tương lai. Trong một trường hợp nổi tiếng, nhà bán lẻ Target tại Mỹ đã dự đoán một thiếu nữ đang mang thai (dựa trên thói quen mua hàng của cô gái này) và bắt đầu gửi cho cô ấy những lời chào hàng liên quan đến em bé sắp ra đời của cô ấy – vấn đề duy nhất trong trường hợp này là cha mẹ cô ấy vẫn chưa biết cô ấy đang mang thai.
Tuy nhiên, dữ liệu lớn lại có quyền lực hơn nhiều so với mạng truyền thông xã hội và phiếu giảm giá. Ảnh hưởng của nó lan rộng đến hầu như mọi khía cạnh của cuộc sống hiện đại, từ chăm sóc sức khỏe đến khám phá không gian vũ trụ, thậm chí đến các cuộc bầu cử chính trị của chúng ta.
Lấy ví dụ, trong một chiến dịch bầu cử theo định hướng phân tích, thì trọng tâm là nhắm đến các Swing Voters – những cử tri có khả năng bỏ phiếu cho bất kỳ ứng viên nào, hoặc những cử tri chưa có quyết định dứt khoát. Xét cho cùng, tại sao lại phải lãng phí thời gian vận động những người chắc chắn sẽ bỏ phiếu cho bạn, hay những người sẽ không bao giờ có ý định bỏ phiếu cho bạn dù trong một triệu năm? Kỹ thuật này được sử dụng lần đầu tiên trong chiến dịch vận động của Obama vào năm 2012 khi một nhóm gồm hơn 100 nhà phân tích dữ liệu được giao nhiệm vụ chạy hơn 66.000 mô phỏng máy tính mỗi ngày.
Đầu tiên, những nhà phân tích của Obama đã thu thập và hợp nhất tất cả dữ liệu họ có thể thu thập được từ dữ liệu đăng ký cử tri, các khoản đóng góp, những hồ sơ công khai và mua dữ liệu thương mại của bên thứ ba (bao gồm cả dữ liệu được khai thác từ truyền thông xã hội). Sau đó, tất cả những người đã được xác định được đánh giá về khả năng bỏ phiếu cho Obama, dựa trên hồ sơ dữ liệu của họ tương thích như thế nào với những người ủng hộ đã được biết đến trước đó. Với việc được trang bị thông tin nhân khẩu học phức tạp, nhóm nghiên cứu sau đó khởi chạy các chiến dịch vận động đã được nhắm mục tiêu. Những chiến dịch này nhắm vào việc tăng số cử tri đi bầu cử, cũng như số lượng đăng ký ở các khu vực mà khả năng bỏ phiếu ủng hộ cho ứng cử viên của họ là cao, đồng thời gây ảnh hưởng đến sự lựa chọn của cử tri thuộc các khu vực mà chỉ số ủng hộ ứng viên của họ cho thấy cử tri ở đây có thể bỏ phiếu cho bất kỳ ai. Điều này có nghĩa là các tin nhắn có chủ đích có thể được gửi đi – thông qua e-mail, các bài viết đăng trên phương tiện truyền thông xã hội và quảng cáo hiển thị hình ảnh trên trình duyệt – tùy thuộc vào việc một cá nhân có cần thiết phải được thuyết phục để đăng ký, bỏ phiếu, hoặc chọn ứng cử viên chính xác hay không.
Trong những năm sau đó, tất cả các đảng và hầu hết các ứng cử viên đều đã hăng hái đưa ra những chiến lược phân tích của riêng mình.
Dữ liệu lớn cũng giúp trả lời câu hỏi: “Liệu có tồn tại sự sống trên sao Hỏa hay không”. Phòng thí nghiệm Jet Propulsion của NASA, nơi điều hành việc lập kế hoạch nhiệm vụ hàng ngày cho tàu vũ trụ Mars Rover, hiện đang sử dụng công nghệ Elasticsearch (cũng được sử dụng bởi các công ty như Netflix và Goldman Sachs) để xử lý tất cả dữ liệu được truyền về hàng ngày từ tàu vũ trụ Rover trong suốt bốn lần cập nhật định kỳ của nó. Trong khi các quyết định lập kế hoạch nhiệm vụ từng được đưa ra dựa trên dữ liệu của ngày hôm trước, thì việc chuyển sang phân tích theo thời gian thực giúp tăng tốc thời gian cực nhanh, nhờ đó các quyết định có thể được thực hiện bằng việc kiểm soát nhiệm vụ. Các mô hình kiểu mẫu và bất thường trong các tập dữ liệu có thể được phát hiện nhanh hơn nhiều, và các mối tương quan mà có thể cung cấp những hiểu biết sâu sắc về những nhiệm vụ trọng yếu sẽ có khả năng trở nên rõ ràng hơn, dẫn đến tỷ lệ phát hiện có tính chính xác cao hơn, giảm thiểu nguy cơ trục trặc hoặc hỏng hóc.
Ngay cả việc chăm sóc sức khỏe đã không thoát khỏi sự liên quan đến dữ liệu lớn. Trong nhiều năm, cơ sở của hầu hết các nghiên cứu và phát minh y khoa đã được thu thập và phân tích dựa trên dữ liệu: người nào bị bệnh, họ bị bệnh như thế nào và lý do tại sao. Nhưng bây giờ, với các cảm biến trong điện thoại thông minh và việc các bác sĩ có thể chia sẻ thông tin giữa các chuyên khoa với nhau, số lượng và chất lượng dữ liệu có sẵn đã trở nên lớn hơn bao giờ hết, điều này có nghĩa là khả năng đột phá và thay đổi đang tăng lên theo cấp số nhân. Điện thoại thông minh và các thiết bị thông minh phổ biến khác (bao gồm Jawbone, Fitbit và những thiết bị khác) giờ đây có khả năng giúp mọi người theo dõi tiến trình của họ khi hướng đến một lối sống lành mạnh hơn. Các ứng dụng, thiết bị giúp theo dõi và giám sát các bệnh mãn tính (như tiểu đường, bệnh Parkinson hay bệnh tim) cũng đang được phát triển.
Ngành y tế đã thu thập một lượng lớn dữ liệu, nhưng nó thường được lưu giữ riêng biệt trong các văn phòng, bệnh viện và phòng khám của cá nhân các bác sĩ. Việc thống nhất dữ liệu đó – và kết hợp nó với dữ liệu được thu thập từ bệnh nhân thông qua các thiết bị thông minh – là rào cản lớn tiếp theo của ngành cần phải vượt qua. Các nhà cung cấp dịch vụ chăm sóc sức khỏe đang tập trung vào việc số hóa những hồ sơ bệnh án và đảm bảo quyền truy cập vào một bộ hồ sơ trong toàn hệ thống chăm sóc sức khỏe. Phần mềm nhận dạng các mô hình kiểu mẫu đã được sử dụng để hỗ trợ chẩn đoán. Cho đến nay, một số thuật toán đã được chứng minh là mang lại hiệu quả ngang bằng hoặc hiệu quả hơn cả những chẩn đoán của con người trong việc phát hiện ung thư. Từ đây đã tạo nên một tiềm năng đáng kinh ngạc trong việc nắm bắt nhiều căn bệnh hơn ở những giai đoạn sớm hơn, và nhờ đó làm tăng khả năng thành công trong việc điều trị. Dữ liệu lớn cũng được sử dụng để theo dõi, phân tích và điều trị những dịch bệnh trên toàn thế giới, bao gồm Ebola và Zika.
Tất cả điều này chỉ là phần nổi của tảng băng trôi, và khối lượng dữ liệu sẽ chỉ tiếp tục tăng lên. Thông thường, khi chúng ta đăng ký một sản phẩm hoặc dịch vụ mới, cho dù đó là một chiếc đồng hồ thể thao hay thẻ khách hàng thân thiết, chúng ta đều đã vui vẻ cấp quyền truy cập vào dữ liệu cá nhân của mình – để đổi lấy các lợi ích như cải thiện thể hình hoặc tích điểm cho một ly cà phê miễn phí. Khi càng nhiều công ty khai thác các khả năng của dữ liệu, và khi công nghệ dần cải tiến để thu thập được ngày càng nhiều thông tin, lượng dữ liệu có sẵn được dự đoán sẽ tăng theo cấp số nhân.
Chúng ta cũng sẽ hoàn thiện hơn trong việc phân tích khối dữ liệu này, với các công cụ mới được các công ty tung ra thị trường mỗi tuần. Thực tế, cả Microsoft và Salesforce gần đây đã công bố những công cụ cho phép những người không phải là dân lập trình tạo ra các phần mềm ứng dụng để theo dõi và phân tích dữ liệu kinh doanh. Và khi chúng ta đang dần cải thiện việc phân tích dữ liệu, khả năng của chúng ta khiến cho những dự đoán cũng được cải thiện. Công ty thông minh thị trường (market intelligence) International Data Corporation dự đoán rằng một nửa số phần mềm phân tích kinh doanh sẽ bao gồm khả năng phân tích dự đoán trước năm 2020 – điều này có nghĩa là các phần mềm không chỉ có thể dự đoán hành động của khách hàng hoặc người dùng, mà chúng còn có thể đưa ra các khuyến nghị cụ thể dựa trên những dự đoán đó. Chúng ta đang ở một giai đoạn rất thú vị trong thời kỳ dữ liệu và phân tích, và công nghệ có sẵn sau khoảng năm hoặc mười năm tới có thể cung cấp những khả năng mà chúng ta thậm chí chưa thể tưởng tượng ra được.
Một phần lý do cho sự bùng nổ dữ liệu này là mạng Internet kết nối vạn vật – Internet of Things (IoT), đôi khi được gọi là Internet of Everything (IoE). IoT đề cập đến các thiết bị thu thập và truyền dữ liệu thông qua Internet, bao gồm mọi thứ từ điện thoại thông minh, đồng hồ thông minh, vòng đeo tay theo dõi sức khỏe Fitbit, ngay cả tivi và tủ lạnh của bạn. IoT đã đạt được sự tăng trưởng rất lớn trong những năm gần đây và nó chỉ vừa mới bắt đầu. Ngày nay, có khoảng 13 tỷ thiết bị kết nối với Internet. Đến năm 2020, con số này được dự đoán sẽ tăng lên tới 50 – 70 tỷ. Riêng số lượng người dùng điện thoại thông minh được dự đoán sẽ vượt con số 6 tỷ vào năm 2020.
Các thiết bị thông minh đang biến đổi thế giới, xe hơi, nhà cửa và các doanh nghiệp của chúng ta. Đến năm 2020, 1/4 tỷ ô tô sẽ được kết nối với Internet, kích hoạt phạm vi cho toàn bộ các dịch vụ bên trong xe và việc điều khiển tự động. Điều trước kia đã từng là khoa học viễn tưởng nay đã trở thành hiện thực – xe tự lái của Google đã di chuyển được vài ngàn dặm một tuần.
Công nghệ thiết bị đeo, “Wearable”, là một phần quan trọng của IoT; và thị trường toàn cầu đối với thiết bị đeo (những thứ như điện thoại thông minh, Fitbit,…) đã tăng 223% trong năm 2015. Hiện cứ trong sáu người tiêu dùng lại có một người sở hữu và sử dụng công nghệ đeo bằng cách này hoặc cách khác. Tất cả các thiết bị này tạo ra một nguồn dữ liệu dồi dào và chúng ta chỉ vừa mới bắt đầu nhận ra được những tác động của điều này.
Các thiết bị được kết nối không chỉ có thể kết nối với Internet, chúng còn có thể kết nối và chia sẻ thông tin với nhau. Trong thực tế, các kết nối giữa máy móc với máy móc sẽ tăng lên 27 tỷ vào năm 2024. Vì vậy, trong tương lai gần, không có gì vô lý với viễn cảnh tủ lạnh của bạn sẽ biết được khi nào thì sữa trong tủ hết hạn sử dụng và tự động yêu cầu điện thoại thông minh của bạn đặt hàng nhiều hơn trong lần mua sắm trực tuyến tiếp theo.
Chúng ta đang tiến gần đến Trí tuệ Nhân tạo?
Trong thuật ngữ điện toán, Trí tuệ Nhân tạo (AI) là mục tiêu cuối cùng kể từ khi máy tính đầu tiên được phát minh. Nó cũng là một viễn cảnh hứa hẹn đầy triển vọng cho các nhà văn khoa học viễn tưởng! Nhưng cuối cùng chúng ta cũng đang từng bước tiến gần hơn đến việc nhận thức rõ về AI, đúng không? Điện toán biết nhận thức (Cognitive Computing) chắc chắn giúp chúng ta tiến một bước dài để đến gần hơn với điều đó.
Kết hợp giữa khoa học nhận thức (nghiên cứu bộ não con người) và khoa học máy tính, điện toán biết nhận thức được mong đợi sẽ tác động đến hầu hết mọi lĩnh vực trong cuộc sống, từ kinh doanh đến chăm sóc sức khỏe và thậm chí cả cuộc sống riêng tư. Mục đích là để cho phép máy tính mô phỏng suy nghĩ của con người và bắt chước cách thức hoạt động của bộ não chúng ta. Điều này cho phép máy tính thực hiện những việc mà con người có thể dễ dàng làm được, như việc hiểu ngôn ngữ tự nhiên hay nhận ra các đối tượng trong một bức tranh.
Hệ thống Watson của IBM là một ví dụ điển hình về điện toán biết nhận thức. Hệ thống này “học” trong khi nó xử lý thông tin, vì vậy khi càng có nhiều dữ liệu cung cấp cho hệ thống, nó sẽ học được càng nhiều và càng trở nên chính xác hơn. Trên thực tế, công nghệ này có thể được sử dụng trong bất kỳ lĩnh vực nào sở hữu một lượng lớn dữ liệu phức tạp cần được xử lý và phân tích để giải quyết các vấn đề, bao gồm chăm sóc sức khỏe, pháp luật, giáo dục, tài chính, và tất nhiên là cả kinh doanh. Công nghệ này đã và đang được sử dụng trong ngành khách sạn. Khách sạn Hilton gần đây đã cho ra mắt người máy quản gia đầu tiên, Connie, “người quản gia” này có thể hiểu ngôn ngữ tự nhiên và trả lời các câu hỏi của khách hàng về khách sạn, các điểm tham quan địa phương, nhà hàng,…
Khi máy tính có nhiều khả năng suy nghĩ như con người hơn, chúng nâng cao kiến thức và những khả năng của chúng ta. Cũng giống như khi những anh hùng trong các bộ phim khoa học viễn tưởng chuyển sang dùng máy tính của họ để phân tích, dự đoán và kết luận về những việc cần làm tiếp theo, trong đời thực chúng ta đang chuyển sang một kỷ nguyên mà máy tính có thể nâng cao kiến thức của con người theo những cách hoàn toàn mới.
Điện toán nhận thức được củng cố bằng công nghệ học máy (machine learning) và học sâu (deep learning), cho phép các máy tính tự động học hỏi từ dữ liệu. Công nghệ này có nghĩa là máy tính có thể tự thay đổi và cải thiện thuật toán của mình, mà không cần phải được lập trình một cách rõ ràng bởi con người. Vậy thì nó hoạt động như thế nào? Nói một cách đơn giản, nếu chúng ta cung cấp cho máy tính hình ảnh của một con mèo và hình ảnh của một quả bóng, và cho biết đâu là hình ảnh của một con mèo, thì sau đó chúng ta có thể yêu cầu máy tính lựa chọn những bức ảnh nào tiếp theo có chứa hình ảnh con mèo. Máy tính so sánh các hình ảnh đầu vào với tập dữ liệu huấn luyện của nó (tức là hình ảnh con mèo ban đầu) và đưa ra câu trả lời. Các thuật toán học máy ngày nay có thể làm điều này mà không cần giám sát, có nghĩa là chúng không cần được lập trình trước các quyết định của chúng. Nguyên tắc tương tự cũng áp dụng cho các nhiệm vụ thậm chí phức tạp hơn, dẫu với một tập dữ liệu huấn luyện lớn hơn nhiều. Ví dụ, các thuật toán nhận dạng giọng nói của Google hoạt động dựa trên một tập dữ liệu huấn luyện đồ sộ, nhưng như thế vẫn chưa đủ lớn để dự đoán được mọi từ, cụm từ hoặc câu hỏi có thể có.
Nhưng công nghệ đang được liên tục cải thiện, học máy và học sâu sẽ chịu trách nhiệm cho những tiến bộ về tầm nhìn máy tính, nhận dạng giọng nói và âm thanh, cũng như xử lý ngôn ngữ tự nhiên. Đó là những gì cho phép máy tính giao tiếp với con người (không phải lúc nào cũng thành công 100%, được chứng minh bởi con bot trên Twitter, như một việc hơi điên rồ và kỳ thị của Microsoft), và khiến cho những chiếc xe tự lái của Google trở nên khả thi. Đó cũng là lý do Facebook đạt được trình độ ngang hàng với con người trong việc nhận ra các cá nhân trong những bức ảnh, và tự động đề xuất gắn thẻ (tag) cho các cá nhân đó.
Như vậy, có phải trí thông minh nhân tạo đã rất gần với chúng ta hay không? Có lẽ là không, ít nhất là không phù hợp với khoa học viễn tưởng. Nhiều nhà khoa học tin rằng máy tính sẽ không bao giờ có thể “suy nghĩ” như bộ não của con người. Dù bạn nhìn nhận nó như thế nào đi nữa, khả năng xem xét, hiểu và tương tác của máy tính với thế giới xung quanh chúng đang tăng lên với tốc độ đáng kinh ngạc. Và khi lượng dữ liệu mà chúng ta có tiếp tục tăng lên, thì khả năng học tập, hiểu biết và phản ứng của những chiếc máy tính cũng sẽ gia tăng.
Công nghệ đã phát triển đến mức mà giờ đây việc máy tính nhận biết và phản ứng lại với những cảm xúc của con người là hoàn toàn khả thi. Được biết đến như là “máy tính có cảm xúc”, công nghệ này phân tích các biểu hiện trên khuôn mặt, tư thế, cử chỉ, tông giọng, cách nói, thậm chí là nhịp điệu và lực tác động lên các tổ hợp phím, để ghi lại những thay đổi trạng thái cảm xúc của người dùng.
Hãy tưởng tượng về tiềm năng của công nghệ này. Máy tính của bạn có thể nhận biết khi nào bạn đang thất vọng hoặc đang vật lộn với một nhiệm vụ, và sẽ cung cấp thêm thông tin để giúp bạn tiếp tục làm việc. Điện thoại của bạn có thể yêu cầu bạn nghỉ giải lao khi mức độ căng thẳng của bạn tăng cao. Hoặc ngay cả khi không được yêu cầu, ngôi nhà thông minh của bạn cũng có thể mở nhạc và ánh sáng dịu nhẹ khi bạn quay trở về sau một ngày tồi tệ từ văn phòng làm việc. Nếu tất cả điều này nghe có vẻ hơi xa vời, thì kỳ thực không phải như vậy. Các tổ chức hàng đầu như Disney, BBC và Coca-Cola đã hợp tác với Affectiva, một công ty chuyên về công nghệ nhận diện khuôn mặt, để kiểm tra tính hiệu quả của quảng cáo và đánh giá cách người xem phản ứng với nội dung như thế nào. Một công ty tương tự cũng đang làm việc với một công ty xe hơi Nhật Bản để tạo ra công nghệ có thể phát hiện được khi nào bạn bị phân tâm hay buồn ngủ trong lúc chạy xe, và liên hệ với các dịch vụ khẩn cấp hoặc người thân của bạn trong trường hợp cấp bách. Microsoft thậm chí đã thử nghiệm một chiếc áo ngực có thể cảm nhận được mức độ căng thẳng ở phụ nữ.
Cũng giống như việc các máy tính không bao giờ có thể học tập để “suy nghĩ” giống như cách bộ não con người có thể làm, những cỗ máy này sẽ không bao giờ thực sự có xúc cảm, nhưng chúng ta đang tiệm cận với thời đại khi mà máy móc ít nhất sẽ đáp trả chúng ta bằng những phản ứng cảm xúc phù hợp. Phần thực sự thú vị là chúng ta chỉ vừa mới bắt đầu khám phá ra những khả năng của tất cả công nghệ này. Trong 20 năm tới, điện toán biết nhận thức và máy tính có cảm xúc sẽ là công nghệ chiếm xu thế chủ đạo.
Dữ liệu đang cách mạng hóa thế giới kinh doanh như thế nào?
Tôi toàn tâm toàn ý tin rằng dữ liệu lớn và những tác động của nó sẽ ảnh hưởng đến mỗi một doanh nghiệp – từ những doanh nghiệp nằm trong danh sách Fortune 500 đến các doanh nghiệp nhỏ – và thay đổi cách thức chúng ta kinh doanh, từ trong ra ngoài. Không quan trọng bạn hoạt động trong lĩnh vực nào hay quy mô kinh doanh của bạn ra sao, khi việc thu thập, phân tích và giải thích dữ liệu dần trở nên dễ tiếp cận hơn, chúng sẽ có tác động đến mọi doanh nghiệp.
Việc sử dụng dữ liệu rất quan trọng trong kinh doanh
Có ba mảng cốt lõi mà dữ liệu thực sự quan trọng đối với doanh nghiệp: cải thiện việc ra quyết định, cải thiện các hoạt động và tạo ra doanh thu từ dữ liệu.
Đầu tiên, dữ liệu lớn cho phép các công ty thu được thông minh thị trường và thông minh khách hàng tốt hơn. Với lượng dữ liệu có sẵn tăng nhanh chưa từng có, các công ty đang có được những hiểu biết sâu sắc hơn về những gì khách hàng mong muốn, những gì họ sử dụng (và cách họ dùng), cách họ mua hàng hóa và họ nghĩ gì về những hàng hóa, dịch vụ đó. Và thông tin này có thể được sử dụng để đưa ra quyết định tốt hơn trên tất cả các lĩnh vực của doanh nghiệp, từ thiết kế sản phẩm và dịch vụ đến bán hàng, marketing và bảo trì.
Thứ hai, dữ liệu lớn giúp các công ty đạt được hiệu quả và cải thiện hoạt động của họ. Từ việc theo dõi hiệu suất máy móc để tối ưu hóa các tuyến phân phối, thậm chí đến việc tuyển dụng được nhân tài giỏi nhất, dữ liệu lớn có thể cải thiện hiệu quả và hoạt động liên ngành cho hầu hết mọi loại hình kinh doanh và trong nhiều bộ phận khác nhau. Các công ty thậm chí còn bắt đầu sử dụng cảm biến để theo dõi những hoạt động, sự căng thẳng, sức khỏe của các nhân viên, thậm chí cả những người họ trò chuyện cùng và giọng nói mà họ dùng, rồi sử dụng dữ liệu đó để cải thiện sự hài lòng và năng suất của nhân viên.
IoT đóng một vai trò rất lớn trong việc cải thiện hiệu suất hoạt động. Một phần lớn của IoT không hẳn là thiên về các thiết bị thông minh, mà là về cảm biến. Những sáng tạo nhỏ này có thể được gắn vào mọi thứ – từ những cốc sữa chua, đến xi măng trong cầu đường – sau đó ghi chép và gửi dữ liệu trở về điện toán đám mây. Điều này sẽ cho phép các doanh nghiệp thu thập ngày càng nhiều phản hồi cụ thể hơn về cách thức sản phẩm hoặc thiết bị được sử dụng, khi nào thì chúng hư hỏng hay thậm chí người dùng mong muốn sử dụng trong tương lai. Ví dụ, động cơ máy bay Rolls-Royce chứa các cảm biến có thể gửi dữ liệu thời gian thực về chức năng của động cơ về các trạm giám sát trên mặt đất. Thông tin này có thể được sử dụng để phát hiện những trục trặc trước khi chúng trở thành thảm họa, có thể được dùng để điều tra và hy vọng ngăn chặn được các nguyên nhân gây nên thảm họa máy bay.
Thứ ba, dữ liệu cũng cung cấp cơ hội cho các công ty để xây dựng dữ liệu lớn đối với việc cung cấp sản phẩm của họ – từ đó tạo ra được doanh thu từ chính dữ liệu đó. John Deere là một ví dụ tuyệt vời cho một công ty không chỉ sử dụng dữ liệu để mang lại lợi ích cho khách hàng, mà còn xem nó như là việc cung cấp một sản phẩm mới. Tất cả các máy kéo mới của John Deere đều được trang bị cảm biến có thể giúp công ty hiểu được thiết bị đang được sử dụng như thế nào, dự đoán và chẩn đoán những sự cố.
Họ cũng đã đưa các bộ cảm biến vào để phục vụ cho những người nông dân, cung cấp quyền truy cập vào dữ liệu về thời điểm gieo trồng, nơi canh tác, các mô hình tốt nhất để cày xới và gặt hái, và nhiều hơn thế nữa. Nó trở thành một dòng doanh thu hoàn toàn mới đối với một công ty từng được xem là công ty truyền thống.
Hãy xem xét một số ví dụ khác chứng minh cho khả năng ứng dụng rộng rãi của dữ liệu lớn. Đầu tiên, quản lý chuỗi cung ứng là một lĩnh vực mà dữ liệu lớn và các phân tích có các ứng dụng rõ ràng. Tất nhiên, chuỗi cung ứng trong một thời gian dài đến nay đã được định hướng bởi số liệu thống kê và các chỉ số hoạt động định lượng. Nhưng hình thức phân tích thực sự đang cách mạng hóa ngành công nghiệp ngày nay – phân tích thời gian thực các tập dữ liệu lớn và đang phát triển nhanh chóng – phần lớn lại vắng mặt. Nhiều yếu tố có thể tác động rõ ràng đến quản lý chuỗi cung ứng – từ thời tiết đến tình trạng của xe cộ và máy móc, vì thế các nhà lãnh đạo trong lĩnh vực này gần đây đã trăn trở về cách thức khai thác phương thức này để thúc đẩy hiệu quả.
Các ứng dụng dành cho phân tích dữ liệu đã được tìm thấy trong việc quản lý hàng tồn kho, dự báo và vận chuyển hàng hóa. Trong các nhà kho, các camera kỹ thuật số thường được sử dụng để giám sát mức độ lưu trữ hàng hóa, và dữ liệu này sẽ đưa ra cảnh báo khi cần bổ sung. Dự báo sẽ đưa quá trình này tiến thêm một bước nữa – cùng một dữ liệu từ camera có thể được cấp thông qua các thuật toán học máy để dạy cho hệ thống quản lý kho thông minh với mục đích dự đoán khi nào cần cung cấp trở lại. Những cơ hội tạo hiệu quả và tiết kiệm thông qua việc sử dụng các dữ liệu đang có ở khắp mọi nơi, và nhiều nỗ lực phối hợp đang được đưa vào việc tìm kiếm chúng. Cuối cùng, về lý thuyết thì các kho chứa và các trung tâm phân phối sẽ tự vận hành một cách hiệu quả với rất ít nhu cầu tương tác từ phía con người.
Trong lĩnh vực bán lẻ, cả các nhà bán lẻ trực tuyến và ngoại tuyến, những ai đang theo đuổi chiến lược ưu tiên hàng đầu hướng đến việc hiểu được khách hàng của họ, kết hợp những sản phẩm phù hợp với khách hàng, chia tay với tiền mặt đều đang thu về lợi nhuận. Ngày nay, các nhà bán lẻ liên tục tìm kiếm các phương pháp đổi mới sáng tạo để thu được những hiểu biết sâu sắc từ lượng thông tin sẵn có về hành vi của khách hàng đang ngày càng gia tăng của họ. Phân tích dữ liệu lớn đang được áp dụng ở mọi giai đoạn của quá trình bán lẻ – tìm ra những sản phẩm phổ biến trong tương lai dựa vào việc dự đoán những xu hướng, dự báo những nơi sẽ có nhu cầu cho những sản phẩm đó, tối ưu hóa giá cả cho lợi thế cạnh tranh, xác định những khách hàng có khả năng quan tâm đến chúng và tìm ra phương pháp tiếp cận họ tốt nhất, nhận tiền từ họ và cuối cùng tính toán được những thứ sẽ tiếp tục bán cho họ.
Trong lĩnh vực ngân hàng, Ngân hàng Hoàng gia Scotland (RBS) đã phát triển một chiến lược dữ liệu lớn được gọi là “Cá nhân hóa” trong một nỗ lực để kết nối lại với những khách hàng của họ. Ngân hàng hiện đang trải qua quá trình tư nhân hóa trở lại sau bảy năm kể từ khi những người nộp thuế ở Vương quốc Anh đóng khoản tiền 45 tỷ bảng Anh trong cuộc khủng hoảng tài chính, đang kết hợp phân tích dữ liệu với một cách tiếp cận “trở lại những năm 1970” đối với dịch vụ khách hàng. Triết lý này là một trong những bước phát triển của bộ phận phân tích tương đương với sức mạnh của 800 người, được tạo ra như là một phần của khoản đầu tư 100 triệu bảng Anh vào kỹ năng và công nghệ phân tích trong toàn tổ chức.
Động thái này nhằm vào việc phục hồi sự gián đoạn xảy ra giữa các ngân hàng và khách hàng sau những năm 1970. Lý thuyết này cho rằng những nỗ lực ban đầu trong việc marketing theo định hướng dữ liệu, chẳng hạn như phân khúc đối tượng và gửi thư hàng loạt, đã quá tập trung vào những gì các ngân hàng muốn – thường là bán hàng – và thường bỏ qua những gì khách hàng mong đợi. Kế hoạch này là để khôi phục lòng tin và cảm giác được hỗ trợ mà những khách hàng của ngân hàng mong đợi trong những năm 1970 hoặc trước đó – khi nhân viên ngân hàng biết tên khách hàng, hiểu được nhu cầu của họ ở cấp độ cá nhân và cố gắng cung cấp dịch vụ hỗ trợ cho những nhu cầu đó.
Như một ví dụ về chiến lược mới trong hoạt động, các nhà phân tích đã kết hợp dữ liệu giao dịch tài chính để xác định các tình huống mà khách hàng có thể đã phải thanh toán hai lần cho các dịch vụ có sẵn trong “gói” đi kèm với tài khoản ngân hàng – chẳng hạn như bảo hiểm điện thoại di động hoặc hỗ trợ sự cố. Mặc dù lúc đầu đã có những lo ngại rằng việc thông báo cho khách hàng về tình huống này có thể nhắc nhở những khách hàng đó hủy bỏ sản phẩm RBS của họ trong ít nhất một vài trường hợp, nhưng trên thực tế, mỗi người khi được thông báo đều đã chọn hủy dịch vụ bị trùng lặp của bên thứ ba và giữ lại dịch vụ RBS của họ.
Các dịch vụ khác nằm trong biểu ngữ “Cá nhân hóa” bao gồm lời chúc mừng sinh nhật cho khách hàng nếu họ đến chi nhánh vào ngày hôm đó, và tin nhắn tự động để họ biết rằng tiền của họ vẫn an toàn nếu họ vô tình bỏ lại sau khi rút tiền từ một máy ATM nào đó.
Dữ liệu lớn thậm chí còn tối ưu hóa việc phân phối bánh pizza vào tối thứ Sáu của bạn. Domino’s, chuỗi cung ứng bánh pizza lớn nhất thế giới, đã liên tục thúc đẩy thương hiệu của mình lên tầm công nghệ mới và phát triển, và giờ đây chúng ta đã có thể đặt pizza thông qua Twitter, Facebook, đồng hồ thông minh hay tivi, và hệ thống giải trí đặt trong xe hơi như hệ thống Synch của Ford. Vì vậy, thoạt nhìn có vẻ như pizza và dữ liệu lớn không có liên hệ gì với nhau, nhưng công tác hậu cần cho việc cung cấp gần một triệu pizza mỗi ngày trên 70 quốc gia đã chứng tỏ một cách xác đáng các vấn đề mà dữ liệu lớn đang vượt qua.
Cách tiếp cận đa kênh (multi-channel) của Domino’s nhằm tương tác với khách hàng đã mang đến cho họ cơ hội để tạo ra và nắm bắt nhiều dữ liệu – thứ mà Domino’s sử dụng để cải thiện hiệu quả marketing của họ. Dữ liệu được thu thập thông qua tất cả các kênh của nó – tin nhắn, Twitter, Android, Amazon Echo, chỉ liệt kê một phần rất nhỏ – được đưa vào Khung quản lý thông tin của Domino’s. Tại đây, chúng được kết hợp với nguồn dữ liệu phong phú từ một số lượng lớn các nguồn của bên thứ ba, chẳng hạn như Dịch vụ Bưu điện Mỹ, cũng như thông tin mã địa lý, dữ liệu nhân khẩu học, và dữ liệu đối thủ cạnh tranh, để cho phép việc phân khúc khách hàng chuyên sâu. Điều này có nghĩa là các khách hàng cá nhân hoặc hộ gia đình có thể được hiện diện với các phân lớp trình bày hoàn toàn khác nhau – các phiếu giảm giá và các đề xuất sản phẩm khác nhau – dựa trên mô hình thống kê của khách hàng phù hợp với hồ sơ cá nhân của họ. Cũng giống như quá trình phân khúc khách hàng, dữ liệu được sử dụng để đánh giá hiệu suất, thúc đẩy sự tăng trưởng tại từng cửa hàng và các nhóm nhượng quyền thương mại.
Các nhà máy thông minh và cách mạng công nghiệp 4.0
Cuộc cách mạng công nghiệp thứ nhất xuất hiện với những cỗ máy hơi nước đầu tiên, chúng đã cơ giới hóa một số công việc mà tổ tiên chúng ta đã làm. Tiếp theo là sự xuất hiện của điện, dây chuyền lắp ráp và sự ra đời của sản xuất hàng loạt. Kỷ nguyên thứ ba của cuộc cách mạng công nghiệp là sự ra đời của máy tính và sự khởi đầu của tự động hóa, khi robot và máy móc bắt đầu thay thế nhân công trong những dây chuyền lắp ráp này. Và giờ đây chúng ta bước vào thời kỳ được gọi là cuộc cách mạng công nghiệp lần thứ tư, cách mạng công nghiệp 4.0, khi máy tính và quá trình tự động hóa sẽ kết hợp với nhau theo một cách hoàn toàn mới, nơi mà robot được kết nối từ xa đến các hệ thống máy tính được trang bị các thuật toán học máy có thể học tập và điều khiển robot với rất ít sự tác động từ con người.
Cách mạng công nghiệp 4.0 giới thiệu khái niệm “nhà máy thông minh”, trong đó các hệ thống không gian mạng thực-ảo (kết hợp máy tính, mạng lưới và hành động vật lý) giám sát các quy trình vật lý của nhà máy và đưa ra các quyết định phi tập trung. Trong nhà máy thông minh, các máy móc được tăng cường với kết nối mạng và được kết nối với một hệ thống có khả năng hình dung được toàn bộ dây chuyền sản xuất và tự ra quyết định. Về cơ bản, chúng trở thành hệ thống IoT, giao tiếp và hợp tác với nhau và với con người trong thời gian thực thông qua mạng không dây.
Đối với một nhà máy hoặc hệ thống được coi là Công nghiệp 4.0, nó phải bao gồm bốn tính năng: 1) khả năng tương tác, tức là máy móc, thiết bị, cảm biến và con người kết nối và giao tiếp với nhau; 2) minh bạch thông tin, nơi mà các hệ thống tạo ra một bản sao ảo của thế giới thực thông qua dữ liệu cảm biến để bối cảnh hóa thông tin; 3) hỗ trợ kỹ thuật, cả về khả năng của các hệ thống trong việc hỗ trợ con người đưa ra quyết định và giải quyết vấn đề, và khả năng hỗ trợ con người với các nhiệm vụ quá khó hoặc không an toàn cho con người; và 4) đưa ra quyết định phi tập trung, nơi mà các hệ thống không gian mạng thực-ảo đưa ra các quyết định đơn giản cho riêng mình, và trở nên tự trị nhất có thể.
Giống như bất kỳ sự dịch chuyển lớn nào trong ngành công nghiệp, vẫn có những thách thức trong việc áp dụng cách tiếp cận này. Các vấn đề về bảo mật dữ liệu tăng lên khi bạn tích hợp các hệ thống mới và tăng quyền truy cập vào các hệ thống đó. Các hệ thống cần phải cực kỳ đáng tin cậy và ổn định để các hoạt động không gian mạng thực-ảo thành công; điều này khó có thể để đạt được và duy trì, đặc biệt khi bạn xem xét liệu có thiếu kinh nghiệm và nhân lực theo hệ thống hay không để tạo lập và triển khai các hệ thống này. Tương tự như vậy, việc tránh các vấn đề về kỹ thuật có thể gây ra sự cố ngừng sản xuất đầy tốn kém luôn là mối quan tâm hàng đầu. Thêm vào đó, cũng có thể có vấn đề trong việc duy trì tính toàn vẹn và chất lượng của quá trình sản xuất khi mà sự giám sát của con người ít hơn. Cuối cùng, bất cứ khi nào quá trình tự động hóa mới được đưa vào hoạt động, luôn luôn tồn tại nguy cơ đánh mất việc làm có giá trị của con người. Tất cả những vấn đề này kết hợp với sự miễn cưỡng chung từ các bên liên quan và các nhà đầu tư cho việc đầu tư mạnh vào các công nghệ mới tốn kém khiến cho cuộc cách mạng công nghiệp 4.0 có nhiều rào cản cần phải vượt qua trước khi nó trở thành xu hướng chủ đạo.
Nhưng những lợi ích của mô hình Công nghiệp 4.0 có thể vượt xa những lo ngại cho nhiều cơ sở sản xuất. Ví dụ, trong môi trường làm việc rất nguy hiểm, sức khỏe và sự an toàn của người lao động có thể được cải thiện đáng kể. Chuỗi cung ứng có thể được kiểm soát dễ dàng hơn khi có được dữ liệu ở mọi cấp độ của quy trình sản xuất và phân phối. Kiểm soát máy tính có thể tạo ra năng suất và sản lượng đáng tin cậy, ổn định hơn nhiều. Và kết quả cho những doanh nghiệp đó là có thể làm tăng doanh thu, thị phần và lợi nhuận.
Trong cuốn The Fourth Industrial Revolution1 của mình, Giáo sư Klaus Schwab, người sáng lập và Chủ tịch điều hành Diễn đàn Kinh tế Thế giới, mô tả cuộc cách mạng lần thứ tư này về cơ bản là khác biệt so với ba cuộc cách mạng trước đó như thế nào, đó là những cuộc cách mạng được đặc trưng chủ yếu bởi những tiến bộ trong công nghệ. Trong cuộc cách mạng lần thứ tư này, chúng ta đang đối mặt với một loạt các công nghệ mới kết hợp thế giới vật lý, kỹ thuật số và sinh học. Những kỹ thuật mới này sẽ tác động đến tất cả các ngành, nền kinh tế và công nghiệp, và thậm chí thách thức cả những ý tưởng của chúng ta về ý nghĩa của nó đối với con người. Những công nghệ này có tiềm năng to lớn để tiếp tục kết nối hàng tỷ con người với mạng lưới, cải thiện đáng kể hiệu quả của các doanh nghiệp và tổ chức, cũng như giúp tái tạo môi trường tự nhiên thông qua việc quản lý tài sản tốt hơn, thậm chí có tiềm năng khắc phục tất cả các thiệt hại mà các cuộc cách mạng công nghiệp trước đó đã gây ra.
Các báo cáo cũng chỉ ra rằng các thị trường mới nổi như Ấn Độ có thể tận dụng rất tốt từ thực tiễn của cuộc cách mạng công nghiệp 4.0, và thành phố Cincinnati, Ohio đã tuyên bố là “thành phố thí điểm công nghiệp 4.0” để khuyến khích đầu tư và đổi mới trong lĩnh vực sản xuất ở đó.
Như vậy, câu hỏi không phải là cách mạng công nghiệp 4.0 có đang đến hay không, mà là nó đến nhanh như thế nào. Tôi cho rằng những người chấp nhận sớm sẽ có được phần thưởng xứng đáng cho sự can đảm của họ khi bước chân vào cuộc cách mạng công nghệ mới này, và những người lẩn tránh rủi ro trong việc thay đổi này sẽ bị bỏ lại phía sau.
Tự động hóa và mối đe dọa (rất thực tế) đối với các vấn đề việc làm
Khi quá trình tự động hóa tăng lên, máy tính và máy móc sẽ thay thế nhân công trên phạm vi rộng lớn các ngành nghề – từ lái xe đến kế toán, từ nhân viên bất động sản đến nhân viên bảo hiểm. Theo ước tính, có tới 47% việc làm ở Mỹ có nguy cơ bị tự động hóa.
Khi bạn đọc hoặc là nghe những câu chuyện, tin tức về sự tiếp quản sắp xảy ra của robot và thuật toán sẽ loại bỏ công ăn việc làm của những người lao động, trong rất nhiều trường hợp, những ví dụ đầu tiên được đưa ra là những công việc chân tay nhận lương theo giờ (như công nhân nhà máy và tài xế taxi). Nhưng những công việc chuyên môn cũng có nhiều nguy cơ bị chuyển giao cho máy tính. Càng ngày càng nhiều các thuật toán và học máy phức tạp đang chứng minh những công việc trước đây được cho rằng chỉ nằm trong tầm kiểm soát của con người lại có thể được thực hiện tốt, hay thậm chí tốt hơn bởi máy móc. Nhóm tư vấn Boston (Boston Consulting Group) đã dự đoán rằng đến năm 2025, khoảng 1/4 công việc hiện có sẽ được thay thế bằng phần mềm thông minh hoặc là robot2. Một nghiên cứu của Đại học Oxford cho rằng có tới 35% công việc hiện tại ở Anh có nguy cơ bị tự động hóa trong vòng 20 năm tới3.
Hãy xem xét một số ví dụ nữa. Trong ngành bảo hiểm, những công thức đã được sử dụng trong nhiều thập kỷ để quyết định mức bảo hiểm mà một người đủ điều kiện được chi trả là bao nhiêu và ở mức nào. Nhưng phần lớn những gì các nhà môi giới và bảo hiểm thực hiện ngày nay có thể được hoàn thành bằng máy tính sử dụng dữ liệu lớn và học máy, và các công cụ mới đang tự động hóa quy trình ra quyết định này nhiều hơn nữa, làm giảm nhu cầu tác động từ con người.
Các kiến trúc sư cũng có thể bị đe dọa. Các chương trình đã tồn tại để giúp các cá nhân tự thiết kế những ngôi nhà của riêng mình, làm cho các lựa chọn về kiến trúc và thiết kế tự động hơn. Hiện tại, những công cụ này chủ yếu được sử dụng làm công cụ trực quan hoặc để thay thế kiến trúc sư ở các dự án rất nhỏ hoặc đơn giản. Nhưng khi những chương trình này trở nên tinh vi hơn, nhu cầu về kiến trúc sư và những nhà thiết kế các tòa nhà là con người thật sẽ giảm đi.
Trong ngành tài chính, các thuật toán giờ đây có thể phân tích dữ liệu tài chính và chuẩn bị các tài khoản (cũng như thực hiện việc khai báo thuế) – mà không cần đến nhân viên kế toán. Nhân viên ngân hàng đã được thay thế một phần bởi máy ATM, nhưng sắp tới đây thậm chí những nhân viên ngân hàng cao cấp hơn, bao gồm cả nhân viên tín dụng, cũng có thể dễ dàng bị thay thế bởi hệ thống tự động. Ngay cả các chính phủ hiện cũng đang sử dụng dữ liệu lớn và học máy để kiểm tra việc khai báo thuế và xác định khả năng gian lận trong các vấn đề về thuế. Chúng ta biết rằng máy tính đã được sử dụng để làm cho các giao dịch chứng khoán nhanh hơn so với con người có thể làm và thậm chí có thể được sử dụng để dự đoán thị trường sẽ phản ứng ra sao, cũng như đưa ra các khuyến nghị cho bạn liệu nên mua hay nên bán.
Các nguồn nhân lực, việc săn đầu người và tuyển dụng đã bị ảnh hưởng bởi việc khai thác dữ liệu khi các thuật toán đảm nhận công việc phân loại thông qua các hồ sơ để tìm ra những ứng cử viên hoàn hảo. Các nhiệm vụ nhân sự truyền thống khác, bao gồm việc thu thập và sắp xếp hồ sơ giấy tờ, tư vấn cho nhân viên về các lợi ích… cũng có thể dễ dàng được tự động hóa.
Công việc marketing hầu như liên quan đến các kỹ năng của con người, như là khả năng thuyết phục và khả năng lôi kéo người khác. Nhưng nó thậm chí vẫn được chuyển giao thành công cho máy tính. Persado, một công ty phần mềm ngôn ngữ tự nhiên, đã đưa ra một nhiệm vụ cho máy tính là viết ra các dòng tiêu đề e-mail hấp dẫn cho các tổ chức bán lẻ lớn để tăng gấp đôi tỷ lệ mở e-mail. Các công ty cũng đang thử nghiệm việc mua quảng cáo tự động – thay vì để mọi người chọn tạp chí và lựa chọn vị trí các trang để đặt quảng cáo vào, máy tính sẽ đảm nhiệm việc này, bằng việc sử dụng hàng tỷ điểm dữ liệu để tham khảo.
Thậm chí luật sư, một trong những nghề tinh túy nhất, cũng có thể bị ảnh hưởng. Trong giai đoạn tìm hiểu một vụ kiện, những luật sư và nhân viên pháp lý có thể được yêu cầu phải sàng lọc qua hàng nghìn, thậm chí hàng chục nghìn tài liệu, tùy thuộc vào vụ việc. Giờ đây, các cơ sở dữ liệu phức tạp đã có thể sử dụng các kỹ thuật dữ liệu lớn như phân tích cú pháp và nhận diện từ khóa để thực hiện các nhiệm vụ tương tự trong thời gian ít hơn nhiều. Trên thực tế, hoàn toàn khả thi khi một hệ thống học máy theo phong cách Watson có thể “được huấn luyện” một cách hợp pháp để xem xét tiền lệ và lịch sử vụ kiện, thậm chí phác thảo bản tóm tắt pháp lý – theo truyền thống thì đây là công việc của những cộng sự có vị trí thấp hơn các luật sư thành viên. Nhưng đừng nghĩ rằng chỉ những công việc của các luật sư cộng sự cấp thấp mới bị đe dọa; ngay cả các luật sư đang được trả lương cao để dự đoán kết quả của những vụ việc lớn, thì một mô hình thống kê được tạo ra bởi các nhà nghiên cứu tại Đại học bang Michigan và Đại học Luật Nam Texas đã có thể dự đoán kết quả của gần 71% các vụ việc của Tòa án Tối cao Mỹ4. Khả năng dự đoán kết quả có lẽ là dịch vụ đáng giá (và sinh lợi) nhất mà các luật sư cung cấp, và nó đã được hoàn thành bởi một máy tính.
Khi máy tính trở nên tinh vi hơn theo cấp số nhân, lẽ tự nhiên theo đó là chúng sẽ có thể thực hiện công việc phức tạp hơn. Nhược điểm rõ ràng là các cuộc cách mạng công nghệ này có thể không tạo ra nhiều việc làm như khi chúng loại bỏ những công việc đó. Chắc chắn rằng, chúng ta sẽ cần nhiều lập trình viên, nhà thống kê, kỹ sư, nhà phân tích dữ liệu và nhân viên công nghệ thông tin để tạo ra và quản lý các máy tính phức tạp này, nhưng không phải mọi công nhân nhà máy đều có thể dễ dàng thay đổi đột ngột và trở thành nhà phân tích dữ liệu.
Về mặt tích cực, việc tự động hóa tốt hơn sẽ là một nguồn lợi lớn trong nhiều ngành công nghiệp, dẫn đến gia tăng đáng kể độ chính xác và năng suất (Ví dụ, bất kỳ luật sư nào cũng sẽ đồng ý rằng một giai đoạn tìm hiểu nhanh hơn, khám phá toàn diện hơn là một lợi ích cho quy trình pháp lý). Cuối cùng, tôi tin rằng khả năng cải thiện việc ra quyết định kinh doanh, quy trình vận hành, trải nghiệm sản phẩm và trải nghiệm khách hàng của chúng ta là quá lớn đến mức không thể bỏ qua.
Công nghệ blockchain: Tương lai của dữ liệu và kinh doanh?
Gần đây, có rất nhiều quảng cáo thổi phồng về công nghệ blockchain. Trên thực tế, một báo cáo của Diễn đàn Kinh tế Thế giới gần đây dự đoán rằng đến năm 2025, có khoảng 10% GDP (tổng sản phẩm quốc nội) sẽ được lưu trữ trên các blockchain – làm cho nó trở thành điều mà mỗi lãnh đạo kinh doanh ít nhất phải nhận thức được5.
Vậy công nghệ blockchain là gì? Vâng, chúng ta đã quen với việc chia sẻ thông tin thông qua Internet, nhưng khi nói đến việc chuyển đổi giá trị (ví dụ như tiền), chúng ta thường quay trở lại các tổ chức tài chính tập trung (như ngân hàng). Ngay cả các hệ thống thanh toán trực tuyến như PayPal cũng thường yêu cầu tài khoản ngân hàng hoặc thẻ tín dụng để sử dụng chúng. Công nghệ blockchain mang lại cơ hội để loại bỏ bộ phận trung gian này bằng cách thực hiện các nhiệm vụ truyền thống được xử lý bởi các tổ chức dịch vụ tài chính, như là các giao dịch ghi chép, thiết lập danh tính và thiết lập hợp đồng. Nó cho phép các giao dịch ngang hàng diễn ra một cách hiệu quả, giống như Bitcoin (tiền mã hóa Bitcoin có nền tảng từ công nghệ blockchain). Một blockchain cho phép bất kỳ ai gửi giá trị đến bất cứ nơi đâu trên thế giới, nơi mà các tập tin blockchain có thể được truy cập tại đó. Mỗi chuỗi (chain) về cơ bản chỉ là một cơ sở dữ liệu trực tuyến, được lưu trữ theo kiểu phân tán, ngang hàng giữa những người dùng của nó. Cách thức mã hóa đảm bảo rằng người dùng chỉ có thể chỉnh sửa các phần của blockchain mà họ “sở hữu” – bằng việc sở hữu các chìa khóa cá nhân cần thiết để chỉnh sửa tập tin. Bằng cách cung cấp chìa khóa cá nhân mà bạn sở hữu cho người khác, bạn đã chuyển giao giá trị của bất kỳ thứ gì được lưu trữ trong phần đó của blockchain một cách hiệu quả.
Microsoft, IBM và nhiều công ty khác đã công bố các dịch vụ dựa trên blockchain, chủ yếu nhằm vào các khách hàng dùng dịch vụ tài chính. Tuy nhiên, có một phạm vi rất lớn để áp dụng công nghệ này ở nhiều ngành khác – sau cùng, các blockchain có thể được sử dụng để lưu trữ bất kỳ loại thông tin kỹ thuật số nào. Công nghệ này có thể đặc biệt hữu ích trong “các hợp đồng thông minh”, nơi các hợp đồng có thể được tự động ký kết khi các điều kiện đã được đáp ứng. Ví dụ, một hóa đơn có thể được thanh toán tự động khi các điều kiện nhất định được đáp ứng, hoặc một số đơn đặt hàng nhất định đã được thực hiện. Và việc thanh toán có thể được thực hiện tự động bằng cách sử dụng một hệ thống thanh toán blockchain.
Thậm chí có một lý thuyết cho rằng công nghệ blockchain có thể cung cấp nhiên liệu cho Internet kết nối vạn vật. Ví dụ, các thiết bị trong nhà có thể tự động trả tiền cho chính xác phần năng lượng mà chúng sử dụng. Mạng lưới năng lượng “thông minh” địa phương có thể sử dụng công nghệ blockchain để cho phép phân phối, đo lường và thanh toán tiền điện trong chính cộng đồng, điều này sẽ vô cùng hữu ích trong các cộng đồng ở vùng sâu vùng xa.
Tôi tin rằng công nghệ blockchain có thể là một trong những bước phát triển có liên quan đến dữ liệu mạnh mẽ nhất trong vài năm tới và chắc chắn xứng đáng để các nhà lãnh đạo kinh doanh sát cánh cùng công nghệ này.
Mỗi doanh nghiệp phải trở thành một doanh nghiệp dữ liệu
Rõ ràng là dữ liệu đang trở thành tài sản kinh doanh chính, là trung tâm cho sự thành công của mọi công ty. Khi thế giới trở nên ngày càng thông minh hơn, dữ liệu trở thành chìa khóa cho lợi thế cạnh tranh, nghĩa là khả năng cạnh tranh của doanh nghiệp ngày càng được thúc đẩy bởi mức độ tận dụng dữ liệu, áp dụng phân tích và triển khai các công nghệ mới. Dữ liệu và khả năng biến dữ liệu thành giá trị của doanh nghiệp sẽ ngày càng trở nên quan trọng trong mọi lĩnh vực trong vòng một vài năm tới đây. Trên thực tế, theo Viện Phân tích Quốc tế (International Institute for Analytics), các doanh nghiệp sử dụng dữ liệu sẽ có được 430 tỷ đô la lợi ích về năng suất so với các đối thủ không sử dụng dữ liệu vào năm 20206. Trong kinh doanh, thông tin là sức mạnh và dữ liệu lớn đang cung cấp những thông tin mà chúng ta không thể mơ là sẽ thu thập hoặc phân tích được chỉ vài năm trước đó. Các công ty không chịu mở cửa và nắm bắt cuộc cách mạng dữ liệu sẽ bị bỏ lại phía sau.
Ngoài sự tăng trưởng của các công ty trong việc thu thập và sử dụng dữ liệu của riêng họ, chúng ta sẽ chứng kiến sự bùng nổ của việc sử dụng dữ liệu mở rộng (từ các nguồn của chính phủ, các nhà cung cấp bên ngoài…). Các công ty khôn khéo đã dự đoán được điều này, như với việc IBM mua lại kênh thời tiết (The Weather Channel), chủ yếu vì dữ liệu của nó.
Tập đoàn Dữ liệu Quốc tế IDC (The International Data Corporation) dự đoán rằng trong vòng ba đến năm năm tới, các công ty sẽ phải cam kết chuyển dịch số trên quy mô lớn, bao gồm cả chuyển dịch về văn hóa lẫn hoạt động cơ bản7. Thay vì sử dụng công nghệ mới để hoàn thành nhiệm vụ cũ, công ty và các bộ phận công nghệ thông tin sẽ xem xét đến các chức năng hoàn toàn mới.
Tất cả bắt đầu bằng chiến lược dữ liệu
Để phát triển mạnh, các nhà lãnh đạo doanh nghiệp sẽ phải tích cực làm việc để mở rộng suy nghĩ của họ ra khỏi những gì đã được thực hiện theo cách truyền thống, bao gồm các ý tưởng và hệ thống có thể chưa bao giờ được xem xét đến. Các nhà lãnh đạo doanh nghiệp phải bắt đầu đặt câu hỏi cho mọi thứ, bắt đầu với chiến lược của họ. Tôi không thể không nhấn mạnh điều này: nếu mọi doanh nghiệp, bất kể ở quy mô nào, cho dù hiện tại đang là một doanh nghiệp dữ liệu, thì mọi doanh nghiệp đều cần đến một chiến lược dữ liệu mạnh mẽ.
Đã được đề cập trước đó trong chương này, chúng tôi nhận thấy rằng dữ liệu có liên quan đến các doanh nghiệp theo ba khía cạnh: đưa ra quyết định, hoạt động và tạo ra doanh thu. Chiến lược dữ liệu của bạn có thể bao gồm cả ba lĩnh vực này, hoặc chỉ có một, tùy thuộc vào doanh nghiệp của bạn. Đề xuất của riêng tôi là hãy lần lượt xem xét cả ba lĩnh vực trên.
Việc sở hữu một chiến lược dữ liệu rõ ràng cũng rất quan trọng khi bạn xem xét khối lượng dữ liệu tuyệt đối có sẵn trong những ngày này. Những công ty thật sự được hưởng lợi từ sự bùng nổ dữ liệu có sẵn là những công ty đã học cách suy nghĩ thông minh hơn về dữ liệu và về việc phải làm gì với dữ liệu đó. Những gã khổng lồ thống trị ngành công nghiệp như Google, Facebook và Amazon đều là những nhà tiên phong – không chỉ đơn giản là thu thập số lượng lớn dữ liệu, mà còn tìm ra những cách thức sáng tạo để đưa nó vào sử dụng. Nếu không có một kế hoạch hành động thông minh cho việc sử dụng dữ liệu để mang lại những hiểu biết sâu sắc trong kinh doanh, bản thân dữ liệu sẽ trở thành một khối tài sản nặng nề – đắt tiền và vô dụng. Do đó, nếu các công ty muốn tránh bị chìm trong dữ liệu, họ cần phát triển một chiến lược thông minh tập trung vào dữ liệu mà họ thực sự cần để đạt được mục đích. Nói cách khác, điều này có nghĩa là việc xác định các câu hỏi quan trọng cho kinh doanh cần phải được giải đáp, sau đó chỉ việc thu thập và phân tích dữ liệu thì sẽ có được câu trả lời.
Tôi thấy rất nhiều công ty có chiến lược dữ liệu cho các lĩnh vực khác nhau của doanh nghiệp, chẳng hạn như marketing và bán hàng. Như thế là chưa đủ. Mỗi doanh nghiệp cần có một chiến lược dữ liệu cho toàn công ty. Thật không may, nhận thức phổ biến ở các nhà điều hành doanh nghiệp cho rằng dữ liệu và phân tích dữ liệu hoàn toàn là các vấn đề về công nghệ thông tin. Và như với tất cả các vấn đề về công nghệ thông tin, điều này có nghĩa là họ không thực sự cần phải hiểu cách chúng hoạt động như thế nào hay lý do tại sao. Họ đơn giản chỉ cần biết công việc của mình – để thúc đẩy tăng trưởng – và ném tiền vào chúng. Theo kinh nghiệm của tôi, các chiến lược dữ liệu được điều hành bởi nhóm công nghệ thông tin có xu hướng tập trung vào lưu trữ dữ liệu, quyền sở hữu và tính toàn vẹn hơn là mục tiêu chiến lược dài hạn của doanh nghiệp và cách thức mà dữ liệu có thể hỗ trợ để đạt được các mục tiêu đó.
Bạn có cần một giám đốc dữ liệu (CDO) không?
Các công ty lớn hơn có thể nhìn thấy được lợi ích khi tuyển dụng một giám đốc dữ liệu (CDO – Chief Data Officer), người có thể chịu trách nhiệm về dữ liệu dưới dạng tài sản ở cấp độ công ty. Có vẻ như khá rõ ràng với tôi rằng những vấn đề có tầm quan trọng này – bao gồm cơ hội kinh doanh, tạo doanh thu, an toàn dữ liệu, bảo mật và những thứ khác – thì quá lớn để có thể được thảo luận ở cấp độ C, và do đó bất kỳ công ty hay tổ chức nào đang tham gia vào những dự án dữ liệu nghiêm túc nên có một CDO đứng đầu để chịu trách nhiệm tất cả việc này. Trên thực tế, số liệu thống kê của Gartner gần đây cho thấy rằng vào năm 2019, dự đoán sẽ có 90% các tổ chức lớn tuyển CDO8. Lý tưởng nhất, một CDO nên có cả nền tảng kỹ thuật và kinh doanh; việc quá tập trung vào kỹ thuật sẽ dẫn đến chú trọng quá nhiều vào các công cụ và chi tiết của dữ liệu, nhưng nếu quá ít thì CDO sẽ không thể giao tiếp hiệu quả với đội nhóm của họ và phần còn lại của ban lãnh đạo. Những phẩm chất và yêu cầu cốt lõi của một CDO giỏi bao gồm:
• Có tầm nhìn ở cấp độ cao
CDO chịu trách nhiệm cho bức tranh toàn cảnh về các độ ưu tiên và chiến lược dữ liệu cho toàn bộ công ty. Theo tôi, điều này có nghĩa là có khả năng đặt ra đúng những câu hỏi cùng với khả năng xác định dữ liệu và các chiến lược cần thiết để trả lời những câu hỏi đó. Một mức độ hiểu biết cao về cả chiến lược dữ liệu và đặc thù kinh doanh của tổ chức là điều bắt buộc.
• Việc thực thi
CDO chịu trách nhiệm thực thi chiến lược đó ở mọi cấp độ trong công ty. Điều này đòi hỏi khả năng quản lý những đội ngũ lớn ở các dự án kỹ thuật và xây dựng một đề án kinh doanh xoay quanh các dự án kỹ thuật với nhiều biến số và nhiều sự không chắc chắn.
• Độ chính xác của dữ liệu, bảo mật và quyền riêng tư
CDO cũng là người quyết định cuối cùng trong việc thu thập và duy trì dữ liệu chính xác, đảm bảo cho việc bảo mật dữ liệu, lên kế hoạch và triển khai các chính sách bảo mật dữ liệu. Bởi vì điều này, CDO chính là “luân thường đạo lý” của công ty trong việc xác định và tuân theo các nguyên tắc chỉ đạo dành cho việc thu thập và sử dụng dữ liệu.
• Xác định những cơ hội kinh doanh
Vì mối quan hệ kỳ lạ của họ với dữ liệu, CDO là người có trách nhiệm cao nhất trong việc xác định các cơ hội kinh doanh được chuyển đổi thông qua dữ liệu. Nói cách khác, CDO sẽ tăng doanh thu hoặc giảm chi phí dựa trên những thông tin đã học tập thông qua các sáng kiến dữ liệu.
• Lãnh đạo văn hóa theo định hướng dữ liệu
CDO cũng phải là “nhà lãnh đạo có sức lôi cuốn” cho một nền văn hóa theo định hướng dữ liệu trong công ty. Điều này bao gồm việc thuyết phục và kết hợp tất cả mọi người từ cấp điều hành đến các nhân viên tiên phong về tầm quan trọng của dữ liệu, bảo mật và quyền riêng tư, cũng như giá trị kinh doanh của dữ liệu.
• Dữ liệu dưới dạng hàng hóa
Trong nhiều trường hợp, CDO cũng sẽ là người có tầm nhìn chịu trách nhiệm cho việc nhận ra giá trị trong việc tạo ra doanh thu từ dữ liệu của tổ chức.
Đối với các công ty nhỏ hơn, một CDO có khi không cần thiết hoặc có thể cần thiết, trong trường hợp này, một chức năng tương tự sẽ được thực hiện bởi chính nhóm lãnh đạo, có lẽ với sự giúp đỡ của một nhà tư vấn dữ liệu bên ngoài. Dù có hay không có CDO, thì rõ ràng, dữ liệu cần phải là ưu tiên hàng đầu cho mọi doanh nghiệp. Và cũng như với mọi quyết định kinh doanh hoặc quyết định đầu tư quan trọng, tất cả phải được bắt đầu bằng một chiến lược rõ ràng – một lộ trình cho hành trình phía trước.
Chú thích
1. Klaus Schwab (2017) The Fourth Industrial Revolution , Portfolio Penguin
2 . Jane Wakefield (2015) Intelligent machines: the jobs robots will steal first, BBC, ngày 14 tháng 9, xem tại: http://www.bbc.com/news/technology-33327659
3 . Alan Tovey (2014) Mười triệu việc làm có nguy cơ bị đe dọa từ công nghệ tiên tiến, The Daily Telegraph , ngày 10 tháng 11, xem tại: http://www.telegraph.co.uk/finance/newsbysector/industry/11219688/Ten-million-jobs-at-risk-from-advancing-technology.html
4. Kim Ward và Daniel Martin Katz (2014) Sử dụng dữ liệu để dự đoán các quyết định của Tòa án Tối cao, MSU Today , ngày 4 tháng 11, xem tại: http://msutoday.msu.edu/news/2014/using-data-to-predict-supreme-courts-decisions/
5. Diễn đàn Kinh tế Thế giới (2015) Sự dịch chuyển sâu sắc: các điểm bùng phát công nghệ và tác động xã hội, xem tại: http://www3.weforum.org/docs/WEF_GAC15_Technological_Tipping_Points_report_2015.pdf
6. Bloomberg (2016) 6 dự báo cho phân tích dữ liệu lớn và điện toán nhận thức trong năm 2016, ngày 6 tháng 1, xem tại: https://www.bloomberg.com/enterprise/blog/6-predictions-for-big-data-analytics-and-cognitive-computing-in-2016/
7. Công ty Dữ liệu Quốc tế (2015) IDC dự đoán sự xuất hiện của “nền kinh tế DX” trong một giai đoạn quan trọng của việc chuyển đổi số và quy mô lớn lên các công nghệ nền tảng thứ ba trong mọi ngành công nghiệp, ngày 4 tháng 11, xem tại: https://www.idc.com/getdoc.jsp?containerId=prUS40552015
8. Gartner (2016) Gartner dự đoán rằng 90% các tổ chức lớn sẽ có một giám đốc dữ liệu vào năm 2019, ngày 26 tháng 1, xem tại: http://www.gartner.com/newsroom/id/3190117