Khi đã xác định được kiểu dữ liệu lý tưởng cho doanh nghiệp của mình, bước tiếp theo của bạn là xác định cách thức biến dữ liệu thành những hiểu biết sâu sắc (insight) và cách áp dụng hữu ích. Phân tích là quá trình thu thập và xử lý dữ liệu để tạo ra những hiểu biết sâu sắc có thể giúp bạn cải thiện cách thức kinh doanh của mình. Trong hầu hết các trường hợp, nó liên quan đến việc phân tích dựa vào phần mềm sử dụng thuật toán. Bằng việc phân tích dữ liệu dựa trên các thuật toán và các công cụ phân tích, bạn có thể trích xuất những hiểu biết sâu sắc mà bạn cần để trả lời cho những câu hỏi kinh doanh then chốt, cải thiện hiệu suất hoạt động, tạo ra doanh thu từ dữ liệu, và đạt được những mục tiêu chiến lược của mình. Dữ liệu và phân tích tương tự như hai mặt của một đồng xu. Xét cho cùng, việc sở hữu tất cả dữ liệu kinh doanh và nắm bắt những hình thức dữ liệu mới mẻ và thú vị này liệu có ý nghĩa gì nếu chúng ta không thể ứng dụng chúng? Phân tích cho phép chúng ta học được những điều mới, hiểu thêm về thế giới mà trong đó chúng ta đang vận hành, và tạo ra những cải tiến trong toàn tổ chức. Theo cách thức này, chính việc phân tích đã tạo nên chữ V thứ năm cho dữ liệu lớn: Value (giá trị).
Do đó, như là một phần của bất kỳ chiến lược dữ liệu vững chắc nào, bạn sẽ cần phải lên kế hoạch để áp dụng phân tích cho dữ liệu của mình. Điều này, đến lượt nó, sẽ ảnh hưởng đến cơ sở hạ tầng và tính cạnh tranh của những dữ liệu cần được sắp xếp vào đúng vị trí (sẽ đề cập sâu hơn ở Chương 8 và 9). Kiểu phân tích mà bạn áp dụng sẽ phụ thuộc vào những mục tiêu chiến lược của bạn. Và giống như việc thu thập dữ liệu, việc hiểu rõ điều gì là khả thi đối với việc phân tích trước khi đưa ra lựa chọn tốt nhất cho doanh nghiệp của mình là rất quan trọng. Vì thế trong chương này, tôi sẽ đi vào các phương pháp phân tích đã phát triển trong các năm qua và chỉ ra một vài phương pháp phân tích quan trọng mà các doanh nghiệp hiện nay đang sử dụng.
Dù vậy, hãy nhớ rằng rất dễ vô tình chìm đắm vào những cơ hội thú vị mà việc phân tích mang lại. Nhiều tổ chức đang áp dụng phân tích để tạo nên những điều mới mẻ. Nó có thể hiệu quả đối với những doanh nghiệp khác nhưng không hiệu quả với doanh nghiệp của bạn. Thách thức trong việc tạo ra một chiến lược dữ liệu mạnh là phải xác định phương pháp phân tích tốt nhất và dễ tiếp cận nhất, khả thi nhất đối với bạn. Nói như thế nghĩa là những tiến bộ trong phân tích, trí tuệ nhân tạo và học máy đang phát triển rất nhanh, do đó những phương pháp mới và tiến bộ hơn để trích xuất giá trị từ dữ liệu sẽ xuất hiện rất, rất sớm. Vì thế, mặc dù việc thấu hiểu những gì có sẵn và khả thi với việc phân tích, và xác định điều gì tốt nhất cho doanh nghiệp của bạn ở thời điểm hiện tại là rất quan trọng, nhưng đây cũng là thời điểm vô cùng giá trị để tổng hợp một danh sách những cách thức mà bạn muốn dùng để phân tích dữ liệu trong tương lai. Không hề vô lý khi nói rằng một vài hoặc tất cả những phương pháp có trong danh sách của bạn sẽ trở thành hiện thực trong tương lai gần.
Việc phân tích đã phát triển như thế nào?
Như đã thấy ở Chương 6, rõ ràng chúng ta đang ở vào thời kỳ bùng nổ thông tin. Sự gia tăng không ngừng về khối lượng cũng như tính đa dạng của thông tin đang từng ngày tạo nên động lực cho những bước nhảy vọt trong công nghệ phân tích. Trong quá khứ, khi chúng ta muốn thu thập dữ liệu và phân tích chúng để hiểu được những gì dữ liệu cung cấp, những dữ liệu đó phải được chứa trong một cơ sở dữ liệu có cấu trúc, và chúng ta chỉ có thể dùng công cụ SQL để truy vấn dữ liệu. Nghe có vẻ căn bản nhưng thực tế nó hoạt động rất tốt. Sử dụng cơ sở dữ liệu và công cụ xử lý SQL, các doanh nghiệp có thể quản lý số lượng hàng hóa, theo dõi đơn hàng, ghi chép thông tin khách hàng, và hiểu rõ về sự tăng trưởng của doanh số và tổng nguồn thu. Bằng việc sử dụng công nghệ cơ sở dữ liệu, kể cả một người không am hiểu về phân tích cũng có thể dễ dàng biết được số lượng hàng hóa X đã bán được vào tháng 11 năm trước, và bạn có thể dùng thông tin đó để quyết định số lượng hàng hóa dự trữ cho mùa Giáng sinh năm nay. Bạn cũng có thể biết rõ bạn đã bán những gì, khi nào, cho ai, và với giá bao nhiêu. Các doanh nghiệp vì thế đã và đang làm việc với dữ liệu có cấu trúc trong suốt hàng thập kỷ nay. Nhưng đối với những dữ liệu phi cấu trúc – dữ liệu không phù hợp với cơ sở dữ liệu hay bảng tính – thì việc phân tích những hiểu biết sâu sắc trong những dữ liệu này gần như là không thể (hoặc rất tốn kém và mất nhiều thời gian). Giờ đây, chúng ta đã không còn cần đến công nghệ hay cấu trúc cơ sở dữ liệu để có được hiểu biết sâu sắc từ dữ liệu. Những tiến bộ mà công nghệ phân tích mang lại đã khiến cho việc thao tác với bất kỳ dạng dữ liệu nào trở nên khả thi, dù đó là dữ liệu có cấu trúc hay phi cấu trúc, trong một bảng tính, trên Facebook, hoặc chứa trong một video an ninh.
Chúng ta đang tạo ra nhiều dữ liệu hơn bao giờ hết – như chúng ta đã thấy ở Chương 1, cứ mỗi hai ngày, chúng ta lại tạo được một lượng dữ liệu nhiều bằng khối lượng dữ liệu mà chúng ta đã từng tạo ra tính từ những ngày đầu tiên đến tận năm 2003. Dĩ nhiên điều này sẽ mang lại cho chúng ta nhiều thông tin để làm việc hơn và nhiều cơ hội hơn để trích xuất được những thông tin quan trọng về kinh doanh. Mỗi ngày chúng ta tạo ra 4,5 tỷ lượt like trên Facebook và 500 triệu lượt tweet – khối lượng dữ liệu lớn như thế này chưa từng được tạo ra vào 12 năm trước, và thậm chí ở quy mô nhỏ hơn rất nhiều trong 5 năm gần đây. Tất cả những dữ liệu này tạo ra một cơ hội chưa từng có cho các công ty để hiểu rõ về thế giới họ đang hoạt động, từ việc khách hàng của họ thật sự suy nghĩ và hành động như thế nào, cho đến việc những ai có khả năng sẽ mua thứ gì đó và vào lúc nào, đến cả việc làm thế nào để tận dụng hết công năng của máy móc và các quy trình.
Điện toán đám mây có rất nhiều vấn đề cần giải quyết trước những bước nhảy vọt trong công nghệ phân tích, và đây là hai mảng liên quan mật thiết với nhau. Điện toán đám mây mang lại cho chúng ta khả năng lưu trữ và công suất tính toán khổng lồ. Không có nó, chúng ta đã không thể lưu trữ và phân tích một khối lượng dữ liệu to lớn và đa dạng như ngày nay. Nhờ vào sự gia tăng khả năng lưu trữ và tính toán, chúng ta có thể phân tích một khối lượng lớn dữ liệu thay đổi nhanh chóng đến từ nhiều nguồn dữ liệu khác nhau, gần như ngay lập tức, để có được những hiểu biết sâu sắc mà chúng ta chưa từng đạt được. Hệ thống lưu trữ như Hadoop (tôi sẽ nhắc đến ở Chương 8) đã tạo cho doanh nghiệp khả năng lưu trữ và phân tích lượng dữ liệu lớn hơn rất nhiều so với việc thực tế lưu trữ và truy cập trên một thiết bị lưu trữ (như đĩa cứng). Điện toán phân tán (distributed computing) nghĩa là một lượng lớn dữ liệu có thể được chia sẻ giữa các máy tính với nhau, mỗi máy tính sẽ đóng vai trò là một phần nhỏ trong tổng thể phân tích. Bằng cách chia nhỏ quá trình phân tích như thế này, công việc có thể được hoàn thành nhanh hơn và hiệu quả hơn – và nó cũng có hiệu quả kinh tế cao hơn.
Các hình thức phân tích dữ liệu
Hiện có rất nhiều công cụ và kỹ thuật phân tích dữ liệu, bao gồm cả phân tích văn bản, phân tích video và phân tích cảm xúc. Trong vài năm trở lại đây, đã có rất nhiều công cụ phân tích mới được đưa ra thị trường, mang lại sự cải thiện to lớn trong khả năng phân tích của chúng ta. Rất nhiều công ty được thành lập mới mỗi tuần đã cung cấp cho doanh nghiệp khả năng phân tích dữ liệu theo nhiều cách thức khác nhau. Nhưng với quá nhiều sự lựa chọn, việc xác định chính xác bạn cần dùng hình thức gì và vào lúc nào cũng trở nên khó khăn. Trong chương này, tôi sẽ xem xét một vài công cụ phân tích then chốt mà các doanh nghiệp đang sử dụng và khi nào thì những công cụ này đặc biệt hữu dụng. Trong hầu hết các trường hợp, có rất nhiều công cụ thương mại trên thị trường có thể giúp đơn giản hóa quy trình phân tích này.
Phân tích văn bản
Còn được biết đến với tên gọi là khai thác văn bản, phân tích văn bản là quá trình trích xuất giá trị từ một số lượng lớn văn bản ở dạng dữ liệu phi cấu trúc. Hầu hết doanh nghiệp đều có một lượng lớn dữ liệu dưới dạng văn bản từ các bản ghi nhớ, tài liệu của công ty, e-mail, báo cáo, thông cáo báo chí, hồ sơ và các trao đổi với khách hàng, trang web, trang blog, đến các bài viết trên phương tiện truyền thông. Tuy nhiên, cho đến gần đây, những thông tin này đều không thật sự hữu dụng. Trong khi văn bản được cấu tạo để con người có thể hiểu, dưới khía cạnh của phân tích, đây là những thông tin không có cấu trúc vì chúng không phù hợp với các mối quan hệ trong cơ sở dữ liệu hay mối quan hệ hàng cột trong bảng tính. Truy cập vào một lượng lớn dữ liệu văn bản và tiếp cận khả năng công nghệ được cải tiến nghĩa là văn bản có thể được phân tích để trích xuất thêm những thông tin có chất lượng tốt hơn nội dung mà văn bản thật sự cung cấp. Ví dụ, văn bản có thể được dùng để đánh giá xu hướng liên quan đến thương mại (như sự tăng giảm những phản hồi tích cực từ khách hàng, hoặc các xu hướng có thể dẫn đến những cải tiến về sản phẩm hay dịch vụ).
Một số cách phân tích văn bản được dùng hiện nay gồm:
• Phân loại văn bản – gắn cấu trúc vào văn bản để nó có thể được phân loại, như người viết, chủ đề, ngày,…
• Nhóm văn bản – nhóm các văn bản theo chủ đề hoặc theo thể loại để lọc thông tin dễ dàng hơn. Các công cụ tìm kiếm đều dùng công nghệ này.
• Khai thác chủ đề – khoanh vùng những phần trong văn bản có liên quan nhất đến mục tiêu của bạn.
• Đánh giá tình cảm – khai thác ý kiến và tình cảm từ văn bản, và phân loại chúng dưới dạng tích cực, tiêu cực hay trung lập (sẽ đề cập kỹ hơn bên dưới).
• Tổng hợp tài liệu – rút gọn tài liệu thành các điểm mấu chốt.
Phân tích văn bản giúp ta khai thác được nhiều thông tin hơn, vì thế chúng ta có thể hiểu được rõ ràng hơn so với chỉ những ký tự đơn thuần trên giấy hay màn hình. Nhờ đó, nó vô cùng hữu ích cho việc thấu hiểu khách hàng của bạn. Nó cũng có thể được áp dụng cho nội bộ công ty để biết được nhân viên của bạn đang bàn tán về điều gì. Ví dụ, tôi được biết có một công ty đã dùng công cụ phân tích văn bản để quét (scan) và phân tích nội dung các thư điện tử được gửi đi từ đội ngũ nhân viên của họ, cũng như các bài viết trên phương tiện truyền thông của các nhân viên này, điều này có nghĩa là họ không cần phải thực hiện những cuộc khảo sát nhân viên theo kiểu truyền thống vừa tốn kém, vừa mất nhiều thời gian.
Phân tích cảm xúc
Phân tích cảm xúc, còn được biết đến như là khai thác suy nghĩ, tìm kiếm và khai thác các ý kiến chủ quan hay những cảm xúc có trong dữ liệu dưới dạng văn bản, video, hoặc âm thanh. Mục tiêu căn bản là xác định thái độ của một cá nhân hay tập thể dựa vào một chủ đề cụ thể hay toàn bộ nội dung. Tình cảm hoặc thái độ có thể là một lời nhận xét, đánh giá, hay một phản ứng cảm xúc.
Sử dụng phân tích cảm xúc khi bạn muốn hiểu rõ ý kiến của các bên liên quan. Phân tích cảm xúc sẽ tìm ra những sự thật ẩn chứa sau mỗi cuộc trao đổi để từ đó các doanh nghiệp có thể đưa ra quyết định chính xác hơn bằng cách phân tích cảm giác tích cực, tiêu cực, hay trung lập của các đối tác về sản phẩm, doanh nghiệp và thương hiệu của họ. Hơn nữa, những phân tích cảm xúc “bên ngoài câu chữ” chuyên sâu còn có thể phân loại cả những cảm xúc liên quan. Ví dụ, văn bản, ngữ điệu khi nói, và biểu cảm trên gương mặt có thể quyết định người đó đang vui vẻ, thất vọng hay tức giận. Từ nhiều thập kỷ nay, chúng ta đã biết rằng ngôn từ chúng ta dùng trong giao tiếp và thể hiện bản thân chỉ chiếm 7% nội dung cần trao đổi. Phần lớn nội dung trao đổi của chúng ta đều có được qua những biểu hiện phi ngôn từ (như ngôn ngữ hình thể và giọng điệu), và giờ đây điều này đã được phân tích trên quy mô lớn. Kiểu phân tích như trên đang dần trở nên phổ biến nhờ sự tăng trưởng của phương tiện truyền thông, blog và mạng xã hội, nơi mọi người chia sẻ những suy nghĩ và cảm nhận của mình về tất cả mọi thứ (bao gồm cả các công ty và sản phẩm) một cách dễ dàng hơn.
Phân tích hình ảnh
Đây là quá trình trích xuất những thông tin, ý nghĩa và những hiểu biết sâu sắc từ hình ảnh (như các bức hình, hình ảnh y khoa hay đồ họa). Đây là quá trình phụ thuộc rất nhiều vào việc nhận diện mẫu, hình học kỹ thuật số và xử lý tín hiệu. Trong quá khứ, phân tích duy nhất có thể thực hiện được trên hình ảnh là thông qua mắt người hoặc nếu như máy tính được sử dụng thì bằng cách đánh giá các từ khóa mô tả (như “dễ thương” và “con mèo”) đã được thêm vào hình ảnh một cách thủ công để giúp mọi người dễ dàng tìm thấy nó. Giờ đây, việc phân tích hình ảnh đã phức tạp hơn rất nhiều. Trong trường hợp chụp ảnh, một bức ảnh kỹ thuật số chứa được nhiều thông tin hơn bạn nghĩ, bao gồm cả thời gian và địa điểm chụp, dựa vào tọa độ GPS được gắn vào bức ảnh. Tất cả các thuộc tính bổ sung đó có thể được phân tích để trích xuất thêm thông tin vượt ra ngoài nội dung hình ảnh thực tế.
Phân tích hình ảnh có thể được dùng dưới nhiều cách thức khác nhau, như nhận diện khuôn mặt với mục đích bảo mật hoặc nhận diện thương hiệu hay sản phẩm của bạn trong bức ảnh được chia sẻ trên các trang truyền thông. Các sòng bạc hiện đang sử dụng phân tích hình ảnh để nhận diện khách hàng tiềm năng nhằm đưa ra những dịch vụ chăm sóc đặc biệt cho họ – và có lẽ cũng để xác định những người mà họ không muốn tiếp đón trong sòng bạc của mình. Dù công nghệ này khá thú vị, nhưng hãy nhớ rằng phân tích hình ảnh chỉ thật sự hữu ích nếu nó giúp trả lời các câu hỏi chiến lược quan trọng hoặc đưa bạn đến các mục tiêu dài hạn của mình.
Phân tích video
Phân tích video là một quá trình trích xuất thông tin chi tiết, có ý nghĩa và những hiểu biết sâu sắc từ các đoạn video. Nó bao gồm tất cả những khả năng mà phân tích hình ảnh có thể thực hiện, thêm vào đó, nó cũng có thể đo lường và theo dõi hành vi.
Bạn có thể sử dụng phân tích video nếu bạn muốn tăng cường an ninh hoặc hiểu thêm về những người đang ra vào cửa hàng hay cơ sở của bạn, và họ đã làm gì khi đến đó. Ví dụ, hiện nay chúng ta có thể thu thập dữ liệu từ các camera giám sát CCTV khác nhau trong môi trường bán lẻ, tải dữ liệu đó lên máy chủ đám mây mà không cần yêu cầu hạ tầng bổ sung và phân tích các cảnh quay để xem khách hàng của bạn hành động như thế nào, cách họ di chuyển trong cửa hàng ra sao. Kiểu dữ liệu này có thể giúp bạn thấy được có bao nhiêu người dừng lại trước một sản phẩm nhất định được trưng bày, họ quan sát nó bao lâu và liệu họ có mua nó hay không.
Bạn cũng có thể dùng phân tích video để giảm chi phí, rủi ro và hỗ trợ ra quyết định. Ví dụ, giờ đây đã có phần mềm tự động cho phép bạn theo dõi một địa điểm suốt 24/7. Đoạn video này sau đó được phân tích bằng cách sử dụng giải pháp phân tích video và hành vi, nhờ vậy sẽ đưa ra cảnh báo cho bạn ngay khi xảy ra bất kỳ hoạt động bất thường và đáng ngờ nào. Sau khi được cài đặt và được cấp cho nguồn cấp dữ liệu video ban đầu, phần mềm sẽ quan sát môi trường xung quanh nó, học cách phân biệt hành vi bình thường và hành vi bất thường. Hệ thống cũng có thể tự điều chỉnh, nghĩa là nó liên tục tinh chỉnh các giả định của riêng nó về hành vi và không cần sự hỗ trợ của con người để xác định các tham số ấy.
Phân tích giọng nói
Còn gọi là phân tích ngôn từ, phân tích giọng nói là quá trình trích xuất thông tin từ những bản ghi âm cuộc hội thoại. Hình thức phân tích này có thể phân tích các chủ đề hoặc các từ, cụm từ thực tế đang được sử dụng, cũng như nội dung cảm xúc của cuộc trò chuyện.
Tất cả các doanh nghiệp cần phải giữ cho khách hàng của họ cảm thấy hài lòng nếu họ muốn trụ vững trên thương trường và dẫn đầu cuộc cạnh tranh. Ví dụ, nếu bạn có một sản phẩm, dịch vụ cần đến sự hỗ trợ kỹ thuật hoặc có một trung tâm chăm sóc khách hàng lớn thì hình thức phân tích này có thể thật sự hữu ích trong việc xây dựng và duy trì liên tục các mối quan hệ với khách hàng, cũng như làm nổi bật những vấn đề cần giải quyết. Chẳng hạn như, bạn có thể sử dụng phân tích giọng nói để giúp xác định các chủ đề thường được lặp lại xung quanh những khiếu nại của khách hàng hoặc các vấn đề kỹ thuật. Những hiểu biết sâu sắc như thế có thể giúp bạn phát hiện nhanh hơn những sai sót có khả năng xảy ra và giải quyết chúng trước khi khách hàng đưa chúng lên các phương tiện truyền thông để khiếu nại.
Phân tích giọng nói cũng có thể được sử dụng để giúp bạn xác định thời điểm khách hàng trở nên khó chịu. Bằng cách phân tích cao độ và ngữ điệu của các cuộc hội thoại gọi đến tổng đài của bạn, bạn có thể đánh giá trạng thái cảm xúc của khách hàng và can thiệp nhanh chóng khi họ tức giận hoặc thất vọng. Loại phân tích này cũng rất hữu ích trong việc giúp xác định các tổng đài viên làm việc kém hiệu quả để họ có thể được đào tạo hoặc huấn luyện thêm.
Khai thác dữ liệu
Khai thác dữ liệu là một từ thông dụng mô tả chung cho việc áp dụng bất kỳ hình thức xử lý thông tin quy mô lớn nào, nhưng điều này không chính xác lắm. Khai thác dữ liệu thực chất là một quá trình phân tích được thiết kế để khám phá dữ liệu, thường là các tập dữ liệu rất lớn liên quan đến kinh doanh, tìm kiếm những hiểu biết sâu sắc liên quan đến thương mại, xu hướng hoặc các mối quan hệ về mặt thương mại giữa các biến có khả năng cải thiện hiệu suất. Khai thác dữ liệu về cơ bản là sự kết hợp giữa trí tuệ nhân tạo, thống kê, hệ thống cơ sở dữ liệu, nghiên cứu cơ sở dữ liệu và học máy. Quá trình thực tế đòi hỏi phải phân tích tự động hoặc bán tự động các tập dữ liệu lớn để trích xuất những kiểu mẫu thú vị chưa từng được biết đến, những biến khác thường, hoặc những ràng buộc mà có thể khai thác được.
Có ba giai đoạn trong quá trình này: 1) thăm dò ban đầu, 2) xây dựng mô hình và xác nhận, và 3) triển khai.
Mục tiêu cuối cùng của khai thác dữ liệu là dự đoán. Do đó, bạn sẽ khai thác dữ liệu nếu bạn có một khối lượng lớn dữ liệu và muốn trích xuất thông tin quan trọng được ẩn chứa trong dữ liệu đó để có thể giúp doanh nghiệp của bạn trong tương lai. Rõ ràng, trong kinh doanh, việc có thể dự đoán tương lai là hữu ích, không chỉ làm giảm chi phí và hỗ trợ lập kế hoạch cũng như chiến lược, mà những thông tin thu được từ khai thác dữ liệu còn có khả năng chuyển đổi định hướng của doanh nghiệp.
Những hiểu biết sâu sắc được trích xuất từ việc khai thác dữ liệu cũng có thể định hướng cho việc đưa ra quyết định và làm giảm thiểu rủi ro. Tuy nhiên, điều quan trọng là phải hiểu rõ việc khai thác dữ liệu có thể làm tăng các mẫu, các biến khác thường hoặc các ràng buộc lẫn nhau nhưng nó không nhất thiết phải cho bạn biết lý do đằng sau các mô hình, các biến khác thường hoặc những ràng buộc lẫn nhau này. Phân tích bổ sung cũng sẽ là điều cần thiết nếu “lý do” trên vẫn quan trọng đối với bạn.
Thử nghiệm kinh doanh
Thử nghiệm kinh doanh, thiết kế thử nghiệm và thử nghiệm A/B (A/B testing) là tất cả các kỹ thuật dùng để kiểm tra tính hợp lệ của một điều gì đó, cho dù đó là giả thuyết chiến lược, bao bì sản phẩm mới hay là một phương thức marketing. Về cơ bản, đây là việc thử nghiệm một cái gì đó ở một phần của tổ chức và so sánh nó với những phần khác không áp dụng việc thay đổi. Thử nghiệm kinh doanh về cơ bản có thể giúp bạn quyết định đi theo lựa chọn nào khi bạn đang phải đối mặt với hai hoặc nhiều lựa chọn. Dù bạn muốn hiểu về khả năng thiệt hại thương hiệu hay chi phí tài chính và thời gian của doanh nghiệp, việc chạy thử nghiệm giữa các lựa chọn khác nhau trên quy mô nhỏ và dễ quản lý có thể cho phép bạn tìm ra giải pháp mang lại kết quả tốt nhất. Ngoài ra, phản hồi từ các thử nghiệm có thể giúp bạn tinh chỉnh thêm và cải thiện giải pháp tốt nhất để làm cho nó hiệu quả hơn nữa.
Quy trình cơ bản để chạy thử nghiệm kinh doanh, như đã được nêu bởi chuyên gia phân tích Thomas H Davenport gồm: 1) tạo ra một giả thuyết, 2) thiết kế thử nghiệm, 3) chạy thử nghiệm, và 4) phân tích kết quả và theo dõi. Có lẽ lợi thế lớn nhất của thử nghiệm kinh doanh là nó cho phép bạn thử nghiệm mọi thứ mà không mất nhiều chi phí hoặc gặp nhiều rủi ro.
Phân tích trực quan
Dữ liệu có thể được phân tích theo nhiều cách khác nhau và cách đơn giản nhất là tạo ra hình ảnh hoặc đồ thị, và xem xét chúng để phát hiện các mô hình, xu hướng. Đây là một phương pháp tích hợp, kết hợp phân tích dữ liệu với trực quan hóa dữ liệu và tương tác của con người. Phương pháp này đặc biệt hữu ích khi bạn đang cố hiểu một khối lượng dữ liệu khổng lồ và/hoặc nếu vấn đề phức tạp bạn đang đối mặt phải được hỗ trợ bằng một số công cụ tính toán bổ sung.
Về cơ bản, phân tích trực quan có thể giúp bạn phát hiện các kiểu mẫu và xu hướng có trong dữ liệu, cho phép bạn tạo ra một lượng dữ liệu khổng lồ có thể truy cập và dễ hiểu đối với bất kỳ ai, ngay cả khi họ không phải là nhà khoa học hoặc nhà thống kê dữ liệu. Do đó, nó rất hữu ích cho việc thu hẹp khoảng cách giữa dữ liệu và những hiểu biết sâu sắc, nhưng điều đó chỉ xảy ra khi bạn tập trung vào những gì thật sự cần thiết. Chỉ vì chương trình phân tích trực quan có thể trình bày và thao tác dữ liệu theo hàng nghìn cách khác nhau không có nghĩa là bạn cần trình bày và thao tác dữ liệu theo hàng nghìn cách khác nhau! Hãy chỉ tập trung vào những gì cần phải được trả lời.
Phân tích tương quan
Đây là một kỹ thuật thống kê giúp bạn xác định xem có mối liên hệ nào giữa hai biến số riêng biệt và mối liên hệ đó mạnh mẽ như thế nào. Loại phân tích này chỉ thích hợp khi dữ liệu được định lượng và biểu diễn dưới dạng một con số. Không thể sử dụng dữ liệu này cho kiểu dữ liệu phân loại, chẳng hạn như giới tính, thương hiệu được mua hoặc màu sắc. Phân tích này tạo ra một số duy nhất giữa +1 và –1 để mô tả mức độ liên hệ giữa hai biến. Nếu kết quả là dương thì hai biến có tương quan thuận với nhau, tức là khi một biến tăng, thì biến còn lại cũng có xu hướng tăng. Nếu kết quả là âm thì hai biến có tương quan nghịch với nhau, tức là khi một biến tăng, giá trị kia có xu hướng giảm.
Bạn nên sử dụng phân tích tương quan khi bạn nghi ngờ có một mối quan hệ giữa hai biến số và muốn kiểm tra giả định của mình. Ví dụ, bạn có thể tin rằng nhiệt độ ảnh hưởng đến doanh số bán hàng. Phân tích tương quan sẽ cho phép bạn kiểm tra giả định đó có đúng hay không. Ngoài ra, bạn có thể sử dụng phân tích tương quan khi muốn biết cặp biến nào trong các cặp biến cho thấy mối tương quan rõ rệt nhất. Chẳng hạn như, bạn có thể xem liệu nhiệt độ ảnh hưởng đến doanh số bán hàng nhiều hơn vào thời gian nào trong năm. Và cuối cùng, bạn có thể sử dụng kiểu phân tích này để xem những gì sẽ xuất hiện. Đôi khi phân tích tương quan sẽ làm nổi bật một mối quan hệ bất ngờ mà có thể đưa đến một phân tích chuyên sâu và khai thác tiềm năng. Ví dụ, Walmart đã phát hiện ra mối quan hệ bất ngờ giữa việc mua Pop-Tarts và cảnh báo bão. Rõ ràng, khi xuất hiện cảnh báo thời tiết khắc nghiệt ở Mỹ, doanh số bán ra của Pop-Tarts tăng lên. Nhận định này đã cho phép Walmart chuyển Pop-Tarts đến các kệ ở lối vào của cửa hàng sau khi có cảnh báo bão nhằm đẩy mạnh doanh số bán hàng hơn nữa.
Bạn có thể thực hiện phân tích tương quan với phép tính thủ công được gọi là “hệ số tương quan Pearson”, hoặc bạn có thể sử dụng một trong rất nhiều công cụ tương quan trên thị trường để đơn giản hóa quy trình.
Phân tích hồi quy
Phân tích hồi quy là một công cụ thống kê để điều tra mối liên hệ giữa các biến số – ví dụ, liệu có mối quan hệ nhân quả nào giữa giá cả và nhu cầu sản phẩm hay không. Phân tích hồi quy thường được nhắc đến cùng với việc phân tích tương quan, và vì vậy thường rất khó để biết được đó là hình thức phân tích nào và sự khác biệt giữa chúng. Về cơ bản, phân tích hồi quy xác định các mối quan hệ giữa hai biến và vẽ đồ thị cho mối quan hệ đó, sau đó nó có thể được dùng để dự đoán tương lai. Mặt khác, phân tích tương quan khám phá mức độ chặt chẽ của mối quan hệ đó.
Sử dụng phân tích hồi quy nếu bạn tin rằng một biến đang ảnh hưởng đến một biến khác và bạn muốn củng cố xem giả thuyết của bạn có đúng hay không. Bạn cũng có thể đánh giá “ý nghĩa thống kê” của các mối quan hệ ước lượng. Nói cách khác, bạn có thể tự tin khẳng định rằng có một mối quan hệ chặt chẽ giữa các biến, và do đó dễ dàng dự đoán hơn.
Khi bắt đầu phân tích hồi quy, bạn cần xây dựng một giả thuyết về mối quan hệ giữa các biến bạn quan tâm. Ví dụ, bạn có thể tin rằng người có học thức càng cao thì sẽ càng kiếm được nhiều tiền. Giả thuyết cho khẳng định này có thể là “trình độ học vấn cao hơn sẽ làm cho mức thu nhập cao hơn khi mà tất cả những yếu tố còn lại đều bình đẳng”. Sau đó, bạn cần phải kiểm tra giả thuyết này bằng cách sử dụng mô hình hồi quy.
Phân tích tình huống
Phân tích tình huống, còn được gọi là phân tích theo chuỗi thời gian hoặc phân tích tổng lợi nhuận, là một quá trình phân tích cho phép bạn phân tích nhiều sự kiện hoặc tình huống trong tương lai bằng cách xem xét các kết quả có khả năng xảy ra. Bằng cách lập kế hoạch những chi tiết cần thiết để thực hiện một quyết định cụ thể hoặc quá trình hành động, bạn có thể quan sát không chỉ kết quả tiềm năng cuối cùng mà còn cả tính khả thi của lộ trình dẫn đến kết quả đó. Thường thì chỉ khi bạn thật sự xem xét những gì sẽ tham gia vào việc thực hiện thực tế của một ý tưởng, bạn mới hoàn toàn hiểu rõ phạm vi của ý tưởng đó. Do đó, phân tích tình huống cho phép bạn cải thiện việc ra quyết định bằng cách xem xét đầy đủ các kết quả mà bạn mong đợi và ý nghĩa triển khai của chúng mà không cần chi phí hay thời gian thực hiện trong thực tế. Phân tích tình huống không phải là dựa vào dữ liệu lịch sử và nó cũng không cho rằng tương lai sẽ giống với quá khứ, hay tìm cách ngoại suy tương lai từ quá khứ. Thay vào đó, nó cố gắng xem xét những bước phát triển và bước ngoặt có khả năng xuất hiện trong tương lai.
Bạn nên sử dụng phân tích tình huống khi bạn không chắc chắn cần quyết định thế nào hoặc nên thực hiện điều gì. Nó có thể đặc biệt hữu ích nếu các tác động của quyết định là đáng kể – ví dụ, nếu quyết định đó tốn rất nhiều thời gian hoặc tiền bạc để thực hiện, hoặc nếu những bước tiếp theo của việc thực hiện quyết định sai có thể gây nguy hiểm cho doanh nghiệp. Nó có thể được sử dụng để đánh giá tương lai có thể có của các lựa chọn chiến lược khác nhau, hoặc để tạo ra một tổ hợp các tình huống khác nhau khi cùng quan sát một trường hợp nhưng từ ba góc độ khác nhau: phiên bản lạc quan của sự việc, phiên bản bi quan của sự việc, và tình huống có khả năng cao nhất. Nó cũng là một công cụ rất hữu ích nếu bạn không rõ về những gì sẽ tham gia vào việc thực hiện một chiến lược hoặc một quyết định, vì quá trình này sẽ thúc đẩy bạn thực sự tương tác với tình huống mà bạn đang thử nghiệm. Sự tương tác nâng cao này có thể giúp dự đoán nhiều hơn những ưu và nhược điểm của từng tình huống, theo đó giảm rủi ro và hướng bạn đến sự lựa chọn tốt nhất.
Lập kế hoạch tình huống thường là một quy trình có năm giai đoạn: 1) xác định vấn đề, 2) thu thập dữ liệu, 3) phân biệt những điều chắc chắn với những điều không chắc chắn, 4) phát triển tình huống, và 5) sử dụng kết quả cho kế hoạch của bạn.
Dự báo/Phân tích chuỗi thời gian
Dữ liệu chuỗi thời gian là dữ liệu được thu thập tại các khoảng thời gian đều nhau, chẳng hạn như giá trị đóng cửa của chỉ số FTSE hoặc lưu lượng dòng chảy hàng năm của sông Thames. Đó là dữ liệu được đo đạc thường xuyên tại các thời điểm cụ thể để phác họa những sự thay đổi. Phân tích chuỗi thời gian khai thác những dữ liệu này nhằm trích xuất các số liệu thống kê hoặc dữ liệu có ý nghĩa. Bằng cách phân tích dữ liệu chuỗi thời gian, bạn có thể xác định các mẫu mà sau đó có thể được ngoại suy cho tương lai.
Do đó, bạn có thể sử dụng phân tích chuỗi thời gian khi bạn muốn đánh giá những thay đổi theo thời gian hoặc dự đoán các sự kiện trong tương lai dựa trên những gì đã xảy ra trong quá khứ. Dữ liệu chuỗi thời gian thường được biểu diễn ở dạng biểu đồ đường và kiểu phân tích này thường được sử dụng trong thống kê, nhận diện mẫu, toán học, tài chính và dự báo thời tiết (bao gồm dự đoán thời tiết khắc nghiệt hoặc động đất nghiêm trọng). Hai trong số các quy trình phổ biến nhất để tiến hành phân tích chuỗi thời gian là quy trình tự hồi quy và quy trình trung bình động. Cả hai đều liên quan đến những phương trình rất phức tạp, vì vậy có lẽ tốt nhất bạn nên đầu tư vào một công cụ phân tích thương mại.
Mô phỏng Monte Carlo
Đây là một kỹ thuật giải quyết vấn đề toán học và đánh giá rủi ro bằng cách phỏng đoán xác suất và rủi ro của một số kết quả nhất định nhờ vào việc sử dụng mô phỏng bằng máy tính đối với các biến số ngẫu nhiên. Về bản chất, kỹ thuật này minh họa những khả năng có thể gặp nhất. Bằng việc xem xét các tác động từ kịch bản xấu nhất và trường hợp tốt nhất, cùng với xác suất của từng tình huống đó, bạn sẽ có được ý tưởng tốt hơn về những rủi ro và thành quả của một hành động được đề xuất.
Mô phỏng Monte Carlo sẽ rất hữu dụng nếu bạn muốn hiểu rõ hơn về tác động và hậu quả của các bước trong một tập hợp những hành động, chiến lược, kế hoạch hoặc quyết định cụ thể. Nó đặc biệt hữu ích khi mức độ chắc chắn xung quanh một số giả định bạn cần phải thực hiện không thật sự cao. Ví dụ, nếu bạn đang xem xét việc tung ra một sản phẩm mới nhưng lại có nhiều biến số không xác định cần được xem xét lại. Bạn thật sự không biết sản phẩm này sẽ mất bao lâu để hoàn thiện, bạn không biết phải mất bao lâu để sản xuất sản phẩm và khắc phục những sự cố. Mô phỏng Monte Carlo có thể giúp hạn chế rủi ro bởi vì bạn có thể thực hiện chiến lược một cách chắc chắn hơn, nhận thức được trường hợp tốt nhất và xấu nhất một cách rõ hơn. Mô phỏng này thường được sử dụng trong các lĩnh vực như tài chính, quản lý dự án, sản xuất, kỹ thuật, nghiên cứu và phát triển, bảo hiểm, dầu khí và giao thông vận tải.
Quy hoạch tuyến tính
Còn được gọi là tối ưu hóa tuyến tính, đây là phương pháp xác định kết quả tốt nhất dựa trên một tập hợp các ràng buộc sử dụng mô hình toán học tuyến tính. Nó cho phép bạn giải quyết các vấn đề liên quan đến giảm thiểu và tối đa hóa các điều kiện, chẳng hạn như làm thế nào để tối đa hóa lợi nhuận trong khi giảm thiểu chi phí. Ví dụ, với các giới hạn của vật liệu và lao động, bạn có thể sử dụng lập trình tuyến tính xác định mức sản xuất tối ưu để tối đa hóa lợi nhuận phù hợp với những điều kiện đó.
Việc có thể tối ưu hóa tài nguyên rõ ràng là một kỹ năng quan trọng trong kinh doanh. Vì thế, lập trình tuyến tính rất hữu dụng nếu bạn có một số ràng buộc, chẳng hạn như thời gian, nguyên liệu,... và bạn muốn biết sự phối hợp nào là tốt nhất hoặc đâu là nơi cần tập trung nguồn lực của bạn để thu về lợi nhuận tối đa. Về cơ bản, đó là quy trình phân bổ nguồn lực mà nhờ đó có thể hỗ trợ cho việc ra quyết định và tăng doanh thu. Các ngành sử dụng hiệu quả kỹ thuật này bao gồm vận chuyển, năng lượng, viễn thông và sản xuất.
Phân tích theo nhóm
Đây là một tập hợp con của phân tích hành vi, cho phép bạn nghiên cứu hành vi của một nhóm theo trình tự thời gian. Các nhóm hoặc các tổ hợp trong ngữ cảnh này là tập hợp các điểm dữ liệu hoặc các bên có liên quan trong doanh nghiệp của bạn, và những dữ liệu có thể đến từ các nền tảng thương mại điện tử, ứng dụng web hoặc dữ liệu bán hàng. Các nhóm được phân tích thường có những đặc điểm chung để bạn có thể so sánh các nhóm với nhau và trích xuất một số hiểu biết sâu sắc, tiềm năng, có ý nghĩa. Hành vi được đánh giá có thể là bất kỳ điều gì mà bạn và doanh nghiệp của bạn quan tâm.
Điều làm cho kỹ thuật này trở nên hữu ích là nó cho phép bạn thấy được các xu hướng trong dữ liệu một cách rõ ràng hơn – các xu hướng có thể bị bỏ qua nếu dữ liệu không được gộp lại trong các nhóm. Bằng cách đào sâu vào từng nhóm cụ thể, bạn có thể hiểu rõ hơn về hành vi của nhóm đó. Khi bạn hiểu một nhóm cụ thể đang làm gì, tất nhiên bạn sẽ có thể sửa đổi cách tiếp cận của mình để cải thiện kết quả.
Phân tích theo nhóm đặc biệt hữu ích nếu bạn muốn biết thêm về hành vi của một nhóm các bên có liên quan, chẳng hạn như khách hàng hoặc nhân viên. Thay vì phải xem xét toàn bộ những gì khách hàng đang làm hoặc cách họ phản ứng với sản phẩm mới, hoặc những thay đổi trong dịch vụ, bạn có thể có được bức tranh toàn cảnh chính xác hơn về những gì đang diễn ra nếu bạn chia các bên liên quan đó thành các nhóm có những đặc điểm tương tự. Bằng cách này, phân tích theo nhóm có thể định hướng cho bạn trong việc ra quyết định, đặc biệt là những quyết định có thể thay đổi hành vi trong các nhóm quan trọng có liên quan. Ví dụ, nếu bạn phát hiện ra rằng hầu hết doanh thu của bạn đến từ những người phụ nữ trong độ tuổi từ 35 đến 45 thì bạn có thể điều chỉnh cách marketing và quảng cáo của mình để tiếp tục khai thác thị trường sinh lợi đó và tăng doanh thu.
Phân tích nhân tố
Đây là tên gọi chung dùng để chỉ một nhóm các kỹ thuật thống kê được sử dụng chủ yếu để giảm dữ liệu và phát hiện cấu trúc. Nó có thể làm giảm số lượng các biến trong dữ liệu để làm cho nó hữu dụng hơn. Trong kinh doanh hiện đại, chúng ta đang bị ngập trong dữ liệu; việc có quá nhiều dữ liệu có thể cũng vô dụng và yếu kém giống như việc có quá ít. Giảm các biến có trong dữ liệu giúp việc phát hiện cấu trúc trong mối quan hệ giữa các biến đó dễ dàng hơn, làm cho các biến số dễ dàng phân loại hơn.
Phân tích nhân tố có thể giúp bạn trích xuất những hiểu biết sâu sắc từ các tập dữ liệu khổng lồ. Nó cũng có thể giúp bạn xác định các mối quan hệ nhân quả mà nhờ đó định hướng chiến lược và cải thiện việc ra quyết định. Vì thế, bạn nên sử dụng phân tích nhân tố nếu bạn cần phân tích và hiểu thêm về mối tương quan giữa một số lượng lớn các biến và giải thích các biến này theo kích thước hoặc nhân tố cơ bản chung của chúng. Nếu bạn đã thu thập được một lượng lớn dữ liệu định lượng và định tính về khách hàng hoặc nhân viên của bạn và suy nghĩ, cảm nhận của họ về công ty của bạn, điều này rất hữu ích – nhưng chỉ khi bạn có thể làm sáng tỏ những ràng buộc lẫn nhau và biết chính xác những biến nào ảnh hưởng đến kết quả nào. Ví dụ, nếu bạn nhận thấy tỷ lệ nghỉ việc của nhân viên quá cao nhưng bạn lại không chắc chắn lý do tại sao, bạn có thể tiến hành các cuộc phỏng vấn thôi việc và bắt đầu một cuộc khảo sát nhân viên. Nhưng chỉ những dữ liệu ấy thôi có thể sẽ không cho bạn biết thật rõ ràng những gì đang xảy ra trong doanh nghiệp. Bằng cách xác định tất cả các thuộc tính nổi bật mà bạn nghĩ có khả năng dẫn đến tỷ lệ nghỉ việc cao, bạn có thể sử dụng phân tích nhân tố để đánh giá các mối tương quan và xác định mẫu nhằm có thể giúp bạn giải quyết hoặc ít nhất là làm giảm thiểu vấn đề đó.
Phân tích mạng nơ-ron
Mạng nơ-ron là một chương trình máy tính được mô phỏng dựa trên bộ não của con người, có thể xử lý một lượng thông tin khổng lồ và xác định các kiểu mẫu theo cách thức tương tự như cách chúng ta làm. Do đó, phân tích mạng nơ-ron là quá trình phân tích mô hình toán học được tạo nên từ mạng nơ-ron. Vì các mạng nơ-ron nhận ra các kiểu mẫu và học cách cải thiện khả năng nhận dạng của chúng, cho nên những hiểu biết của chúng có thể giúp cho việc dự đoán. Những dự đoán này sau đó có thể được kiểm tra, kết quả sẽ được sử dụng để cải thiện việc ra quyết định và hiệu suất. Mạng nơ-ron đã từng được sử dụng để tạo ra các mô hình cơ thể người, cho phép các chuyên gia chăm sóc sức khỏe kiểm tra kết quả của một số can thiệp y tế nhất định trước khi chúng được tiến hành trong thực tế. Những mô phỏng này sau đó cung cấp thêm thông tin mà nhờ đó có thể giúp các bác sĩ đưa ra những quyết định đúng đắn.
Kỹ thuật này đặc biệt hữu ích nếu bạn có một lượng lớn dữ liệu và muốn sử dụng nó để dự đoán tương lai. Cũng như trong lĩnh vực chăm sóc sức khỏe, mạng nơ-ron đã được sử dụng rộng rãi trong các ngành như ngân hàng và phòng chống gian lận. Trong kinh doanh, phân tích mạng nơ-ron có thể giúp bạn cải thiện dự báo bán hàng, nghiên cứu khách hàng và marketing theo mục tiêu. Phân tích mạng nơ-ron cũng có thể hữu ích trong việc hợp lý hóa những quy trình sản xuất và đánh giá rủi ro. Lưu ý rằng phân tích mạng nơ-ron là một phương pháp phân tích phức tạp mà thường yêu cầu sự đầu tư từ các chuyên gia trong mảng phân tích mạng nơ-ron, cũng như sử dụng các phần mềm chuyên biệt.
Phân tích tổng hợp/phân tích lý thuyết
Phân tích tổng hợp là thuật ngữ mô tả sự tổng hợp các nghiên cứu trước đây trong một lĩnh vực với hy vọng xác định các kiểu mẫu, xu hướng hoặc mối quan hệ thú vị giữa các tài liệu và kết quả nghiên cứu đã có từ trước. Về cơ bản, đây là công việc nghiên cứu lại những nghiên cứu trước đây. Về mặt khái niệm, phân tích tổng hợp là phương pháp thống kê kết hợp dữ liệu từ nhiều nguồn để cung cấp cái nhìn sâu rộng hơn, phong phú hơn và có hiểu biết sâu sắc hơn về lĩnh vực đang được nghiên cứu. Phân tích tổng hợp dần trở nên ổn định và chính xác hơn khi sử dụng nhiều dữ liệu hơn.
Kỹ thuật này rất hữu ích bất cứ khi nào bạn muốn có được những hiểu biết sâu sắc liên quan mà không cần tự mình thực hiện bất kỳ nghiên cứu nào. Miễn là phân tích đó thuộc tài sản công cộng hoặc tương đối dễ truy cập, phương pháp này có thể ít tốn chi phí hơn đáng kể so với việc thực hiện phân tích của riêng bạn. Phân tích tổng hợp có thể đặc biệt hữu ích nếu bạn đang tìm cách bước vào một thị trường hoặc một lãnh thổ mới. Nếu bạn chưa từng hoạt động trong thị trường hoặc lãnh thổ đó, bạn có thể sẽ bị cám dỗ để đưa ra các giả định về hành vi mua hàng và sự phù hợp của sản phẩm hoặc dịch vụ của bạn với thị trường đó. Tuy nhiên, nếu đã có một số nghiên cứu được thực hiện trên thị trường hoặc lãnh thổ mới này – ngay cả khi những nghiên cứu này tập trung vào các sản phẩm hoặc dịch vụ khác – bạn vẫn có thể đối chiếu các nghiên cứu đó và tìm cách xác định các kiểu mẫu hành vi có thể ảnh hưởng đến quyết định của bạn và giảm thiểu rủi ro.
Phân tích nâng cao: học máy, học sâu và điện toán nhận thức
Trên đây là một số công cụ phân tích phổ biến mà các doanh nghiệp hiện nay đang sử dụng. Thế nhưng, các phân tích nâng cao hơn (như học máy, học sâu và điện toán nhận thức) đang dần trở thành một phần của việc ra quyết định kinh doanh và hoạt động. Những công cụ này có áp dụng được cho doanh nghiệp của bạn hay không còn phụ thuộc vào những mục tiêu bạn đang cố gắng đạt được với dữ liệu – có thể nói rằng những công cụ này ít được sử dụng hơn so với phân tích cảm xúc hoặc thử nghiệm kinh doanh. Tuy nhiên, điều đó đang thay đổi. Vì vậy, ngay cả khi những kỹ thuật này không được ứng dụng trong doanh nghiệp của bạn, mỗi nhà lãnh đạo doanh nghiệp vẫn nên có nhận thức về khả năng phân tích nâng cao của chúng.
Học máy và học sâu liên quan đến việc nạp dữ liệu vào máy, sau đó chúng sẽ đưa ra quyết định hành động tốt nhất dựa trên dữ liệu đó mà không có sự can thiệp của con người. Điều này có nghĩa là các máy tính không phải được lập trình rõ ràng mà có thể tự thay đổi và cải thiện thuật toán của chúng. Nhờ các thuật toán tự học này, các máy móc chủ yếu học hỏi từ dữ liệu mà chúng được cung cấp và quyết định phải làm gì tiếp theo. Đôi khi quyết định này có thể nhắc nhở một vài hành động của con người (ví dụ, nếu một cái gì đó cần được sửa chữa hoặc thay thế, một người sẽ được giao nhiệm vụ này). Tuy nhiên, ngày càng có nhiều máy tính có thể tự thực hiện các biện pháp can thiệp.
Bất cứ ai còn nhớ các lớp lập trình máy tính thời còn đi học sẽ nhớ rằng máy tính cần một bộ mã lệnh cực kỳ chính xác để hoàn thành một nhiệm vụ. Nhiệm vụ càng phức tạp thì các mã lệnh phải càng phức tạp. Học máy và học sâu vốn khác với hình thức lập trình truyền thống. Thay vì nói với máy tính chính xác về cách thức để giải quyết một vấn đề, lập trình viên sẽ bảo nó làm thế nào để học cách giải quyết vấn đề cho chính nó. Tóm lại, nó liên quan đến việc áp dụng các số liệu thống kê vào việc học để xác định các kiểu mẫu dữ liệu, và sau đó đưa ra dự đoán từ các kiểu mẫu ấy. Nguồn gốc của học sâu và học máy đã bắt đầu từ những năm 1950, khi các nhà khoa học máy tính dạy một máy tính chơi cờ. Từ đó, khi công suất tính toán tăng lên, dẫn đến mức độ phức tạp của các kiểu mẫu mà một máy tính có thể nhận dạng, những dự đoán nó có thể tạo ra và những vấn đề mà nó có thể giải quyết vì thế cũng tăng lên.
Dựa trên điều này, điện toán nhận thức xuất phát từ sự kết hợp giữa khoa học nhận thức – nghiên cứu về não bộ con người và cách thức hoạt động của nó – và khoa học máy tính. Mục tiêu của điện toán nhận thức là mô phỏng các quá trình suy nghĩ của con người trong một mô hình máy tính. Vì vậy, bằng cách sử dụng các thuật toán tự học, máy tính có thể mô phỏng theo cách hoạt động của bộ não con người. Mặc dù máy tính đã nhanh hơn trong việc tính toán và xử lý so với con người từ nhiều thập kỷ, nhưng chúng vẫn chưa thể hoàn thành các nhiệm vụ mà con người xem là đơn giản, như việc hiểu ngôn ngữ tự nhiên hoặc nhận ra các vật thể riêng biệt trong một hình ảnh. Các hệ thống điện toán nhận thức, như hệ thống Watson của IBM, dựa vào thuật toán học sâu và mạng nơ-ron để xử lý thông tin bằng cách so sánh nó với một bộ dữ liệu huấn luyện. Hệ thống được tiếp xúc với càng nhiều dữ liệu, nó càng học được nhiều hơn, và nó sẽ càng trở nên chính xác hơn theo thời gian; mạng nơ-ron là một cái “cây” phức tạp gồm các quyết định mà máy tính có thể đưa ra để trả lời.
Có năm hình thức đáng kể mà sự tiến bộ của học máy, học sâu và điện toán nhận thức đang cách mạng hóa thế giới của chúng ta và cách thức chúng ta kinh doanh. Năm hình thức đó là:
1. Máy có thể nhìn thấy
Do máy tính có thể xem xét một lượng lớn dữ liệu và sử dụng thuật toán học máy để phân loại hình ảnh, nên việc viết một thuật toán có thể nhận ra các đặc điểm trong một nhóm hình ảnh và phân loại chúng một cách thích hợp là tương đối dễ dàng. Như đã thảo luận trong Chương 2, phải cần đến bốn bác sĩ chuyên khoa để xem xét lại kết quả tầm soát ung thư vú, quyết định xem họ đang thấy những gì và sau đó đưa ra quyết định về chẩn đoán. Giờ đây, một thuật toán đã được viết ra có thể phát hiện ung thư chính xác hơn các bác sĩ chuyên khoa giỏi nhất, để giúp cho các bác sĩ đưa ra quyết định điều trị nhanh hơn và chính xác hơn. Một loại công nghệ tương tự đang được dùng cho những chiếc xe không người lái, bởi vì giờ đây máy tính có thể nhận ra sự khác biệt giữa cây cối và người đi bộ, đèn giao thông màu đỏ và màu xanh lá, và một con đường hoặc một cánh đồng. Tự bản thân sự đổi mới sáng tạo này có thể cách mạng hóa nhiều mô hình kinh doanh khác nhau, đặc biệt là chuỗi cung ứng và giao hàng, hoặc sự vận chuyển.
2. Máy có thể đọc
Xác định xem liệu văn bản có chứa một từ hoặc cụm từ nào đó hay không, và việc hiểu ngữ cảnh là hai việc hoàn toàn khác nhau. Giờ đây, các thuật toán có thể xác định được một câu là tích cực hay tiêu cực, và còn hơn thế nữa. Loại công nghệ này có thể giúp chúng ta hiểu thêm về những gì mọi người đang suy nghĩ và cảm nhận, và có thể tiết kiệm rất, rất nhiều thời gian làm việc của con người. Ví dụ, bằng việc sử dụng công nghệ xem đường phố của Google và khả năng đọc số nhà của nó, công ty này đã có thể lập bản đồ tất cả các địa chỉ ở Pháp chỉ trong vài giờ – một kỳ tích có thể khiến nhiều chuyên gia lập bản đồ tốn nhiều tuần, thậm chí là nhiều tháng nếu làm thủ công.
3. Máy có thể nghe…
Siri, Cortana và những công cụ tương tự đại diện cho một bước tiến vượt bậc trong việc hiểu biết của máy móc đối với lời nói của con người. Giờ đây, trợ lý ảo có thể nhận ra một danh sách gồm các lệnh lớn và phát triển từng ngày, và có thể đáp ứng những lệnh này. Google và các đối thủ cạnh tranh thậm chí còn phát triển theo hướng các thuật toán tìm kiếm có thể hiểu được lời nói tự nhiên, vì tìm kiếm bằng giọng nói đang trở nên phổ biến hơn. Ngày nay, bạn có thể nhập hoặc nói một câu như “Quán cà phê gần nhất đang mở cửa ở đâu?” và Google không chỉ hiểu ý bạn, mà nó còn biết bạn đang ở đâu, lúc đó là mấy giờ và trả lời bạn như thế nào.
4. ... và có thể nói chuyện
Bản dịch ngôn ngữ từ máy tính luôn khiến cho chúng ta cảm thấy buồn cười, và có lý do chính đáng cho điều đó. Có rất nhiều sắc thái trong ngôn ngữ – tiếng lóng, thành ngữ, ý nghĩa văn hóa – điều đó đã khiến cho một đoạn văn bản sau khi qua phần mềm dịch thuật có thể tạo ra một số kết quả không chính xác và rất buồn cười. Nhưng các thuật toán học máy mới đang làm cho việc có được các bản dịch ngay lập tức với độ chính xác cao hơn trở nên khả thi. Ví dụ, Microsoft giờ đây đã cung cấp các bản dịch tức thì cho những cuộc gọi video nhóm của Skype bằng bảy ngôn ngữ khác nhau. Trong trường hợp này, đó là sự kết hợp của việc lắng nghe người dùng, hiểu các từ ngữ và dịch toàn bộ trong cùng một lúc. Đây là một bước đột phá ấn tượng. Và vì chương trình được xây dựng dựa trên học máy, nên nó chỉ trở nên tốt hơn nhờ vào việc thực hành, cũng như nó sẽ có nhiều dữ liệu để làm việc hơn.
5. Máy có thể viết
Như chúng ta cũng đã thấy trong cuốn sách này, máy tính đang ngày càng trở nên tốt hơn trong việc tạo ra các bài viết – thậm chí đến mức chúng đang tạo ra các bài báo cho những nguồn tin tức đáng tin cậy. Nếu máy tính có thể nhận ra một điều gì đó – một hình ảnh, một tài liệu, một tập tin,… – và mô tả nó một cách chính xác, thì việc tự động hóa này sẽ mang lại rất nhiều công dụng. Điều này tác động đến tất cả các công việc nhập và phân loại dữ liệu mà trước đây cần đến sự can thiệp của con người. Mặc dù công nghệ vẫn không hoàn hảo trong nhiều trường hợp, nhưng nó sẽ dần trở nên tốt hơn.
Với khả năng tuyệt vời đã tồn tại cùng với tốc độ mà các công nghệ này đang phát triển, tôi tin chắc rằng học máy, học sâu và điện toán nhận thức sẽ tác động đáng kể đến hầu hết các ngành và công việc liên quan, đó là lý do tại sao mỗi nhà quản lý nên có ít nhất một vài hiểu biết về những thuật ngữ này. Lời hứa thật sự của học sâu, học máy và điện toán nhận thức không phải là máy tính sẽ bắt đầu suy nghĩ như con người; đúng hơn là việc có một bộ dữ liệu đủ lớn, bộ vi xử lý đủ nhanh và với một thuật toán đủ tinh vi, máy tính có thể bắt đầu hoàn thành các nhiệm vụ mà trước đây chỉ con người mới có thể thực hiện. Theo ý nghĩa đã phân tích, điều này có nghĩa là các nhiệm vụ dữ liệu ngày càng phức tạp có thể được thực hiện và tối ưu hóa một cách tự động, dẫn đến những hiểu biết ngày càng sâu sắc hơn để từ đó chuyển thành các quyết định tốt hơn và thực hiện tối ưu hơn.
Kết hợp phân tích để đạt được thành công tối đa
Thông thường, giá trị của dữ liệu không nằm ở bất kỳ tập dữ liệu khổng lồ hay một công cụ phân tích hào nhoáng nào, nó nằm ở những hiểu biết sâu sắc có thể thu được từ việc kết hợp các loại dữ liệu và các kiểu phân tích khác nhau. Ví dụ, phân tích tương quan có thể cho bạn biết rằng bạn bán được nhiều Pop-Tarts hơn khi có cảnh báo bão, nhưng nó sẽ không cho bạn biết lý do tại sao. Nếu bạn muốn hiểu lý do cụ thể tại sao mọi người chuyển sang mua Pop-Tarts (giả sử nếu bạn muốn nhắm đến các sản phẩm tương tự), bạn có thể thực hiện một số phân tích văn bản hoặc phân tích cảm xúc để xem mọi người nói gì về Pop-Tarts trên các nền tảng truyền thông xã hội.
Ý tưởng đằng sau việc kết hợp các phân tích là để việc ra quyết định và hoạt động kinh doanh của bạn dựa trên một bức tranh rõ ràng nhất có thể, không chỉ dựa vào kết quả của một bộ phân tích nào. Kết hợp thông tin từ nhiều nguồn và sử dụng các phương pháp phân tích khác nhau cho phép bạn xác minh những thông tin ẩn chứa bên trong đó từ nhiều góc độ.
Tất cả các phương pháp mà tôi đã phác thảo trong chương này chỉ thể hiện một phần nhỏ những khả năng phân tích có sẵn cho các doanh nghiệp hiện nay. Chỉ vài năm trước, không kiểu phân tích nào trên đây được xem là khả thi; chúng ta không thể phân tích cảm xúc dựa trên văn bản, máy tính không thể xác định ung thư tốt hơn bác sĩ, và phần mềm nhận diện khuôn mặt chỉ mới ở giai đoạn hình thành và còn cách rất xa so với sự chính xác của mắt người. Cụ thể, phân tích đã tạo ra những bước nhảy vọt lớn đến nỗi không ai biết chắc chắn điều gì sẽ xảy ra trong thời gian mười năm, hoặc thậm chí là năm năm tới. Do đó, khi phát triển chiến lược dữ liệu của bạn, điều quan trọng là hãy luôn cởi mở trước những cơ hội mới mà dữ liệu và phân tích có thể đem đến trong tương lai.