Lần đầu tiên nghe được thuật ngữ “Thời đại Thông tin” tôi đã bị cuốn hút ngay. Tôi đã được biết về Thời đại Ðồ sắt và Thời đại Ðồ đồng, hai thời kỳ trong lịch sử tiến hóa của nhân loại được đặt tên theo những kim loại mà con người đã phát hiện ra rồi sử dụng để chế tạo công cụ và vũ khí. Và dĩ nhiên là ở trường tôi cũng đã được học về Thời đại Công nghiệp. Nhưng khi đọc được những lời dự báo mang tính lý thuyết rằng các quốc gia sẽ cùng nhau tranh giành quyền kiểm soát thông tin, chứ không phải là tài nguyên thiên nhiên nữa, tỗi vẫn chưa hiểu thấu đáo ý nghĩa thật sự của thông tin.
Việc khẳng định rằng tương lai sẽ được xác định bằng thông tin gợi lại cho tôi một cảnh nổi tiếng về buổi tiệc trong bộ phim The Graduate năm 1967. Một doanh nhân đã cố giữ chân chàng sinh viên vừa tốt nghiệp Benjamin – do Dustin Hoffman thủ vai – chỉ để tặng anh ta một lời khuyên hướng nghiệp miễn phí, gói gọn trong hai tiếng: “Chất dẻo”. Liên hệ đến thực tại, tôi đã tự hỏi rằng, giả như cảnh phim đó được viết ra vài thập kỷ sau đó, liệu lời khuyên của doanh nhân kia có đổi lại thành: “Chỉ hai từ thôi, Benjamin, ‘Thông tin’” không nữa.
Có lẽ điều làm tôi phân vân là vì thật ra lúc ấy ngành thông tin chỉ là một trong nhiều hướng rẽ xuất hiện trên giao lộ gồm một số môn học yêu thích nhất của tôi ở trường đại học. Môn toán tôi học giỏi nhất là “giải thích tổ hợp”, ứng dụng thực tiễn của nó là tạo ra và giải các thông điệp được mã hóa – các mật mã. Việc dùng toán học để khóa và mở khóa các thông tin đã thật sự mê hoặc tôi. Tôi cũng quan tâm đến lý thuyết trò chơi kinh tế, là môn học dùng toán và phép suy luận logic để tạo nên những chiến lược cạnh tranh tối ưu. Ðiều này khiến tôi phải suy nghĩ về cách tính giá trị của thông tin trong một cuộc tranh tài mà mỗi bên đều có trong tay những bí mật sinh tử. Giá trị được gán cho thông tin sẽ là bao nhiêu nếu thông tin bí mật này đang được nhiều người nắm giữ trong tay? Giá trị này có thể chỉ còn là số không, nhất là nếu giữa hai người, hay nhiều hơn nữa nổ ra một cuộc chiến tranh giá cả và mọi người đang tìm cách bán cùng một thông tin.
Với tôi, dường như là quá nhiều người sẵn sàng chấp nhận, không chút suy xét, ý kiến cho rằng không tin đang trở thành loại hàng hóa giá trị nhất. Thông tin có ở thư viện. Ai cũng có thể tra cứu mà chẳng tốn đồng xu cắc bạc nào. Không lẽ việc truy cập thông tin dễ dàng như vậy đã không làm xói mòn giá trị của nó sao? Và thông tin có thể sai lầm chứ! Trong trường hợp này thông tin có thể mang giá trị phủ định – chúng có thể gây hại thay vì giúp đỡ. Ngay cả khi lượng thông tin đang dồn dập dội xuống chúng ta mỗi ngày có được chứng minh là chính xác đi nữa thì ngẫm lại, đa số chỉ là những thông tin thuộc dạng vô thưởng vô phạt. Và giả dụ như chúng có liên quan thiết thực đến cuộc sống chúng ta chăng nữa thì giá trị của chúng chỉ thoáng qua, suy giảm theo thời gian hoặc khi có quá nhiều người nắm được chúng. Thí dụ như, một bí quyết đầu tư một thời đầy hừa hẹn có thể trở nên vô dụng nếu đã cũ kỹ hay khi đã được phổ biến rộng rãi. Nhưng nói gì thì nói, thông tin vẫn trụ lại như một thành phần trọng yếu trong một nền kinh tế toàn cầu đang sinh sôi.
Tôi có thể tưởng tượng ra những mẩu đối thoại vô nghĩa nghe được quanh một văn phòng trong tương lai: “Anh/Chị có bao nhiêu thông tin?”, “Thụy Sĩ là một xứ sở tuyệt vời vì họ có biết bao nhiêu là thông tin!”, “Tôi nghe nói Chỉ số Giá Thông tin đang tăng đấy!”.
Các mẩu đối thoại như thế nghe vô nghĩa vì thông tin không phải là thứ có thể sờ mó được hoặc có thể đem ra cân đong đo đếm như những loại kim khí đã giúp để xác định nên những thời đại trước kia, nhưng các học giả lại đang đề cập đến một điều gì khác. Thông tin đang ngày càng trở nên quan trọng hơn đối với chúng ta, và quả thật chúng ta đang đặt chân vào ngững cửa một cuộc cách mạng thông tin. Chi phí truyền thông đang bắt đầu hạ xuống, dù chưa phải đã xuống nhanh với tốc độ phi mã như chi phí sử dụng máy điện toán. Khi chi phí truyền thông trở nên thật rẻ và được kết hợp với những tiến bộ kỹ thuật khác, ảnh hưởng của thông tin tương tác sẽ trở nên hiện thực và vươn xa chẳng kém gì ảnh hưởng của dòng điện vậy.
Ðể hiểu được vì sao thông tin đang ngày càng chiếm một vị trí “quan trên trông xuống, người ta dòm vào” như vậy, điều quan trọng trước tiên phải biết nền công nghệ hiện thời đang làm thay đổi cách thức chúng ta xử lý thông tin như thế nào. Phần quan trọng trong chương này được dành để cung cấp cho những độc giả - vốn xa lạ với lịch sử của việc tính toán bằng máy và các nguyên lý xử lý thông tin dùng trong máy điện toán – những kiến thức cần thiết đủ để tiếp tục đọc phần còn lại của sách này. Nếu đã hiểu cách hoạt động của máy điện toán kỹ thuật số, bạn có thể thoải mái bỏ qua chương này.
Ðiểm khác biệt cơ bản và dễ nhận thấy nhất giữa “thông tin” mà chúng ta từng biết và “thông tin” trong tương lai là hầu như mọi thông tin trong tương lai sẽ được số hóa. Toàn bộ sách, báo, tài liệu in ấn có trong các thư viện đang dần được quét và lưu trữ dưới dạng dữ liệu điện tử trên các đĩa từ hay CD-ROM. Ngày nay, các báo và tạp chí thường được biên soạn hoàn toàn dưới dạng điện tử, và sau đó in ra giấy chỉ để thuận tiện cho việc phát hành. Các thông tin điện tử trên báo chí được lưu trữ vĩnh viễn – hay cho đến khi nào còn có người cần đến – trong các cơ sở dữ liệu (tức là các kho dữ liệu đã được hệ thống hóa) của máy điện toán. Ðó là những ngân hàng dữ liệu báo chí khổng lồ mà ai cũng có thể truy cập thông qua những dịch vụ trực tuyến. Những ảnh chụp, phim và băng video đang được chuyển đổi thành những thông tin dạng số. Cứ mỗi năm chúng ta lại đề xuất những phương pháp tốt hơn để xác định số lượng thông tin và chất lọc thông tin thành hàng tỷ bit dữ liệu nhỏ như những nguyên tử. Một khi thông tin dạng số đã được lưu trữ, bất cứ ai được phép truy cập thông qua một máy điện toán cá nhân đều có thể vừa lấy thông tin, vừa so sánh và vừa chỉnh trang lại (refashion) thông tin cùng một lúc. Ðiểm đặc sắc trong giai đoạn lịch sử này, và cũng là điểm khiến nó khác hẳn các giai đoạn lịch sử khác, đó là khả năng chỉnh trang lại thông tin – những cách thức hoàn toàn mới dùng để thao tác và thay đổi thông tin – và tốc độ ngày càng tăng trong việc xử lý thông tin. Khả năng máy điện toán cung cấp cách xử lý và truyền các dữ liệu số hóa với tốc độ cao và giá thấp sẽ làm thay đổi hoàn toàn những thiết bị liên lạc cổ điển trong gia đình và nơi làm việc của chúng ta.
Ý tưởng về việc sử dụng một công cụ để làm việc với những con số chẳng phải là điều mới mẻ gì. Người châu Á đã dùng bàn tính trong suốt gần 5000 năm trước khi nhà khoa học 19 tuổi người Pháp, Blaise Pascal, phát minh chiếc máy tính cơ khí đầu tiên vào năm 1642. Ðó là một thiết bị đếm. Bốn mươi năm sau đó nhà toán học Ðức Gottfried von Leibniz cải tiến bản thiết kế của Pascal. Chiếc “Máy ếm Từng Bước” (Stepped Reckoner) của ông có thể làm các phép tính nhân, chia và khai cân bậc hai. Những chiếc máy cơ khí đáng tin cậy vận hành nhờ vào việc quay những đĩa số và bánh răng, hậu duệ của “Máy ếm Từng Bước”, đã từng là rường cột của các hoạt động điều hành kinh doanh mãi cho tới khi những đồng nghiệp điện tử của chúng ra đời để thay thế. Hồi tôi còn bé, một chiếc máy tính tiền thực chất vẫn là một chiếc máy tính cơ khí đựng với một ngân kéo đựng tiền mặt.
Blaise Pascal (1623 – 1662) là một triết gia, nhà toán học và nhà vật lý người Pháp và được xem là người có đầu óc thông thái nhất trong lịch sử tri thức của phương Tây. Pascal chào đời tại Clermont-Ferrand và gia đình ông định cư tại Paris năm 1629. Dưới sự chăm sóc và dạy dỗ của người cha, Pascal sớm bộc lộ tư chất là một thần đồng toán học. Ở tuổi 16 ông đã nêu ra định lý cơ bản về hình học qui chiếu (projective geometry), được biết đến như định lý Pascal và được trình bày trong tác phẩm của ông Essai Pour Les Coniques (Essay on Conics, 1639). Năm 1642 Pascal phát minh ra máy tính cộng cơ khí đầu tiên. Bằng thực nghiệm, năm 1648 Pascal chứng minh rằng mức dao động lên xuống của thủy ngân trong một phong vũ biểu sẽ được xác định bởi môi trường áp suất không khí chứ không phải do chân không như mọi người đã lầm tưởng. Khám phá này đã xác nhận giả thuyết của nhà vật lý người Ý Evangelista Torricelli về tác động của áp suất không khí đối với trạng thái cân bằng của chất lỏng. Sáu năm sau, cùng với nhà toán học người Pháp Pierre de Fermat, Pascal trình bày lý thuyết toán học về xác suất. Lý thuyết này đã trở thành quan trọng trong những lĩnh vực như thống kê về xã hội, toán học và bảo hiểm và là một yếu tố cơ bản trong những tính toán của ngành vật lý lý thuyết hiện đại. Những đóng góp khoa học quan trọng khác của Pascal bao gồm những hệ luận rút ra từ định luật và nguyên lý Pascal, phát biểu rằng chất lỏng truyền áp suất ra mọi hướng như nhau, và các nghiên cứu của ông về môn hình học vi phân. Phương pháp làm việc của ông chú trọng đến phần thực nghiệm chứ không theo phương pháp phần tích, suy diễn và ông tin rằng sự tiến bộ của nhân loại là bất tận do tích lũy những khám phá khoa học đến từ những thực nghiệm.
Hơn 150 năm trước, một nhà toán học Anh nhìn xa trông rộng đã thoáng nhận ra khả năng hiện hữu của máy điện toán, và chính tầm nhìn trí tuệ đó đã giúp ông nổi tiếng ngay từ thời đó. Charles Babbage, giáo sư toán của trường Ðại học Cambr-idge, từ lâu đã nung nấu trong lòng ý nghĩ thực hiện một thiết bị cơ khí có thể thực hiện một chuỗi những phép toán có liên quan với nhau. Ngay từ đầu thập kỷ 1830 Babbage đã bị lôi cuốn bởi ý tưởng rằng thông tin có thể được xử lý bằng máy móc nếu trước hết thông tin đó có thể được chuyển sang dạng số. Chiếc máy chạy bằng động cơ hơi nước mà babbage đã hình dung ra sẽ sử dụng những chốt chặn, những bánh răng, những ống xy lanh và những bộ phận cơ khí khác, là những “thiết bị máy móc” phổ biến trong Thời đại Công nghiệp non trẻ lúc bấy giờ. Babbage tin rằng “Cỗ Máy Phân Tích” (Analytical Engine) của mình sẽ tống khứ sự nhọc nhằn và thiếu chính xác ra khỏi việc tính toán.
Nhà toán học Babbage đã không dùng những thuật ngữ như hiện nay chúng ta đang dùng để nói đến những bộ phận trong cỗ máy của mình. Ông gọi bộ xử lý trung tâm, tức là phần hoạt động bên trong, của chiếc máy của mình là “máy xay”. Ông đề cập đến bộ nhớ trong máy của mình bằng từ “kho chứa”. Babbage hình dung rằng thông tin cũng sẽ được “thay hình đổi dạng” theo như cách mà bồng vải được làm – nghĩa là, sẽ được lấy ra từ kho chứa và rồi được xay nghiền thành một cái gì đó hoàn toàn khác.
“Cỗ Máy Phân Tích” của ông hẳn nhiên là một thiết bị cơ khí, nhưng Babbage đã thấy được cách để máy có thể làm theo những bộ hướng dẫn (tập lệnh) có thay đổi, và nhờ vậy có thể phục vụ nhiều chức năng khác nhau. Và đó chính là bản chất của phần mềm, một tập hợp hoàn chỉnh những quy tắc dạy cho một cái máy biết phải làm gì, “hướng dẫn” cho nó, từng bước một, cách làm thế nào để thực hiện những tác vụ cụ thể. Babbage nhận ra rằng ông sẽ cần đến một loại ngôn ngữ hoàn toàn mới để cung cấp cho máy những hướng dẫn này, và ông đã nghĩ ra một ngôn ngữ sử dụng các con số, chữ cái, mũi tên và nhiều ký hiệu khác. Babbage đã thiết kế ngôn ngữ này để ông có thể “lập trình” cho Cỗ Máy Phân Tích bằng một chuỗi dài những lệnh có điều kiện hầu cho phép cỗ máy này biến đổi những thao tác của mình một cách thích ứng trong trường hợp hoàn cảnh thay đổi. Ông là người đầu tiên nhận thấy rằng chỉ với một cái máy thôi cũng đủ để phục vụ một số mục đích khác nhau, chứ không phải như máy tỉa hạt bông vải, được thiết kế để mãi mãi chỉ làm được một việc. Ông biết rằng một cái máy đa chức năng, sử dụng phần mềm, có thể thay thế được vô số máy chỉ dùng riêng cho một chức năng.
Trong thập niên 1820, Charles Babbage chế tạo một máy chạy điện có nhiều đặc điểm giống như máy điện toán ngày nay.
Charles Babbage (1792 – 1871) là một nhà toán học đồng thời cũng là nhà phát minh người Anh. Ông là người đã thiết kế và chế tạo một chiếc máy tính toán cơ khí dựa trên những nguyên lý mà cho đến ngày nay vẫn còn đang được các máy điện toán điện tử dùng đến. Babbage chào đời tại Teignmouth, Devonshire và theo học tại trường ại học Cambridge. Ông trở thành hội viên hội Hoàng Gia năm 1816 và là người tích cực vận động để thành lập các Hội Giải Tích Học, Hội Thiên Văn Hoàng Gia và Hội Thống Kê.
Vào những năm 1820 Babbage bắt đầu phát triển Máy Sai Phân (Difference Engine), một thiết vị cơ khí dùng để thực hiện các phép toán số học đơn giản. Babbage đã bắt tay vào việc chế tạo chiếc máy này, nhưng phải bỏ dở vì thiếu kinh phí. Tuy nhiên, đến năm 1991 các nhà khoa học Anh, thoe đúng bản vẻ chi tiết và những thông số k thuật cụ thể của Babbage, đã chế tạo thành công Máy Sai Phân. Cỗ máy này hoạt động hoàn toàn hảo. Nó có thể cho ra kết quả với độ chính xác của 31 chữ số, một minh chứng cho thấy ý tưởng của Babbage là hoàn toàn đúng đắn.
Những năm 1830 Babbage bắt đầu chế tạo máy Giải Tích (Analytical Engine), với mục đích là giải những bài toán phức tạp hơn. Tác phẩm “Tiết Kiệm trong Máy Móc và Sản Xuất” (Economy of Machines and Manufactures) của ông xuât bản năm 1832 đã khơi nguồn cho một lĩnh vực nghiên cứu mới mà ngày nay được gọi dưới tên là “sự nghiên cứu quá trình vận hành”.
Máy Giải Tích (Analytical Engine)
Máy Giải Tích là một máy tính cơ khí, được nhà toán học kiêm khoa học gia người Anh Charles babbage thiết kế vào năm 1883. Tuy nhiên cỗ máy này chỉ mới được ông chế tạo xong một phần và đến năm 1920 đã được con trai ông thiết kế hoàn chỉnh (xem hình). Cỗ máy này mặc dầu được thai nghén từ lâu trước khi chiếc máy điện toán đầu tiên ra đời nhưng nó đã có khả năng lưu trữ các lệnh, thực hiện các phép toán và sử dụng các thẻ xuyên phiếu (punched cards) như một dạng bộ nhớ thường trực.
Trong khoảng thời gian một trăm năm sau đó, các nhà toán học đã làm việc dựa trên các ý tưởng thoát thai từ sự tư duy của Babbage, và cuối cùng, đến giữa những năm 1940 họ đã hoàn toàn chỉnh một máy điện toán điện tử dựa trên các nguyên lý hoạt động của Cỗ Máy Phân Tích của ông. Khó mà xác định được cha đẻ của chiếc máy điện toán hiện đại này là ai vì phần lớn việc suy nghĩ và chế tạo được thực hiện tại Mỹ và Anh trong thời gian xảy ra Chiến Tranh Thế giới lần thứ hai, được “giấu diếm” dưới tấm màn bí mật thời chiến. Chúng ta chỉ biết rằng Alan Turing, Claude Shannon, và John von Neumann là ba nhân vật đóng góp nhiều công sức nhất.
Vào giữa thập niên 1930 Alan Turing, cũng như Babbage, là một nhà toán học siêu việt người Anh được đào tạo từ lò Cambridge, đã đề xuất cái mà ngày nay được biết đến với tên gọi “cỗ máy Turing”. Ðó là phiên bản của một máy tính toán đa chức năng của ông, có thể được hướng dẫn để làm việc với hầu hết mọi loại thông tin.
Vào cuối thập niên 1930, khi hãy còn là một sinh viên, Claude Shannon đã chứng minh được cách xử lý thông tin bằng một cỗ máy có khả năng thi hành những lệnh logic. Ý tưởng sắc sảo này, cũng chính là đề tài luận văn cử nhân của ông, là tạo ra các mạch điện cho máy điện toán – quy ước rằng mạch đóng là đúng, và mạch hở là sai – có thể thực hiện các phép toán logic: số 1 có thể tượng trưng cho “đúng” và số 0 tượng trưng cho “sai”.
Ðây là hệ thống nhị phân, một loại mã. Cách biểu diễn nhị phân chính là bảng chữ cái của các máy điện toán điện tử, dùng làm cơ sở cho việc chuyển ngữ, lưu trữ và xử lý tất cả thông tin có trong máy điện toán. Mỗi số 1 và 0 là một bit (mảnh) thông tin.
Alan Mathison Turing (1912 – 1954) là một nhà toán học người Anh và là người đi đầu trong lĩnh vực lý thuyết máy điện toán. Năm 1936, trong lúc đang học để lấy bằng Cao học, Turing đã xuất bản một tài liệu có tên “Về các Con Số có Khả Năng Tính Toán (On Computable Numbers).” Trong đó trình bày khái niệm về một thiết bị tính toán mà ngày nay gọi là Cỗ may Turing. Ý niệm của cỗ máy này, về lý thuyết có thể thực hiện bất kỳ phép toán nào, là một đóng góp quan trọng cho việc phát triển máy điện toán k thuật số. Turing cũng khai triển tác phẩm toán học của mình sang lĩnh vực nghiên cứu các hình thức sinh lý học và trí tuệ nhân tạo. Ông đề nghị một phương pháp gọi là phép Thử Turing, nhằm xác định xem máy móc nào đó có khả năng suy nghĩ hay không.
Claude E. Shannon (1916 - ) là một nhà toán học ứng dụng và là một k sư điện người M . Ông nổi tiếng nhờ vào những đóng góp to lớn vào việc phát triển ngành lý thuyết truyền thông mà giờ đây được biết đến dưới cái tên lý thuyết thông tin. Năm 1948 Shannon công bố “Lý Thuyết Toán Học về Truyền Thông” (The Mathematical Theory of Communication) một bài viết trình báy những ý niệm ban đầu của ông về một lý thuyết hợp nhất giữa việc truyền tải và xử lý thông tin. Thông tin theo nghĩa trong bài viết này bao gồm tất cả các hình thức thông điệp được chuyển tải – bao gồm cả những tín hiệu được gởi đi trong hệ thần kinh của một cơ thể sống: lý thuyết thông tin ngày nay chiếm một vị trí quan trọng trong nhiều lĩnh vực của đời sống con người.
John von Neumann (1903 – 1957) là nhà toán học người M . Ông là người đã phát triển một ngành toán học có tên là lý thuyết trò chơi. Von Neumann là một trong số những nhà toán học lỗi lạc của thế giới và được nhiều người biết đến vì những đóng góp cơ bản cho bộ môn lý thuyết cơ khí lượng tử, đặc biệt là khái niệm “rings of operators” (ngày nay gọi là môn đại số Neumann). Ông đồng thời còn là người có những công trình nghiên cứu tiên phong trong ngành toán học ứng dụng, chủ yếu trong lĩnh vực phần tích số và thống kê.
Ông còn được nhiều người biết đến qua việc thiết kế các máy điện toán tốc độ cao. Năm 1952, ông chế tạo chiếc máy điện toán đầu tiên trên thế giới sử dụng chương trình được lưu trữ linh hoạt, máy MANIAC I.
Tôi và các bạn của mình đã có những hồi ức thú vị với những số nhị phân tại sân sau nhà tôi vào mùa hè năm 1991. Chúng tôi chia phe để tranh tài với nhau trong một cuộc thi đánh tín hiệu khói. Mục tiêu là mã hóa thông tin sao cho nó có thể truyền đi nhanh nhất. Mỗi đội được giao một máy tạo khói và hai hay ba thành viên trong đội sẽ được phân công sử dụng máy này để truyền tín hiệu, trong khi những thành viên còn lại đứng từ xa ghi nhận lại các tín hiệu này, cũng như trong trò chơi đố chữ bằng động tác. Mỗi đội sẽ có hai mươi phút để nghĩ ra một loại mã giúp họ dùng những luồng khói để truyền đạt một con số. Không người nào trong cuộc tranh tài này biết đích xác con số đó là bao nhiêu, thậm chí cũng không biết số đó gồm bao nhiêu chữ số, do đó loại mã mà các đội nghĩ ra phải có tính linh hoạt.
Về sự có mặt của khá nhiều lập trình viên máy điện toán trong mỗi đội, không có gì ngạc nhiên khi đội chiến thắng đã dùng một lược đồ số nhị phân, chuyển đổi mỗi chữ số của con số bí mật thành một một số nhị phân 4 bit. Có nghĩa 0 sẽ được gửi đi dưới dạng 0000, 1 là 0001, 2 là 0010, 3 là 0011, và cứ tiếp tục như thế. Bất kỳ số nào cũng có thể được thể hiện theo lược đồ này, có thể tên gọi là “số thập phân được mã hóa dưới dạng số nhị phân”. Ðội thắng cuộc đã định ra rằng một luồng khói ngắn báo hiệu 0, còn một luồng khói dài là 1. Nếu tôi nhờ không nhầm thì con số bí mật đó là 709, đã được những nhà vô địch dịch thành 0111-0000-1001 và gửi đi dưới dạng ngắn-dài-dài-dài-ngắn-ngắn-ngắn-ngắn-dài- ngắn-ngắn-dài. Dù vậy, thật ra thì lược đồ “số thập phân mã hóa dưới dạng số nhị phân” chưa phải là cách hiệu quả nhất để truyền đi dưới dạng 1011000101 – mười luồng khói so với mười hai luồng khói của đội thắng. Ðội chiến thắng đơn giản là đã dùng máy phun khói của mình rất điêu luyện.
Hệ nhị phân thật đơn giản, nhưng lại cực kỳ quan trọng để hiểu thấu được cách thức hoạt động của máy điện toán đến nỗi sẽ rất đáng cho chúng ta tạm dừng lại đây để giải thích đầy đủ hơn về nó.
Hãy tưởng tượng rằng chúng ta muốn dùng bóng đèn điện để chiếu sáng một căn phòng với công suất phát sáng tối đa là 250 watt, và bạn muốn rằng lượng sáng này phải điều chỉnh được, từ 0 watt (tối đen hoàn toàn) cho đến công suất tối đa. Có một cách để đạt được điều này là dùng một thiết bị điều chỉnh độ sáng dạng xoay tròn nối trực tiếp với một bóng đèn 250 watt. Ðể làm tối hoàn toàn, bạn sẽ vặn núm xoay ngược chiều kim đồng hồ về đến điểm Off (tắt) để có lượng sáng là 0 watt. Ðể có lượng sáng tối đa, bạn vặn núm xoay theo chiều kim đồng hồ cho đến tận cùng ở mức 250 watt. Với mức độ chiếu sáng nào đó ở khoảng giữa, bạn sẽ vặn núm xoay đến một điểm ở lưng chừng.
Hệ thống này dễ dùng, nhưng có những hạn chế của nó. Nếu núm xoay được đặt ở lưng chừng – chẳng hạn bạn đang muốn giảm công suất đèn để có một ánh sáng dịu cho một buổi ăn tối thân mật – bạn chỉ có thể áng chừng mức độ sáng là bao nhiêu. Bạn không thật sự biết mình đang dùng chính xác bao nhiêu watt, hay không biết rõ làm cách nào để diễn tả chính xác cách xác lập ra ánh sáng đó được. Các xác lập/thông tin đó của bạn chỉ là ước lượng xấp xỉ, sẽ khiến cho việc lưu trữ hay tái tạo sẽ trở nên rất khó khăn.
Bạn sẽ làm gì nếu muốn mô phỏng thật chính xác lượng sáng này vào tuần tới? Bạn có thể đánh dấu trên công tắc để biết được phải xoay núm tới đâu, nhưng như vậy khó mà chính xác được, và chuyện gì sẽ xảy ra nếu bạn lại muốn tái tạo một ánh sáng đã dùng khác? Bạn có thể nói “Xoay núm khoảng một phần năm vòng theo chiều kim đồng hồ”, hay “Xoay núm cho đến khi mũi tên nằm ở hướng khoảng hai giờ”, nhưng người bạn của bạn chỉ có thể tạo được gần gần đúng cách xác lập ánh sáng như vậy của bạn mà thôi. Rồi sẽ ra sao nếu người bạn đó chuyển thông tin nói trên đến một người bạn khác, và rồi đến lượt người này lại chuyển đi một lần nữa? Chắc chắn, mỗi lần thông tin được chuyển giao thì độ chính xác còn lại của nó lại càng suy giảm.
Ðấy là một ví dụ thông tin được lưu dưới dạng “analog” (tương tự). Vị trí của núm xoay cung cấp một sự tương tự đối với mức độ sáng của bóng đèn. Nếu núm được xoay nửa vòng, bạn cho rằng mình đang dùng một nửa công suất. khi bạn đo lường hay mô tả núm được xoay đi bao xa, thật ra bạn đang lưu trữ, và tái tạo, nhưng có xu hướng thiếu chính xác – và bạn luôn gặp nguy cơ thông tin trở nên kém chính xác hơn sau mỗi lần được truyền đi.
Giờ chúng ta hãy xem xét một cách hoàn toàn khác mô tả cách xác lập lượng ánh sáng trong phòng, bằng phương pháp số hóa chứ không phải là phương pháp tương tự để lưu trữ và chuyển giao thông tin nào cũng có thể được chuyển thành những con số được tạo bởi các chữ số 1 và 0 – tức là các số nhị phân. Một khi đã được chuyển thành các chữ số 1 và 0, thông tin có thể được nạp vào và lưu trữ trong máy điện toán dưới dạng những chuỗi bit dài. Những con số đó chính là tất cả ý nghĩa của thuật ngữ “thông tin k thuật số” (digital information).
Cứ cho rằng thay vì chỉ có một bóng đèn 250 watt, chúng ta có tám bóng đèn – mỗi bóng có công suất từ 1 đến 128 watt, được xếp thứ tự, với bóng xếp sau có công suất gấp đôi bóng đứng trước nó. Mỗi bóng đèn trong số tám bóng đó được nối với một công tắc, với bóng đèn có công suất nhỏ nhất ở bên phải. Sự sắp xếp như vậy có thể được biểu diễn như trong hình sau:
Bằng cách mở và tắt những công tắc này, bạn có thể điều chỉnh nhiều mức độ sáng khác nhau, có độ chênh lệch là 1 watt, trong khoảng từ 0 watt (tất cả công tắc đều tắt) đến 255 watt (tất cả công tắc đều mở). Như vậy bạn có đến 256 khả năng điều chỉnh chính xác. Nếu muốn có ánh sáng 1 watt, bạn bật chỉ công tắc ngoài cùng bên phải để mở bóng đèn 1 watt. Nếu muốn có ánh sáng 2 watt, bạn mở chỉ một bóng 2 watt. Nếu muốn có ánh sáng 3 watt, bạn mở cả hai bóng đèn 1 watt và 2 watt vì 1 cộng 2 chính là 3 watt bạn muốn. Nếu muốn 4 watt ánh sáng, bạn mở bóng đèn 4 watt. Nếu muốn 5 watt, chỉ cần mở các bóng đèn 4 watt và 1 watt. Nếu muốn có ánh sáng 250 watt, bạn mở tất cả trừ hai bóng đèn 4 watt và 1 watt.
Nếu bạn xác định rằng độ chiếu sáng lý tưởng để ăn tối là ánh sáng 137 watt, bạn sẽ mở các bóng đèn 128, 8 và 1 watt, như sau:
Với hệ thống này, thật dễ dàng ghi nhận lại một mức độ sáng chính xác để sau đó có thể dùng lại, hay truyền đạt cách tạo ra một độ sáng náo đó cho những người khác có cùng hệ thống công tắc đèn. Và vì cách chúng ta ghi lại thông tin nhị phân là phổ thông – số nhỏ ở bên phải, số lớn ở bên trái, luôn gấp đôi – bạn không cần phải viết ra các trị số công suất của bóng đèn. Bạn chỉ cần ghi lại mô hình các công tắc: mở, tắt, tắt, tắt, mở, tắt, tắt, mở. Với thông tin đó, một người bạn có thể tái tạo một cách chính xác ánh sáng lý tưởng 137 watt này. Miễn là mọi người có liên quan đều làm thật cẩn thận theo những gì được hướng dẫn thì thông điệp này có thể qua tay hàng triệu người và cuối cùng thì mọi người sẽ cùng có thông tin như nhau và đều có thể đạt được chính xác 137 watt ánh sáng.
Ðể ký pháp trên được ngắn gọn hơn nữa, bạn có thể ghi lại mỗi chữ “tắt” bằng một số 0, và mỗi chữ “mở” là số 1. Có nghĩa là thay vì viết “mở, tắt, tắt, tắt, mở, tắt, tắt, mở”, tức là mở (tính từ trái sang phải) các bóng đèn thứ nhất, thứ năm và thứ tám trong số tám bóng đèn và tắt tất cả bóng đèn còn lại, bạn có thể viết thông tin này, với ý nghĩa tương tự, là 1, 0, 0, 0, 1, 0, 0, 1 hay 10001001, một con số nhị phân. Trong trường hợp này, số nhị phân đó là 137. Bạn điện thoại cho bạn của mình và thông báo: “Tớ đã tìm được mức độ sáng hoàn hảo! ó là 10001001. Cứ thử xem.” Người bạn đó cũng tạo được hoàn toàn chính xác mức chiếu sáng đó bằng cách mở đèn cho mỗi số 1 và tắt đèn cho mỗi số 0.
Ðây có vẻ như là một cách thức phức tạp để mô tả độ sáng của một nguồn sáng, nhưng nó đã minh họa cho cách biểu diễn nhị phân này, nền tảng của mọi máy phát điện toán hiện đại.
Cách biểu diễn nhị phân đã làm cho việc lợi dụng các mạch điện để tạo nên những máy tính toán trở nên khả thi. Trong Ðệ Nhị Thế Chiến, một nhóm các nhà toán học được dẫn dắt bởi J. Presper Eckert và John Mauchly ở Trường Kỹ sư Ðiện Moore thuộc Ðại học Pennsylvania bắt tay triển khai một cỗ máy tính toán điện tử, đó chính lá chiếc Máy Tính Và Máy Tính Phân Số iện Tử (Electronic Numerical Integrator And Calculator – ENIAC). Chiếc máy này ra đời nhằm làm tăng tốc độ tính toán cho các sa bàn mục tiêu của pháo binh. ENIAC giống với một chiếc máy tính toán điện tử (Electronic Calculator) hơn là một chiếc máy điện toán (computer), nhưng thay vì biểu diễn một con số nhị phân bằng các nút tắt và mở trên những bánh xe như mọi chiếc máy tính cơ khí thường làm, chiếc máy này đã dùng các “công tắc” đèn chân không.
Những người lính được phía quân đội cử đến chỗ máy khổng lồ này phải đẩy những chiếc xe đẩy – thường dùng trong các cửa hàng thực phẩm – kẽo kẹt chất đầy bóng chân không vòng vèo xung quanh nó. Khi một bóng đèn bị cháy, máy ENIAC sẽ “hết xài”, và cuộc đua tìm kiếm và thay thế chiếc bóng bị cháy sẽ bắt đầu. Một lý do – có lẽ cũng đáng ngờ - giải thích cho câu hỏi sao những các bóng chân không đó lại phải được thường xuyên thay thế đến vậy là vì ánh sáng và sức nóng của chúng thu hút lũ bướm đêm, khiến chúng bay vào cỗ máy khổng lồ và gây chập mạch. Nếu lời giải thích này là chính xác, thì đây chính là nguồn gốc của thuật ngữ “bug”(con bọ), là cái tên chúng ta đặt cho những trục trặc nho nhỏ có thể gây tai họa cho cả phần cứng lẫn phần mềm của máy điện toán.
Khi tất cả bóng đèn chân không đều hoạt động, một đội ngũ kỹ sư có thể “dựng đầu ENIAC dậy” để giải một bài toán bằng một công việc thuộc dạng “lao động khổ sai”: cắm nối 6000 sợi dây cáp bằng tay. Ðể máy thực hiện được một chức năng khác, cũng nhóm kỹ sư đó lại phải tái cấu hình hệ thống cáp – một trăm lần là đúng một trăm lần phải thực hiện đúng như vậy. John von Neumann, một nhà khoa học sáng giá người Mỹ gốc Hungary được biết đến với việc phát triển lý thuyết trò chơi và những đóng góp của ông vào việc chế tạo vũ khí hạt nhân, cùng những đóng góp khác, đã được tín nhiệm cho vai trò đầu đàn trong việc hình dung ra một cách giải quyết vấn đề này. Ông đã tạo ra một khuôn mẫu mà tất cả máy điện toán kỹ thuật số hiện đại vẫn còn tuân theo. Khuôn mẫu đó, mà ngày nay được biết đến với cái tên “Kiến trúc von Neumann”, dựa trên những nguyên tắc mà ông đã trình bày rành mạch vào năm 1945 – bao gồm cả nguyên tắc cho rằng một chiếc máy điện toán có thể tránh được việc thay đổi hệ thống cáp bằng cách lưu trữ các lệnh hướng dẫn trong bộ nhớ của nó. Ngay khi những ý tưởng này được áp dụng vào thực tế, máy điện toán hiện đại đã ra đời.
Ngày nay, bộ óc của đa số máy điện toán chính là hậu duệ của bộ vi xử lý đã làm cho cả Paul Allen lẫn tôi phải choáng váng cực độ vào những năm 1970, và những máy điện toán cá nhân thường được đánh giá dựa trên bao nhiêu bit thông tin (tức là một lần tắt hay bật trong ví dụ về chiếu sáng trên) mà bộ vi xử lý của máy điện toán đó có thể xử lý trong cùng một lúc, hoặc bao nhiêu byte (một nhóm gồm tám bit) của bộ nhớ hay của hệ thống lưu trữ trên đĩa có trong máy điện toán đó. ENIAC nặng 30 tấn và chiếm hết một căn phòng có diện tích 9x15 m2. Trong ruột máy, những xung nhịp tính toán chạy đua chen giữa 1.500 rơle cơ điện và tuôn chảy qua hơn 18.000 bóng chân không. Mỗi lần bật công tắc lên ENIAC ngốn hết 150.000 watt năng lượng. Thế mà ENIAC lại chỉ lưu trữ được một dung lượng tương đương 80 ký tự thông tin.
Ðến đầu những năm 1960, hơn một thập kỷ sau khi phòng thí nghiệm Bell Labs phát hiện ra rằng chỉ một mảnh chất liệu silicon bé tí cũng có thể làm được công việc tương tự như một bóng chân không, các bóng bán dẫn (transistor) đã hất cẳng bóng chân không, các transistor đóng vai trò những công tắc điện tử, nhưng chúng chỉ cần dùng một lượng điện năng nhỏ hơn đáng kể để vận hành và vì vậy sinh ra ít nhiệt hơn nhiều. Và chúng cũng chiếm ít không gian hơn. Các mạch đa bán dẫn có thể được kết hợp trên một con chip (vi mạch) duy nhất, tạo nên một mạch tích hợp. Các vi mạch của máy điện toán mà ngày nay chúng ta sử dụng là những mạch tích hợp chứa một lượng tương đương hàng triệu transistor được gói ghém trên một mảnh silicon có diện tích chưa đầy 2,5 cm2.
Trong một bài báo đăng trên tờ Scientific American vào năm 1977, Bob Noyce, một trong những nhà sáng lập hãng Intel, đã so sánh một bộ vi xử lý trị giá 300 đôla với chiếc máy ENIAC, con voi mamut thời tiền sử nhiễm bệnh bướm đêm từ buổi ban mai của kỷ nguyên máy điện toán. Bộ vi xử lý bé xíu không chỉ mạnh mẽ hơn, mà như Noyce đã nhận xét, còn “nhanh hơn gấp hai mươi lần, có bộ nhớ lớn hơn, đáng tin cậy hơn hàng ngàn lần, tiêu thụ năng lượng chỉ bằng một bóng đèn tròn chứ không phải như một đầu máy xe lửa, chiếm một thể tích bằng 1/30000 lần và giái chỉ bằng 1/10000 lần. Có thể dễ dàng mua được ở cửa hàng gần nhà hay đặt mua qua đường bưu điện”.
Dĩ nhiên, đến nay thì dường như một bộ vi xử lý của năm 1977 cũng chẳng khác gì một món đồ chơi. Và nói đúng ra thì nhiều loại đồ chơi không mấy mắc tiền cũng đã sử dụng những vi mạch điện toán mạnh hơn những vi mạch của thời kỳ khai mào cho cuộc cách mạng máy vi tính trong thập kỷ 1970. Nhưng tất cả máy điện toán ngày nay, bất kể kích thước hay năng lượng, đều làm việc với những thông tin được lưu trữ dưới dạng những số nhị phân.
CD/CD-ROM
Đĩa nén là một phương tiện dùng để lưu trữ thông tin, xuất hiện dưới hai dạng chính: đĩa nén âm thanh (CD) và CD-ROM.
Dạng CD là đĩa nhạc k thuật số dùng trong các máy CD chuẩn đặt trong xe hơi hoặc ở nhà. ĩa được đọc nhờ một máy quét quang học dùng một nguồn sáng có cường độ cao, như tia laser, và các gương phẳng.
CD-ROM (đĩa nén, bộ nhớ chỉ đọc) lưu trữ dữ liệu cũng như âm nhạc. Nghĩa của từ chỉ đọc ở đây hàm ý sẽ không thông tin nào có thể được thêm vào ngoài thông tin của các nhà sản xuất. Người dùng chỉ có thể đọc những thông tin có sẵn trên đĩa.
Một số loại CD-ROM mở rộng có thể chứa cả âm nhạc nghe được qua máy đĩa và dữ liệu xem được trên máy PC.
Một đĩa CD có kích thước 5 inch (12,7 cm) có thể chứa hơn 600 MB dữ liệu, tương đương 650.000 trang văn bản hoặc 850 quyển tiểu thuyết hoặc 400 đĩa mềm
Những số nhị phân được dùng để lưu trữ văn bản trong một máy điện toán cá nhân, âm nhạc trong một CD, và tiền bạc trong mạng lưới máy rút tiền của một ngân hàng. Trước khi có thể được nhập vào một máy điện toán, thông tin phải được chuyển dạng thành những con số. Bạn có thể tưởng tượng là có riêng từng thiết bị làm cái công việc tắt mở các công tắc tương ứng với những con số nhị phân với mục đích kiểm soát dòng điện tử lưu chuyển. Nhưng những công tắc này, thường được làm bằng silicon, cực kỳ nhỏ bé và có thể được tắt mở bằng cách tích điện trong một khoảng thời gian vô cùng ngắn – để sinh ra văn bản trên màn hình máy điện toán cá nhân, phát ra âm nhạc từ một máy nghe đĩa CD, hay tạo ra những hướng dẫn cho một mát rút tiền để máy cấp ra một lượng tiền.
Ví dụ về công tắc điều khiển ánh sáng nói trên đã minh họa cho cách thức một con số bất ký có thể được biểu diễn dưới dạng mã nhị phân như thế nào. sau đây, các bạn sẽ biết cách thức văn bản có thể được thể hiện dưới dạng số nhị phân như thế nào. Theo quy ước, số 65 đại diện cho chữ cái A, số 66 cho chữ B, và cứ tiếp tục như vậy. Các chữ cái không không viết hoa bắt đầu bằng số 97. Trên máy điện toán, chữ A hoa, 65, sẽ trở thành 01000001. Chữ B, hoa, 66, trở thành 01000010. Một khoảng trắng được đại diện bởi số 32, hay 00100000. Như vậy, câu “Socrate ia a man” (Socrate là một con người) sẽ trở thành một chuỗi gồm 136 chữ số 1 và 0 như sau:
01010011 01101111 01100011 01110010 01100001 01110100
01100101 01110011 00100000 01101001 01110011 00100000
01100001 00100000 01101101 01100001 01101110
Ðể hiểu được cách số hóa những dạng thông tin khác như thế nào, chúng ta hãy xét một ví dụ khác của thông tin dạng tương tự (analog). Một đĩa nhạc nhựa vinyl chính là một đại diện cho dạng tương tự của các dao động âm thanh. Nó lưu trữ thông tin âm thanh trong các khe li ti chạy dọc theo các rãnh dài, có hình xoắn ốc trên bề mặt đĩa. Nếu bản nhạc có một đoạn có âm lượng lớn, các khe sẽ được khắc sâu hơn vào các rãnh, còn nếu có một nốt cao, các khe sẽ được dồn lại với nhau sít sao hơn. Các khe trên rãnh chính là cách biểu diễn tương tự của các dao động nguyên thủy – là các sóng âm thanh được thu bởi một micro. Khi kim của bàn xoay di chuyển xuống các rãnh, nó sẽ dao động cộng hưởng với các khe li ti kia. Dao động này, vẫn là một biểu hiện dạng tương tự của âm thanh dạng nguyên thủy, sẽ được khuếch đại và truyền đến loa để phát ra âm nhạc.
Cũng như mọi thiết bị dạng tương tự nào khác dùng trong việc lưu trữ thông tin, đĩa nhựa cũng có nhiều khuyết điểm. Bụi bặm, dấu tay hay những vết xước trên bề mặt đĩa có thể khiến kim dao động không chính xác, gây ra nhảy đĩa hoặc những tạp âm khác. Nếu đĩa hát không quay theo một vận tốc thích hợp, âm vực của bài nhạc sẽ không còn đúng nữa. Cứ mỗi lần nghe đĩa, kim lại mài mòn một phần những đường gờ tinh vi của các khe trên rãnh khiến cho chất lượng của việc tái tạo bài nhạc giảm dần. Nếu bạn thu một bài hát từ đĩa nhựa vào một băng cassette, bất kỳ khiếm khuyết nào của đĩa cũng được chuyển thường trực lên dải băng, và những khuyết điểm mới sẽ được thêm vào vì chính bản thân những máy thu băng thông thường cũng là những thiết bị sử dụng kỹ thuật tương tự. Như vậy chất lượng của thông tin sẽ mất dần sau mỗi lần thu âm lại hay phát lại.
Trên một đĩa CD, âm nhạc được lưu dưới dạng một chuỗi những số nhị phân, trong số đó mỗi bit (mỗi lần bật hay tắt) được đại diện, đã được sử dụng rộng rãi từ giữa những năm 1980, có hàng tỷ hốc như vậy. Ánh sáng lade được phản chiếu bên trong máy nghe đĩa CD – là một thiết bị kỹ thuật số - sẽ đọc từng hốc một để xác định là nó được chuyển đến vị trí số 0 hay số 1, để rồi sau đó lắp ghép những thông tin đó trở lại thành bài nhạc nguyên thủy bằng cách phát ra những tín hiệu điện tương ứng mà sau đó sẽ được loa chuyển thành dao động âm thanh. Âm thanh do đó sẽ không thay đổi sau mỗi lần nghe.
Thật tiên lợi khi có thể chuyển đổi mọi dạng thông tin thành những biểu diễn số hóa, nhưng số lượng bit có thể tăng lên nhanh chóng. Nếu có quá nhiều bit thông tin, lượng thông tin đó sẽ vượt quá sức chứa của bộ máy điện toán, hoặc ngốn mất nhiều thời gian để truyền tải giữa các máy điện toán, khả năng nén dữ liệu số hóa, lưu trữ hay truyền tải để rồi bung dữ liệu đó trở lại hình thức ban đầu lại quá hữu ích và ngày càng trở nên hữu ích hơn như vậy.
Tiếp theo sau, tôi sẽ nhanh gọn cho thấy bằng cách nào mà máy điện toán đã thực hiện thành công được những kỳ công đó. Chúng ta quay trở lại với Claude Shannon, chính là nhà toán học vào những năm 1930 đã nhận ra rằng thông tin có thể hiện dưới dạng nhị phân. Trong Thế Chiến Thứ Hai, Shannon bắt đầu phát triển phương pháp mô tả thông tin theo toán học và đã đặt nền móng cho một lĩnh vực mà sau này được biết đến dưới cái tên là lý thuyết thông tin. Ông định nghĩa thông tin là việc giảm bớt sự không chắc chắn. Theo định nghĩa này, nếu bạn không biết rõ là thứ mấy và ai đó cho bạn biết là thứ bảy, bạn đã được cung cấp thông tin – sự không chắc chắn của bạn đã giảm đi.
Các nghiên cứu của Shannon về lý thuyết thông tin cuối cùng đã dẫn đến những bước đột phá khác. Một trong số đó là việc nén dữ liệu sao cho hiệu quả, một yếu tố sống còn cho cả việc tính toán lẫn truyền thông. Khi trực tiếp nghe những điều trình bày của Shannon, chúng ta sẽ nhận thấy phương pháp nén dữ liệu của ông hết sức rõ ràng: những phần nào trong dữ liệu không cung cấp những thông tin độc đáo sẽ được coi là dữ liệu thừa và có thể được loại bỏ. Những người chuyên viết tiêu đề đã thẳng tay loại bỏ những từ không cần thiết, và những người phải trả tiền cho từng chữ khi gửi điện tín hay đang quảng cáo rao vặt cũng sẽ làm như vậy. Một ví dụ về dữ liệu thừa đã được Shannon chỉ ra là chữ cái u. Trong tiếng Anh, chữ u sẽ trở nên thừa mỗi khi chữ này đi chung với chữ q. Bạn biết chắc là u sẽ theo sau mỗi chữ q, vì vậy chữ u có thể được bỏ ra khỏi một thông điệp mà không ảnh hưởng đến ý nghĩa.
Trong suốt nửa thế kỷ kể từ sau khi Shannon phát minh lý thuyết thông tin và nghĩ ra một trong những lược đồ nén đầu tiên, các kỹ sư đã sáng chế ra biết bao phương cách tuyệt diệu để làm bốc hơi những yếu tố thừa ra khỏi thông tin. Chẳng còn gì là lạ khi kích thước của một tập tin văn bản có thể được giảm chỉ còn khoảng phân nửa nhờ việc nén. Ðiều này cho phép tập tin được chuyển nhanh gấp đôi.
Các nguyên tắc của Shannon cũng đã được áp dụng cho việc nén các dữ liệu âm thanh và hình ảnh. Bạn không còn nghe lạ tai khi biết một hình ảnh số hóa được nén chỉ còn 5% kích thước ban đầu sau khi các thông tin dư thừa đã bị loại trừ. Nếu 12 pixel (những picture element-phần tử ảnh bé tí, còn gọi là dot (dấu chấm), trên màn hình) ở cùng một hàng có cùng một màu, sẽ chỉ cần một lượng bit thông tin ít hơn rất nhiều để mô tả màu sắc này một lần duy nhất và cho biết rằng màu sắc này sẽ được lặp lại 12 lần, so với việc phải mô tả cùng một màu sắc đó 12 lần. Những phim video thường chứa rất nhiều thông tin dư thừa. Việc nén được hoàn thành bằng cách lưu trữ thông tin về sự thay đổi – hay không đổi – của màu sắc qua từng khung hình, trong khi chỉ cần lưu trữ thông tin về chính màu sắc đó một lần sau vài khung hình.
Các tao sợi mảnh mai – làm bằng thủy tinh hoặc các chất liệu trong suốt khác – có thể sỏ lọt qua một lỗ kim thâu
Công nghệ quang sợi (fiber optics) là một phương pháp truyền tia sáng – có thể được điều biến để tải thông tin – dọc theo các sợi quang học. Các sợi quang học – là những sợi mỏng manh làm bằng thủy tinh hoặc bằng những chất liệu trong suốt khác – có đến hằng chục hoặc hằng trăm tao sợi trong một dây cáp quang. Một kênh truyền quang sợi có thể tải lượng thông tin nhiều hơn đáng kể so với hầu hết phương tiện chuyển tải khác. Cáp quang cùng các loại dây cáp và phương tiện nối kết vô tuyến khác có thể được ví như là chất “nhựa đường” giúp lưu thông nhanh chóng trên đường xa lộ thông tin.
Internet đã tận dụng khả năng nén, đáng chú ý là trong việc truyền những hình ảnh, âm thanh và phim trên Mạng Rộng Toàn Cầu (World Wide Web). Nhưng thực ra nếu chỉ nén thôi thì không thể đáp ứng được nhu cầu bùng nổ về dung lượng truyền thông. Chúng ta cần di chuyển lượng bit thông tin ngày nay càng tăng từ nơi này đến nơi khác. Những bit thông tin chu du trong không trung, chui qua những dây đồng, qua các sợi cáp quang. Cáp quang là loại dây cáp làm bằng thủy tinh hay chất dẻo, phẳng lì và tinh khiết đến độ, nếu bạn nhìn xuyên qua một bức tường dày hơn 100 cây số làm bằng chất liệu này, bạn vẫn có thể nhìn thấy một ngọn nến đang cháy leo lét ở phía bên kia bứa tường. Các tín hiệu nhị phân dưới dạng ánh sáng đã được điều biến sẽ được chuyển tải trong những khoảng cách xa xôi nhờ vào các sợi quang học này. Thật sai lầm khi cho rằng một tín hiệu khi truyền qua dây cáp quang sẽ nhanh hơn khi truyền qua dây đồng; cả hai đều được truyền đi với vận tốc ánh sáng. Nhưng ưu điểm vượt bậc mà dây cáp quang mang đến so với dây đồng chính là bandwith (tạm dịch băng thông). Bandwidth là tiêu chuẩn để đánh giá số bit có thể chuyển qua một mạch điện trong một giây. Bạn hình dung điều này thật sự giống với một xa lộ. Một xa lộ nối liền các tiểu bang ở Mỹ gồm 8 làn xe sẽ có nhiều không gian dành cho các phương tiện lưu thông hơn là một con đường làng chật hẹp. Càng có nhiều làn xe thì có nghĩa là bandwidth càng lớn, và như vậy cũng có nghĩa là lưu lượng xe cộ sẽ nhiều hơn hoặc việc giao thông sẽ nhanh chóng hơn. Những dây cáp có bandwidth hạn chế, dùng để chuyển văn bản hay tiếng nói, được là những dải băng hẹp (narrowband). Những loại cáp có dung lượng lớn hơn, chuyển những hình ảnh tĩnh và một ít hình ảnh động, có “dung lượng của một dải băng trung (midband capacity)”. Những loại cáp có bandwidth cao, có thể chuyển tải nhiều tín hiệu bao gồm cả âm thanh lẫn hình ảnh động, sẽ được xem là có “dung lượng của một dải băng rộng (broadband capacity)”.
Trước khi một mạng thông tin tương tác dải băng rộng lớn thành hiện thực, cáp quang phải được đưa vào sử dụng thêm ở nhiều khu vực dân cư nữa, còn hiệu năng hoạt động và dung lượng của những vi mạch phải tiếp tục được cải thiện để việc nén dữ liệu ngày càng hoàn thiện và rẻ tiền hơn nữa. Tuy việc lắp đặt các đường dây cáp quang sẽ vẫn còn khá tốn kém, nhưng các vi mạch sẽ luôn luôn tốt hơn và rẻ hơn.
Vào năm 1965, Gordon Moore, người sau cùng với Bob Noyce là hai đồng sáng lập viên của hãng Intel, đã dự đoán rằng dung lượng của một vi mạch máy điện toán cứ sau mỗi năm sẽ tăng gấp đôi. Moore đã dựa trên tỷ lệ giá cả/hiệu suất của các vi mạch máy điện toán – nghĩa là hiệu suất đạt được trên mỗi đôla – trong khoảng ba năm trước đó và dự phòng ý kiến như vậy. Chính Moore cũng không tin rằng tốc độ cải tiến này sẽ tồn tại lâu dài. Nhưng mười năm sau, lời tiên đoán của ông đã được minh chứng, và Moore lại dự đoán tiếp rằng dung lượng vi mạch cứ mỗi hai năm lại tăng gấp đôi. Cho đến nay những dự đoán của Moore vẫn còn đứng vững và các kỹ sư hiện đang gọi vận tốc trung bình để tăng dung lượng – gấp đôi sau mỗi 18 tháng – là ịnh luật Moore.
Trong đời thường hầu như chúng ta chưa qua điều gì khả dĩ giúp mình nhận thức ý nghĩa của việc một con số được gấp đôi lên rất nhiều lần – tăng theo cấp số nhân. Truyền thuyết sau đây đã giải thích điều này rất rõ ràng.
Sự tăng trưởng đều đặn sức mạnh của bộ vi xử lý cho Gordon Moore đúc kết thành ịnh luật Moore vào năm 1964. ịnh luật Moore ban đầu cho rằng số lượng transistor trong mỗi vi mạch sẽ tăng gấp đôi cứ sau mỗi 2 năm. Nhưng luật này phải tự điều chỉnh để thích hợp với bước phát triển nhanh chóng của vi mạch: giờ đây định luật này phát biểu rằng số lượng transistor sẽ tăng gấp đôi trong vòng 12 cho đến 18 tháng và gấp bốn lần cứ sau mỗi ba năm.
Gordon E. Moore đồng sáng lập công ty Intel vào tháng 7/1968 và là Phó chủ tịch điều hành của công ty Intel cho đến năm 1975 khi ông nhận chức Chủ tịch và TG công ty này. Tháng 4/1979, Tiến sĩ Moore trở thành Chủ tịch Hội đồng giám đốc và là TG cho đến tháng 4/1987. ến tháng 12/1988, TS Moore được chọn làm Chủ tịch Hiệp hội ngành Công nghiệp bán dẫn.
TS Moore sinh tại San Francisco, California, vào ngày 3/1/1929. Ông tốt nghiệp H California ở Berkeley với bằng Cử nhân Hóa năm 1950. Ông nhận bằng Tiến sĩ Hóa học và Vật lý tại Viện Công nghệ California năm 1954. TS Moore tham gia trong ban k thuật tại phòng thí nghiệm vật lý ứng dụng ở H Johns Hopkins năm 1953, nơi ông tiến hành những nghiên cứu cơ bản về ngành vật lý hóa học. Một thời gian ngắn sau, ông tham gia trong phòng thí nghiệm bán dẫn Shockley sau khi phòng này được thành lập năm 1956 ở Palo Alto, California, nghiên cứu công nghệ xử lý chất bán dẫn cùng với William Shockley, đồng phát minh ra transistor.
TS Moore đồng sáng lập công ty chất bán dẫn Fairchild ở Mountain View, Calif- ornia, năm 1957, giữ chức G quản lý Phòng Kiến tạo cho tới năm 1959, khi ông trở thành Giám đốc bộ phận Nghiên cứu và Phát triển. Trong thời gian này Fairchild đã sản xuất thành công mạch tích hợp thương mại đầu tiên.
Tháng 7/1968, TS Moore đồng sáng lập Intel Corporation để phát triển và sản xuất mạch tích hợp LSI, bắt đầu bằng bộ nhớ bán dẫn. Intel tiếp tục sản xuất nhiều sản phẩm khác dựa trên công nghệ LSI, trong đó có bộ vi xử lý đầu tiên của thế giới.
Vua Ấn Ðộ Shirham đã rất hài lòng khi một số những quan thượng thư của mình sáng tạo ra trò chơi cờ vua nên đã yêu cầu người đó nêu lên bất kỳ phần thưởng nào ông thích.
“Tâu Bệ Hạ”, vị cận thần nói, “thần mong rằng ngài sẽ ban cho thần một hạt lúa mì cho ô đầu tiên của bàn cờ, hai hạt cho ô thứ hai, bốn hạt cho ô thứ ba, và cứ như thế mỗi lần số lượng hạt lại tăng gấp đôi cho đến khi đủ 64 ô cờ”. Nhà vua cảm động bởi sự khiêm tốn của lời yêu cầu liền ra lệnh mang đến một bao lúa mì.
Nhà vua ra lệnh phải đếm đúng số hạt lúa mì như đã hứa và đặt ngay trên bàn cờ. Một hạt lúa mì nho nhỏ được đặt vào ô đầu tiên của hàng đầu tiên. Trong ô thứ hai là hai hạt lúa mì. Trong ô thứ ba và bốn – rồi đến những ô kế tiếp là 8, 16, 32, 64, 128. Ðến ô thứ tám ở cuối hàng đầu tiên, viên quan hậu cần của vua Shirham đã đếm ra tổng cộng là 255 hạt.
Có lẽ vua vẫn chẳng biểu lộ sự quan tâm gì. Có thể chỉ một ít lúa mì nữa sẽ được đặt thêm lên bàn cờ, nhiều hơn con số ông ta nghĩ, nhưng tuyệt nhiên chưa có điều gì ngạc nhiên xảy ra. Nếu ta giả sử rằng phải mất một giây để đếm mỗi hạt, thì cho đến lúc đó cũng mới chỉ mất bốn phút để đếm. Nếu số hạt lúa mì của một hàng chỉ phải đếm trong vòng bốn phút, vậy bạn hãy thử đoán xem sẽ mất bao lâu để đếm số hạt lúa mì trên toàn bộ 64 ô của bàn cờ. Bốn giờ? Bốn ngày? Hay bốn năm?
Ðến lúc lượng hạt lúa mì ở hàng thứ hai đã được đếm xong, chỉ riêng trên ô thứ mười sáu thôi, viên hậu cần đã phải mất gần 18 tiếng đồng hồ để đếm cho xong 65535 hạt. Và trước khi đếm xong hàng thứ ba trong số tám hàng trên bàn cờ, đã phải mất đến 97 ngày để đếm số lượng 8,4 triệu hạt chỉ riêng trong ô thứ hai mươi bốn đó thôi. Thế mà vẫn còn đến những bốn mươi ô trống.
Không có gì sai khi kết luận rằng vị vua phải nuốt lời hứa với viên quan thượng thư kia. Ðể hoàn tất yêu cầu của vị quan này – đếm cho đúng và đủ số hạt lúa mì vào tất cả 64 ô cờ - sẽ phải cần đến 18.446.744.073.709.551.615 hạt lúa mì và 584 tỷ năm để đếm. Mà các bạn có biết không, tuổi ước tính hiện nay của trái dất chúng ta chỉ vào khoảng 4,5 tỷ năm! Theo như nhiều dị bản của câu chuyện này, đến một lúc nào đó trong quá trình đếm vua Shirham chợt nhận ra rằng mình đã bị chơi khăm và đã xuống lệnh chém đầu viên thượng thư thông minh kia.
Hiện tượng tăng theo cấp số nhân, ngay cả khi đã được giải thích, dường như vẫn giống một trò đùa.
Ðịnh luật Moore rất có thể sẽ vẫn đúng đắn trong hai mươi năm nữa. nếu quả thật như vậy, những công việc tính toán mà ngày hôm nay ta phải mất cả ngày sẽ được giải quyết trên một vạn lần nhanh hơn, và như vậy sẽ mất không đến mười giây.
Các phòng thí nghiệm đã đưa vào sử dụng những bán dẫn “đạn đạo” có thời gian chuyển đổi được tính bằng femtosecond. Nghĩa là bằng 1/1.000.000.000.000.000 (một phần triệu tỷ) của một giây, tức là nhanh gấp 10 triệu lần thời gian chuyển đổi của các transistor đang dùng trong các bộ vi xử lý hiện nay. Vướng mắt “nho nhỏ” là phải giảm kích thước hệ thống mạch điện trên vi mạch và dòng lưu chuyển sao cho các điện tử khi chuyển động sẽ không đụng vào vật gì khác, kể cả đụng phải nhau. Giai đoạn kế tiếp là “bán dẫn đơn điện tử” (singleelectron transistor), trong đó một bit thông tin đơn lẻ sẽ được đại diện chỉ bằng một electron duy nhất. Ðây sẽ là biện pháp tối ưu đối với máy điện toán năng lượng thấp, ít nhất là căn cứ trên những hiểu biết vật lý hiện thời. Ðể tận dụng lợi thế tốc độ không tưởng có được ở cấp độ phân tử này, máy điện toán sẽ phải rất nhỏ, thậm chí là siêu nhỏ. Chúng ta đã hiểu được tường tận ngành khoa học sẽ cho phép ta kiến tạo những máy điện toán siêu nhanh này. Vấn đề còn lại là một cuộc đột phá về kỹ thuật, nhưng trên thực tế thì điều này thường sẽ xuất hiện nhanh thôi.
Khả năng lưu trữ cả các bit thông tin đó cũng sẽ không là vấn đề phải quan ngại. Vào mùa xuân năm 1983, IBM tung ra sản phẩm máy điện toán PC/XT của mình, chiếc máy điện toán cá nhân đầu tiên của công ty này có cài đặt đĩa cứng ở bên trong. Ðĩa này đóng vai trò là một thiết bị lưu trữ nội tại, và có thể chứa được 10 megabyte (MB), gọi tắt là “meg”, thông tin, tức là khoảng 10 triệu ký tự, hay 80 triệu bit. Nếu khách hàng muốn thêm dung lượng 10MB này vào máy điện toán hiện có của mình thì cũng được thôi, nhưng mọi thứ đều có giá của nó. IBM chào mời một bộ đĩa hoàn chỉnh trị giá 3.000 đô la bao gồm cả một thiết bị cung cấp điện năng rời để mở rộng năng lượng lưu trữ của máy. Tính ra mỗi megabyte đáng giá 300 đô la. Nhờ tính chất tăng trưởng theo cấp số nhân, theo định luật Moore, mà đến mùa hè năm 1996 các đĩa cứng trong máy điện toán cá nhân có dung lượng 1,6 gigabyte (tức là 1,6 tỷ ký tự thông tin) được bán ra với giá 225 đô la. Tức là mỗi megabyte chỉ có 0,14 đôla! (ND: Hiện nay (9/2000), giá bình quân là 0,8 đô la/100 meg). Và chúng ta đang trông đợi một tiến bộ mới mẻ mang tên bộ nhớ tự ghi (holographic memory) có thể giữ đến hàng terabyte (ngàn tỷ) ký tự trong một thể tích chưa đến 2,5 cm3. Với một dung lượng như vậy, một bộ nhớ tự ghi chỉ có kích thước bằng nắm tay của bạn cũng có thể chứa toàn bộ nội dung của Thư viện Quốc hội Mỹ.
Một khi đã được số hóa, công nghệ truyền thông chắc chắn cũng hưởng được nhiều lợi ích cũng từ những tiến bộ theo cấp số nhân đó, cụ thể là một máy điện toán xách tay chỉ trị giá 2.000 đô la ngày nay lại mạnh mẽ hơn cả chiếc máy điện toán đồ sộ (mainframe) của IBM trị giá 10 triệu đô la của hai mươi nắm trước.
Ðến một thời điểm nào đó, chỉ với một đường dây cáp dẫn kỹ thuật số của gia đình đó. Ðường dây dẫn đó có thể là cáp quang, loại hiện đang được dùng để truyền tải những cuộc gọi điện thoại đường dài; hay là cáp đồng trục, loại cáp hiện đang truyền dẫn những tín hiệu truyền hình cáp; hoặc cũng có thể là loại cáp “xoắn đôi” đơn giản đang nối các máy điện thoại trong mỗi gia đình với mạng điện thoại nội hạt. Thậm chí cũng có thể mọi nhà sẽ sử dụng nối kết không dây (vô tuyến). Nếu các bit dữ liệu được truyền vào nhà được diễn dịch là giọng nói, máy điện thoại sẽ đổ chuông. Nếu đó là những hình ảnh video, chúng sẽ hiện lên trên màn ảnh của TV hay máy PC. Còn nếu là tin tức, chúng sẽ xuất hiện dưới dạng văn bản và những hình ảnh trên một màn hình.
Những gì mà mối kết duy nhất đến mạng đó chuyển tải chắc chắn sẽ không chỉ có những cuộc gọi điện thoại, phim ảnh hay tin tức. Nhưng khi nghĩ rằng một người sống ở Thời kỳ Ðồ Ðá đang sử dụng một con dao thô sơ thì làm sao lại có thể hình dung được sẽ xuất hiện các tuyệt tác nghệ thuật như ở thời Phục Hưng. Chúng ta hiện nay cũng không khác gì con người tiền sử kia, cũng không thể nào tưởng tượng ra được những gì mà con đường xa lộ thông tin dải rộng này sẽ gồng gánh trong vòng 20 năm nữa. Chỉ khi liên hệ đến năng lượng tiềm tàng của mạng Internet may ra chúng ta phần nào có thể hiểu được.
(Trích trong tác phẩm “The Road Ahead” của Bill Gates, Nathan Myhrvold và Peter Rinearson)
Ông ta đang kiểm soát cái mà, nếu thiếu nó, mọi máy tính cá nhân (PC) trên thế gian này sẽ chẳng khác gì một đống sắt vụn. Nhưng không như những lời đồn đại, ông chẳng là người theo chính phái và cũng chẳng phải thuộc phe hắc đạo.
Nếu xét ông dựa trên tính sáng tạo và ý tưởng thì Bill Gates chẳng phải là dân Mỹ chính hiệu. Ông nổi tiếng khắp nơi chỉ vì ông là sếp kiêm đồng sáng lập viên của công ty Microsoft, là một người giàu nứt đó đổ vách, nhất thế giới, và sự nghiệp của ông chuyển tải một thông điệp: khôn ngoan chẳng lọ “theo đuổi”. Cứ để mặc cho ai đó có đầu óc cải cách, canh tân lãnh ấn tiên phong, hứng chịu cảnh da ngựa bọc thây; với tớ, tớ xin chậm bước và làm kẻ “theo đóm” thôi. Biết đâu, có thể tớ chẳng “ăn tàn” mà sẽ “ăn trọn” khi mà chiến lợi phẩm đã được các ngài tiên phong bày sẵn, để lại phía sau.
Gates chính là một nghệ sĩ Bing Crosby trong nền công nghệ Mỹ quốc. Vay mượn, cóp nhặt đây đó, mỗi nơi một chút giai điệu, kế đó gia công, chế biến lại tất cả và rồi “úm ba la! Hô biến” là ra những sản phẩm thành công vang dội – nhờ vào “các chiến tích hùng anh” trong việc đóng góp, bao bì lại là bằng vẻ “dịu dàng chết người” của kẻ mạnh. Cũng phải thừa nhận rằng, ông ta, (nói theo kiểu ngoại giao), là một doanh nhân thành đạt và “khó bảo” hơn người, nhưng hình ảnh Bill Gates trong trí tưởng tượng của chúng ta đã bị thổi phồng đến mức phi lý.