Nạn lụt thông tin

PHẠM VĂN THIỀU dịch 20/12/2011 0:12 GMT+7

TTCT - Theo James Gleick, tác động của thông tin đến hoạt động của con người diễn ra theo ba giai đoạn: trong suốt hàng ngàn năm con người tạo ra thông tin và trao đổi mà không hề có khái niệm về chuyện đo lường nó, thứ hai là lý thuyết thông tin được Shannon lần đầu tiên định nghĩa, và thứ ba là nạn lụt thông tin mà chúng ta đang sống trong đó.

Kỳ 1: Những chiếc trống biết nói

Phóng to
Từ định luật của Gordon Moore khai sinh những “kho nhớ” khổng lồ - Ảnh: clubic.com

Nạn lụt này bắt đầu rất lặng lẽ. Sự kiện làm cho nó trở nên được nhìn thấy rõ ràng xảy ra vào năm 1965, khi Gordon Moore - vốn là một kỹ sư điện, người sáng lập Công ty Intel Corporation - phát biểu định luật mang tên ông.

Những “kho nhớ” khổng lồ

Tốc độ tăng trưởng của Wikipedia đã vượt quá những ước mơ táo bạo nhất của Jimmy Wales. Trong vòng 10 năm, nó đã trở thành một kho lưu trữ thông tin lớn nhất trên hành tinh và cũng là chiến trường của những quan điểm xung đột ầm ĩ nhất. Và điều này cũng minh họa cho một định luật của Shannon về truyền thông tin cậy. Định luật này nói rằng sự truyền chính xác thông tin là khả dĩ trong một hệ truyền thông có mức độ nhiễu cao. Ngay cả trong những hệ nhiễu nhất, các lỗi đều có thể được sửa một cách tin cậy và thông tin chính xác được truyền đi, với điều kiện sự truyền phải có đủ độ dôi dư. Đó cũng chính là cách mà Wikipedia vận hành.

Định luật Moore phát biểu rằng cứ sau mỗi 18 tháng thì giá của các linh kiện giảm và số lượng của chúng tăng với hệ số 2. Điều này hàm ý rằng giá sẽ giảm và số lượng sẽ tăng với hệ số 100 cứ sau mỗi chục năm. Tiên đoán của Moore hóa ra là chính xác một cách đáng ngạc nhiên trong suốt 45 năm kể từ khi nó được phát biểu. Trong 45 năm đó, giá đã giảm và số lượng đã tăng với hệ số 1 tỉ (109). Mười lũy thừa chín là thừa sức để biến một lạch nước nhỏ thành một nạn lụt!

Gordon Moore làm việc trong doanh nghiệp phần cứng, nghĩa là làm ra những linh kiện cứng cho các máy móc điện tử, và ông phát biểu định luật của mình với tư cách là một định luật về sự tăng trưởng của phần cứng. Nhưng định luật này cũng áp dụng được cho cả thông tin mà phần cứng được thiết kế để thể hiện nó. Mục đích của phần cứng là để lưu trữ và xử lý thông tin. Sự lưu trữ thông tin được gọi là nhớ, còn sự xử lý thông tin được gọi là tính (computing).

Hệ quả của định luật Moore áp dụng cho thông tin là giá của nhớ và tính giảm, còn lượng nhớ và tính khả dụng lại tăng với cùng một thừa số là 100 trong mỗi 10 năm. Nghĩa là nạn lụt của phần cứng đã trở thành một nạn lụt của thông tin.

Năm 1949, sau khi công bố những quy tắc của lý thuyết thông tin, Claude Shannon lập một bảng liệt kê các kho nhớ tồn tại cho tới lúc đó. Kho nhớ lớn nhất trong bảng này là Thư viện Quốc hội Mỹ, mà ông đánh giá là chứa được cỡ 100 nghìn tỉ bit thông tin. Vào thời ấy có thể nói con số đó xấp xỉ với tổng tri thức mà con người đã ghi chép được. Ngày hôm nay, một ổ đĩa nhớ lưu trữ được cũng lượng đó thông tin chỉ nặng cỡ 1kg và có thể mua với giá 1.000 đôla.

Một trong số những hoạt động sáng tạo nhờ nạn lụt này chính là từ điển Wikipedia trên mạng, được Jimmy Wales khởi thảo 10 năm trước. Điều kinh ngạc là không có nhiều người tin tưởng vào Wikipedia, nhưng mọi người lại vẫn sử dụng nó. Không tin và sử dụng có hiệu quả lại là chuyện khác. Wikipedia là một kho thông tin nguồn mở tối hậu. Nó chứa các mục từ viết bằng 262 ngôn ngữ do hàng triệu tác giả biên soạn.

Thông tin chứa trong Wikipedia không hoàn toàn tin cậy, nhưng lại chính xác một cách đáng ngạc nhiên. Nó thường không tin cậy là do nhiều người biên soạn kém hiểu biết hoặc thiếu cẩn trọng, nhưng chính xác là bởi vì các mục từ được biên tập và hiệu chỉnh bởi các độc giả có hiểu biết tốt hơn.

Phóng to
Jimmy Wales đã phát triển kho dữ liệu khổng lồ là Wikipedia - Ảnh: wikipedia.org

Điều bí ẩn vẫn bao la

Nạn lụt thông tin cũng mang lại những lợi ích to lớn đối với khoa học. Trẻ em thường được dạy ở trường rằng khoa học là một tập hợp những chân lý đã được xác lập một cách vững chắc. Thực tế, khoa học không phải là một tập hợp các chân lý, mà là sự khám phá liên tục những điều bí ẩn. Dù có tiến hành khám phá ở bất kỳ đâu xung quanh chúng ta cũng đều thấy nhan nhản những điều bí ẩn.

Hành tinh của chúng ta được bao phủ bởi các lục địa và đại dương mà nguồn gốc của chúng chúng ta còn chưa giải thích được. Bầu khí quyển của chúng ta thường xuyên bị khuấy động bởi những nhiễu động còn được hiểu biết rất ít, mà chúng ta gọi là thời tiết và khí hậu. Trong vũ trụ, lượng vật chất nhìn thấy được chiếm một phần nhỏ hơn rất nhiều so với vật chất tối không nhìn thấy được, đó là thứ vật chất mà chúng ta còn hoàn toàn mù tịt chưa có hiểu biết gì.

Nguồn gốc của sự sống cũng là một thứ còn hoàn toàn bí ẩn, ấy là chưa nói tới sự tồn tại của ý thức con người. Chúng ta cũng còn chưa có một ý niệm rõ ràng về chuyện những quá trình phóng điện xảy ra trong các tế bào thần kinh ở não chúng ta có liên quan như thế nào với những tình cảm, ước vọng và hành động của chúng ta.

Sự tăng nhanh chóng của nạn lụt thông tin trong 10 năm trở lại đây đã làm cho việc biên soạn Wikipedia trở nên khả thi và cũng chính nạn lụt đó đã làm khoa học của thế kỷ 21 trở nên có thể phát triển được. Khoa học thế kỷ 21 bị ngự trị bởi những kho thông tin khổng lồ mà chúng ta thường gọi là các cơ sở dữ liệu.

Ví dụ về một cơ sở dữ liệu của thế kỷ 21 đó là tập hợp các trình tự hệ gen của các cơ thể sống thuộc tất cả các loài, từ các vi sinh vật cho tới con người. Mỗi một hệ gen chứa một thông tin di truyền hoàn chỉnh tạo nên hình hài của sinh vật chứa hệ gen đó. Cơ sở dữ liệu hệ gen đang tăng trưởng rất nhanh chóng và khả dụng cho tất cả các nhà khoa học trên khắp thế giới tha hồ khám phá. Nguồn gốc của cơ sở này có thể coi là bắt nguồn từ năm 1939 khi Shannon viết luận án tiến sĩ với nhan đề “Một đại số của di truyền học lý thuyết”.

Khi đó Shannon là nghiên cứu sinh thuộc khoa toán của Học viện Công nghệ Massachussets (MIT). Ông đã lờ mờ ý thức được về sự thể hiện vật lý của thông tin di truyền. Mười bốn năm sau, thể hiện vật lý đích thực của hệ gen chính là cấu trúc chuỗi xoắn kép của phân tử ADN do Francis Crick và James Watson phát hiện. Năm 1939 Shannon đã hiểu được rằng cơ sở của di truyền phải là thông tin, và thông tin đó phải được mã hóa dưới dạng một đại số trừu tượng nào đó độc lập với thể hiện vật lý của nó.

Do không có hiểu biết gì về chuỗi xoắn kép nên Shannon không thể có hi vọng đoán ra được cấu trúc chi tiết của mã di truyền. Ông chỉ có thể hình dung được rằng trong một tương lai xa, thông tin di truyền sẽ được giải mã và thu thập thành một cơ sở dữ liệu khổng lồ, một cơ sở dữ liệu có thể xác định toàn bộ sự phong phú đa dạng của các sinh vật sống.

Thực tế, chỉ mất có 60 năm, ước mơ của ông đã trở thành hiện thực.

Trong thế kỷ 20, hệ gen của người và các loài khác đã được cần mẫn giải mã và được dịch thành những trình tự chữ cái được lưu trong các bộ nhớ máy tính. Với thời gian, việc giải mã và dịch trở nên rẻ hơn và nhanh hơn, giá giảm và tốc độ tăng theo đúng định luật Moore. Hệ gen đầu tiên của con người phải giải mã mất 15 năm với giá 1 tỉ đôla. Giờ đây hệ gen của một người có thể giải mã trong ít tuần với giá vài ngàn đôla.

Vào khoảng năm 2000 người ta đã đạt tới điểm ngoặt khi mà việc tạo ra thông tin di truyền còn rẻ hơn là hiểu được nó. Giờ đây ta có thể chuyển một mẩu ADN của người qua máy và nhanh chóng đọc được thông tin di truyền, nhưng không thể đọc được ý nghĩa của thông tin đó. Và chúng ta sẽ hoàn toàn không thể hiểu được thông tin chừng nào chúng ta chưa hiểu được những quá trình phát triển của bào thai mà ADN đã chỉ huy tạo ra chúng ta đúng như chúng ta trên thực tế.

Sự tăng trưởng có tính cách bùng nổ của thông tin trong xã hội chúng ta là một bộ phận của sự tăng trưởng chậm hơn của những cấu trúc có trật tự trong sự tiến hóa của sự sống. Sự sống đã có cả hàng tỉ năm tiến hóa với các cơ thể và các hệ sinh thái thể hiện sự tăng trưởng của thông tin. Mà quá trình tiến hóa của sự sống lại là một bộ phận của sự tiến hóa của vũ trụ. Vũ trụ cũng tiến hóa với những lượng tăng của thông tin được thể hiện ở những cấu trúc có trật tự, như các thiên hà và các vì sao cũng như các hệ hành tinh.

Sự tăng trưởng nhìn thấy được của các cấu trúc có trật tự trong vũ trụ dường như mâu thuẫn với các nhà khoa học và triết học thế kỷ 19 với học thuyết chết nhiệt của họ.

Huân tước Kelvin, một trong số những nhà vật lý hàng đầu của thời gian đó, đã đưa ra “giáo lý” về sự chết nhiệt cho rằng sự truyền nhiệt từ những vật nóng hơn sang những vật lạnh hơn sẽ làm cho sự chênh lệch nhiệt độ ở khắp nơi giảm xuống cho tới khi toàn bộ các nhiệt độ cuối cùng sẽ trở nên bằng nhau. Mà sự sống lại cần tới sự chênh lệch nhiệt độ, để tránh khỏi chết ngạt bởi nhiệt thải của nó. Và như vậy thì sự sống sẽ biến mất.

Trong lĩnh vực thiên văn, khi nhiệt chảy từ vật nóng hơn sang vật lạnh hơn thì vật nóng sẽ trở nên nóng hơn và vật lạnh sẽ trở nên lạnh hơn. Kết quả là hiệu nhiệt độ trong vũ trụ thiên văn có xu hướng tăng chứ không phải giảm theo thời gian. Sẽ không có trạng thái cuối cùng với nhiệt độ đồng đều, và như vậy có nghĩa là sẽ không có sự chết nhiệt.

Thông tin và trật tự có thể còn tiếp tục tăng hàng tỉ năm nữa trong tương lai như chúng rõ ràng đã tăng trong quá khứ.

Bình luận
    Viết bình luận...