ADN và cuộc cách mạng công nghệ lưu trữ

  • HOA KIM
  • 25.04.2017, 14:18

TTCT - Khi ngành công nghệ tin học ngày càng tiến gần tới ngưỡng không thể thu nhỏ các thiết bị lưu trữ vật lý hơn nữa, người ta bắt đầu tìm kiếm một phương thức lưu trữ mới bên trong những đoạn mã sinh học làm nên sự sống muôn loài - ADN (cách viết khác là DNA).

Dùng ADN làm công cụ lưu trữ

Trí khôn nhân loại 
trong hộp đựng giày

ADN tự bản thân nó đã mang chức năng tự nhiên là lưu trữ và truyền đạt thông tin di truyền. Một phân tử ADN mã hóa những thông tin này bằng cách sắp xếp 4 đơn phân nuclêôtit là Adenine, Cytosine, Guanine và Thymine (A, C, G, T) theo những trình tự khác nhau, tức sử dụng bộ mã tứ phân.

Trong khi đó, ở mức độ cơ bản nhất, dữ liệu máy tính đều nằm ở dạng nhị phân, được biểu thị bằng số 0 và số 1.

Để chuyển đổi thông tin từ dạng nhị phân sang tứ phân, ta có thể hình dung đơn phân A được quy định ứng với 00, C ứng với 01, G ứng với 10 và T ứng với 11.

Sau khi có quy tắc biến đổi, nhóm nghiên cứu dùng thiết bị tổng hợp ADN để sắp xếp các đơn phân trên lên phân tử ADN theo trình tự thích hợp. Khi quá trình này kết thúc, kết quả thu được là một lượng lớn dữ liệu được lưu trữ trong một phân tử có kích thước bé hơn cả đầu bút chì.

Nghe thì có vẻ mong manh nhưng ADN lại là phương tiện lưu trữ bền nhất mà con người từng biết: những mẫu ADN trong tự nhiên có niên đại lên đến hàng trăm nghìn năm vẫn có thể được các nhà khoa học ngày nay giải mã thành công.

Để đọc được thông tin lưu trữ trong phân tử ADN tổng hợp, người ta dùng tới một máy giải mã trình tự ADN. Việc giải mã trình tự bắt buộc phải tách một đoạn nhỏ từ đoạn mã ADN gốc, và mẫu chiết tách này sẽ bị tiêu biến sau khi quá trình giải mã kết thúc.

Vì lý do này mà một mẫu phân tử ADN chỉ có thể được giải mã một số lần nhất định, tương tự như các thiết bị lưu trữ truyền thống có số lần đọc ghi giới hạn.

Tuy vậy, đây không phải là một vấn đề nghiêm trọng vì trên phân tử ADN chứa rất nhiều dữ liệu dự phòng cho phép giải mã nhiều lần mà không làm ảnh hưởng đến dữ liệu gốc.

Khác với đĩa mềm, đĩa CD, hay cả những thiết bị lưu trữ tối tân nhất hiện nay chắc chắn không thoát khỏi quy luật đào thải khi những công nghệ ưu việt hơn ra đời, Luis Henrique Ceze, phó giáo sư (PGS) ngành khoa học và kỹ thuật máy tính của ĐH Washington (Mỹ), tin rằng ADN sẽ không phải chịu chung số phận này.

“ADN sẽ luôn là mối quan tâm của khoa học vì mối liên hệ mật thiết của nó với sức khỏe và đời sống, do đó sẽ không có chuyện một ngày nào đó không còn thiết bị nào tương thích để đọc thông tin lưu trữ trên ADN” - PGS Ceze nói.

Tháng 7 năm ngoái, Microsoft và ĐH Washington đã mã hóa thành công 200 megabyte (MB) dữ liệu trên một phân tử ADN, xô ngã kỷ lục trước đó là 22MB dữ liệu. Với công nghệ ADN, nhóm nghiên cứu ước tính có thể lưu trữ đến 1 exabyte dữ liệu - tương đương 1 tỉ gigabyte - chỉ trong thể tích của một khối lập phương có cạnh dài xấp xỉ một đốt ngón tay.

“Chúng tôi đã thử ước lượng thể tích ADN cần dùng để chứa toàn bộ thông tin công khai trên Internet, tức tất cả những thứ không được bảo vệ bởi mật khẩu hay tường bảo mật” - Kevin Strauss, kỹ sư máy tính của Microsoft, cho biết. “Kết quả là tất cả những thông tin này có thể nhét vừa trong một chiếc hộp đựng giày cỡ lớn”.

Để hiện thực hóa điều đó hãy còn là chuyện xa vời, nhưng Ceze tin rằng chỉ trong vòng 10 năm nữa thôi những hệ thống lưu trữ bằng ADN sẽ bắt đầu được bày bán trên thị trường.

ADN kích thước nhỏ nhưng có sức chứa ngoài sức tưởng tượng
ADN kích thước nhỏ nhưng có sức chứa ngoài sức tưởng tượng

Lĩnh vực phát triển thần tốc

“Tôi và các đồng nghiệp đã nghiên cứu để tối ưu cả hai phương pháp giải mã và mã hóa ADN, nhờ đó mã hóa thành công toàn bộ quyển sách có cả hình lên một phân tử ADN - GS Church cho biết - Điều đó chứng tỏ tất cả mọi dữ liệu kỹ thuật số đều có thể được mã hóa bằng ADN”.

ADN đã tồn tại hàng tỉ năm cùng với sự hiện diện của sự sống trên Trái đất, nhưng mãi đến năm 1986, khi một nghiên cứu sinh của Viện Công nghệ Massachusetts (Mỹ) là Joe Davis đã mã hóa thành công một hình ảnh nhị phân vào 28 cặp ADN thì người ta mới bắt đầu nhận thấy tiềm năng của phân tử này như một phương tiện lưu trữ dữ liệu.

George Church, giáo sư di truyền học tại Trường Y của ĐH Harvard, cũng là một trong những người tiên phong trong lĩnh vực này.

Từ những năm 1970, ông vẫn luôn tìm tòi cách thức giảm chi phí mã hóa và giải mã ADN, vì ông tin rằng một ngày không xa chúng sẽ trở thành những thiết bị lưu trữ dùng trong thực tiễn.

Church bắt đầu nghiên cứu chuyên sâu về ADN từ năm 2000, và ba năm sau đó ông đã tiến hành nhiều cuộc thử nghiệm quan trọng về kỹ thuật tổng hợp và giải trình tự ADN.

Năm 2012, ông thành công trong việc kết hợp hai quá trình này lại với nhau và xây dựng một hệ thống mã hóa dữ liệu trên nền tảng ADN. Công trình nghiên cứu của ông được đăng trên tạp chí Science cùng năm đó và đã gây tiếng vang lớn trong giới khoa học lúc bấy giờ.

Dù ở thời điểm hiện tại chi phí để xử lý các phân tử ADN vẫn là một trở ngại lớn trong quá trình phát triển phương thức lưu trữ mới, Church chỉ ra rằng trên thực tế, chi phí này đã giảm đáng kể từ sau khi ông công bố nghiên cứu của mình.

Nhược điểm của ADN là chúng cần được xử lý và bảo quản trong môi trường hóa chất ẩm ướt. Tuy nhiên PGS Ceze tin rằng dung lượng cực “khủng” cùng tốc độ truy cập ngẫu nhiên tương đương các hệ thống lưu trữ bằng băng từ sẽ là những lợi thế không thể bỏ qua của công nghệ này.

Theo đó, chi phí để giải mã ADN đã giảm 3 triệu lần, còn chi phí cho việc tổng hợp ADN đã giảm 1 tỉ lần từ năm 2012 đến nay, và Church dự đoán những chi phí này sẽ còn giảm mạnh hơn nữa trong thời gian tới.

Một điều đáng mừng là việc sao chép ADN có thể tiến hành hoàn toàn miễn phí, đồng nghĩa với việc lưu trữ dữ liệu dài hạn cũng sẽ không tốn quá nhiều tiền bạc.

Thực tế cho thấy đối với việc lưu trữ bảo quản dữ liệu (archiving) thì chi phí để giải mã dữ liệu không phải một vấn đề quá lớn, vì việc giải mã để đọc lại các dữ liệu này không phải là một nhu cầu thường xuyên.

Trong khi các thiết bị lưu trữ truyền thống vẫn đang phát triển ở tốc độ của định luật Moore và sẽ sớm bị chững lại khi gặp phải các giới hạn về vật lý, công nghệ lưu trữ bằng ADN sẽ phát triển nhanh hơn rất nhiều mà không gặp phải bất kỳ chướng ngại nào, Church nhận xét.

Với một đội ngũ nghiên cứu gồm 93 người, Church hiện đang tập trung vào hai mục tiêu chính, thứ nhất là cải thiện tốc độ xử lý ADN lên gấp 200.000 giới hạn hiện tại, và thứ hai là thu nhỏ hơn nữa kích thước của những thiết bị giải mã và tổng hợp ADN, vốn đang chiếm diện tích tương đương một chiếc tủ lạnh cỡ lớn.

Nhiều công ty hiện nay cũng đã bắt đầu rục rịch nhảy vào cuộc đua sản xuất thiết bị lưu trữ ADN. Helixworks, một công ty ở Ireland, đã bắt đầu đăng bán các đoạn ADN chứa 512 kilobyte dữ liệu của một hình ảnh hay một bài thơ trên Amazon.

Công ty hiện đang hướng tới việc phát triển các máy in ADN thu nhỏ, với mục tiêu là mang công nghệ lưu trữ bằng ADN đến với mọi nhà với giá thành dễ chịu.

Tương tự máy in màu thông thường dùng 4 màu chính để phối hợp với nhau tạo ra hàng triệu màu khác nhau, chiếc máy in ADN cũng sẽ có một “hộp mực” gồm 32 chất phản ứng để có thể tổng hợp bất kỳ chuỗi ADN nào.

Theo tiên đoán của Church, công nghệ lưu trữ ADN sẽ được ứng dụng trước nhất vào ngành lưu trữ bảo quản dữ liệu và ngành lưu trữ đám mây (cloud storage). Các ông lớn trong ngành công nghệ như IBM, Microsoft và Technicolor cũng đang tiến hành những nghiên cứu của riêng họ.

Church cho biết năm 2015 ông đã hợp tác cùng Technicolor để lưu trữ bộ phim câm siêu kinh điển A trip to the moon lên phân tử ADN. Đến giờ thì Technicolor đã có cho riêng mình một kho phim trên ADN, và không có gì quá ngạc nhiên khi kích thước của chúng gộp lại cũng chưa lớn bằng một hạt bụi.■

Vui lòng nhập nội dung bình luận.

Gửi