Nobel hóa học 2024: Hiện hình cấu trúc protein

GIÁP VĂN DƯƠNG 28/10/2024 09:56 GMT+7

TTCT - Giải Nobel hóa học 2024 đã được trao một nửa cho David Baker (Đại học Washington, Mỹ) cho công trình "thiết kế protein thông qua tính toán", nửa còn lại cho Demis Hassabis và John M. Jumper (Google DeepMind, Anh).


Nobel hóa học 2024: Hiện hình cấu trúc protein - Ảnh 1.

Khám phá cấu trúc protein. Ảnh: Viện Hàn lâm Thụy Điển

Họ là những tên tuổi gắn với thành tựu "tiên đoán cấu trúc protein". Một cách ngắn gọn, qua các nghiên cứu được vinh danh năm nay, giấc mơ hiểu thấu protein - phân tử đóng vai trò phương tiện kiêm chất liệu xây nên sự sống - đã trở thành hiện thực.

Trong giấc mơ đó, Baker đã phát triển thành công cách thiết kế và tạo ra các phân tử protein, còn Hassabis và Jumper đã phát triển mô hình trí tuệ nhân tạo để dự đoán cấu trúc của hầu hết các protein. Những phát kiến của họ mở ra muôn vàn ứng dụng mới trong các ngành hóa chất, y tế và dược phẩm.

Muốn hiểu phải thấy

Cơ sở cho sự sống phong phú vô cùng là gì? Liệu có thể hiểu, làm chủ, thậm chí cải biến nó không? Câu trả lời là có. Tất cả nằm ở một loại phân tử đặc biệt: protein - công cụ kiêm chất liệu để xây nên sự sống.

Vậy protein là gì? Protein là các đại phân tử, được tạo thành từ khoảng 20 acid amin khác nhau, có thể kết hợp với nhau theo vô số cách. Những cách kết hợp này được quy định trong ADN. Như vậy, có thể hiểu ADN là bản thiết kế của công trình sự sống, còn protein là nguyên vật liệu để xây lên công trình đó.

Protein xây nên sự sống qua trình tự sắp xếp các acid amin bên trong, tức cấu trúc của protein. Cụ thể khi sắp xếp, chuỗi acid amin xoắn và gấp lại thành cấu trúc 3 chiều riêng biệt, thậm chí là duy nhất. 

Chính cấu trúc này mang lại các chức năng khác nhau cho protein. Một số protein tạo ra cơ, sừng hoặc lông vũ, trong khi các protein khác tạo ra hormone, kháng thể hoặc enzyme để điều khiển các quá trình hóa sinh. Một số protein khác nữa, nằm trên bề mặt tế bào, đảm nhận vai trò giao tiếp giữa tế bào và môi trường xung quanh…

Làm chủ được hình dạng 3 chiều của protein và trình tự sắp xếp acid amin sẽ hiểu được cách thức sự sống vận hành. Nhưng trước hết, ít nhất cũng phải trông thấy protein hình thù thế nào, rồi mới tìm cách sắp xếp acid amin để thu được phân tử protein có hình thù và tính năng như mong đợi.

Nobel hóa học 2024: Hiện hình cấu trúc protein - Ảnh 2.

Ảnh: AFP

Những hình ảnh đầu tiên

Ngay từ thế kỷ 19, các nhà hóa sinh đã biết protein đóng vai trò rất quan trọng với các quá trình sống. Nhưng protein có hình thù thế nào thì phải đến những năm 1950, công cụ nghiên cứu mới tạm đủ chính xác để khám phá. 

John Kendrew và Max Perutz của Đại học Cambridge (Anh) đã sử dụng phương pháp tinh thể học tia X để nghiên cứu và tạo ra các mô hình protein 3 chiều đầu tiên. Nhờ thành tích này, họ được trao Nobel hóa học năm 1962.

Phương pháp tinh thể học tia X - thường tốn rất nhiều công sức - tiếp tục được sử dụng để tạo ra hình ảnh của khoảng 200.000 loại protein khác nhau. Đây chính là cơ sở dữ liệu đặt nền móng cho các nghiên cứu được trao giải Nobel hóa học năm nay.

Đầu những năm 1960, Christian Anfinsen (người Mỹ) sử dụng nhiều thủ thuật hóa học khác nhau để làm một protein có thể mở ra và tự gấp lại. Điều thú vị là sau quá trình đó, phân tử protein luôn giữ nguyên hình dạng. Năm 1961, Anfinsen kết luận rằng cấu trúc 3 chiều của protein được quyết định bởi trình tự sắp xếp các acid amin trong nó. Nhờ đó, ông đã được trao giải Nobel hóa học năm 1972.

Tuy nhiên, lập luận của Anfinsen đồng nghĩa với một nghịch lý, được Cyrus Levinthal chỉ ra vào năm 1969: ngay cả khi một protein chỉ bao gồm 100 acid amin, về mặt lý thuyết, nó có thể có ít nhất 1047 (một trăm tỉ tỉ tỉ tỉ tỉ) cấu trúc 3 chiều khác nhau. 

Điều đó đồng nghĩa nếu chuỗi acid amin được gấp ngẫu nhiên, thời gian gấp sẽ dài hơn cả tuổi vũ trụ mới cho ra được một cấu trúc protein cụ thể. Nhưng thực tế của các quá trình sinh hóa diễn ra trong tế bào, các acid amin lại chỉ mất vài mili giây để sắp xếp. 

Kết hợp lại, khám phá của Anfinsen và nghịch lý Levinthal ngụ ý quá trình gấp protein là có tính "tiền định", đồng nghĩa tất cả thông tin về cách protein gấp phải được mã hóa sẵn trong trình tự sắp xếp acid amin.

Kiện tướng cờ vua và thách thức của ngành sinh hóa

Từ đó suy ra nếu biết trình tự sắp xếp acid amin, có thể dự đoán cấu trúc 3 chiều của protein. Và như vậy sẽ không còn phải sử dụng phương pháp tinh thể học tia X phức tạp và tốn kém để xây dựng cấu trúc 3 chiều của protein nữa. 

Hơn thế, ta còn có thể tạo ra các cấu trúc các protein mà tinh thể học tia X không chạm tới được. Thách thức mới cho ngành sinh hóa, do đó, là dự đoán cấu trúc protein.

Năm 1994, dự án "Đánh giá phê bình về dự đoán cấu trúc protein" (CASP), được tổ chức như một cuộc thi, được khởi động. Hai năm một lần, các nhà nghiên cứu khắp thế giới được tiếp cận với trình tự các acid amin trong protein có cấu trúc vừa được xác định. Tuy nhiên, cấu trúc này được giữ bí mật. Thách thức là dự đoán đúng cấu trúc protein dựa trên trình tự các acid amin đã biết.

CASP thu hút nhiều nhà nghiên cứu, nhưng vấn đề dự đoán cấu trúc protein vẫn đầy thách thức. Bước đột phá chỉ đến vào năm 2018, khi một kỳ thủ cờ vua, chuyên gia khoa học thần kinh và người tiên phong về AI nhập cuộc.

Demis Hassabis bắt đầu chơi cờ vua từ năm 4 tuổi và trở thành kiện tướng quốc tế khi mới 13 tuổi. Khi còn nhỏ, Hassabis đã là một lập trình viên và nhà phát triển trò chơi xuất sắc. Sau đó, ông học về AI và khoa học thần kinh. 

Năm 2010, ông đồng sáng lập DeepMind. Công ty đã được bán cho Google vào năm 2014 và hai năm sau, Google DeepMind thu hút sự chú ý toàn cầu khi làm được điều mà nhiều người khi đó tin là tìm ra "chén thánh" của AI: đánh bại kỳ thủ vô địch cờ vây thế giới.

Tuy nhiên với Hassabis, cờ vây không phải là mục tiêu, mà chỉ là phương tiện để phát triển mô hình AI tốt hơn. Năm 2018, ông đăng ký tham gia cuộc thi CASP lần thứ 13.

Trước đây, tỉ lệ dự đoán chính xác cấu trúc protein trong CASP là khoảng 40%. Với phần mềm AlphaFold, nhóm của Hassabis đã đạt độ chính xác gần 60%. Kết quả này rất ấn tượng, nhưng vẫn chưa đủ tốt để ứng dụng thực tế, vốn đòi hỏi độ chính xác lên đến khoảng 90%, tương đương với phương pháp tinh thể học tia X. 

Tới đây, dù đã rất cố gắng, nhóm của Hassabis có vẻ đã đi vào ngõ cụt. Đúng lúc đó, một nhân viên mới của Google DeepMind, John Jumper, đưa ra ý tưởng về cách thức cải thiện mô hình AI AlphaFold.

Nobel hóa học 2024: Hiện hình cấu trúc protein - Ảnh 3.

Ảnh: embl.org

Jumper đam mê khám phá vũ trụ nên đã học vật lý và toán. Tuy nhiên, vào năm 2008, khi làm việc tại một công ty sử dụng siêu máy tính để mô phỏng protein và các quá trình động lực học của chúng, ông đổi ý.

Năm 2011, ông đăng ký học tiến sĩ và bắt đầu chuyển từ vũ trụ học sang protein. Để sử dụng máy tính hiệu quả hơn, Jumper phát triển các phương pháp đơn giản và hiệu quả hơn để mô phỏng động lực học của protein. 

Năm 2017, khi vừa xong chương trình tiến sĩ, ông nghe tin Google DeepMind đã bắt đầu dự đoán cấu trúc protein, nên gia nhập AlphaFold và nhanh chóng được đề bạt nhờ năng lực vượt trội.

Jumper và Hassabis đã đồng lãnh đạo nỗ lực cải tổ mô hình AlphaFold. Không lâu sau đó, phiên bản mới AlphaFold2 ra đời. Phiên bản mới, được huấn luyện với cơ sở dữ liệu là tất cả cấu trúc protein và trình tự acid amin đã biết, mang về kết quả rất tốt, vừa kịp cho cuộc thi CASP lần thứ 14. 

Khi đánh giá kết quả cuộc thi này, ban tổ chức hiểu thử thách 50 năm của ngành hóa sinh đã kết thúc: trong hầu hết các trường hợp, AlphaFold2 dự đoán cấu trúc protein chính xác ngang với tinh thể học tia X.

Thiết kế protein mới

Khi David Baker bắt đầu học Đại học Harvard, ông chọn triết học và khoa học xã hội. Tuy nhiên, trong một khóa về sinh học tiến hóa, ông tình cờ đọc được cuốn Sinh học phân tử của tế bào, và hướng đi của cả cuộc đời ông thay đổi. 

Baker bắt đầu khám phá sinh học tế bào và cuối cùng say mê với cấu trúc protein. Khi làm trưởng nhóm nghiên cứu tại Đại học Washington năm 1993, ông đã khám phá cách protein gấp. Đây là tiền đề để ông phát triển phần mềm máy tính Rosetta dùng để dự đoán cấu trúc protein vào cuối những năm 1990.

Nobel hóa học 2024: Hiện hình cấu trúc protein - Ảnh 4.

Ảnh: Chemistry World

Baker ra mắt cuộc thi CASP năm 1998 bằng Rosetta và so với các nhóm khác khác, Rosetta thực sự thành công. 

Điều này dẫn đến ý tưởng mới: sử dụng phần mềm Rosetta theo chiều ngược lại, tức thay vì nhập trình tự acid amin để dự đoán cấu trúc protein, hãy nhập cấu trúc protein mong muốn và nhận được gợi ý cho trình tự acid amin tương ứng. Điều này cũng đồng nghĩa ta có thể thiết kế ra các protein hoàn toàn mới.

Lĩnh vực thiết kế protein chức năng mới bắt đầu phát triển từ cuối những năm 1990. Thường thì các protein hiện hữu sẽ được điều chỉnh để có thêm tính năng mới. Tuy nhiên, làm vậy thì chỉ điều chỉnh được hạn chế. 

Để tăng khả năng thu được protein có chức năng hoàn toàn mới, Baker muốn tạo ra chúng từ đầu. Ông nói: nếu muốn chế tạo máy bay, ta không bắt đầu bằng cách chỉnh sửa một con chim; mà phải hiểu các nguyên lý khí động học, rồi chế tạo máy bay từ các nguyên lý đó.

Với sự trợ giúp của phần mềm Rosetta, họ đã tạo ra được protein Top7 hoàn toàn mới, có cấu trúc gần giống hệt như thiết kế có chủ ý của các nhà nghiên cứu. 

Top7 là tiếng sấm giữa trời quang trong lĩnh vực này: cấu trúc độc đáo của nó không tồn tại trong tự nhiên; và với 93 acid amin, nó lớn hơn bất kỳ protein nào từng được thiết kế trước đây. 

Baker công bố khám phá của mình vào năm 2003, rồi sau đó công khai luôn mã nguồn Rosetta để cộng đồng nghiên cứu toàn cầu có thể tiếp cận và phát triển, thiết kế ra các protein mới.■

Nhờ công sức của họ, chúng ta đã hiểu được khá tường tận protein, những tri thức dẫn tới vô vàn ứng dụng cho cuộc sống, chẳng hạn tìm ra lý do tại sao một số bệnh tiến triển, hay hiện tượng kháng thuốc kháng sinh diễn ra thế nào, hay vì sao một số vi khuẩn có thể phân hủy nhựa.

Đó là chưa kể còn rất nhiều ứng dụng nữa đang chờ đợi để khám phá trong tương lai, ở các lĩnh vực vật liệu nano mới, dược phẩm mới, vắc xin mới, hay sản xuất hóa chất xanh hơn…

Bình luận Xem thêm
Bình luận (0)
Xem thêm bình luận