Tiến sĩ Lê Viết Quốc: Dạy cho AI tư duy và có trái tim

KHỔNG LOAN 05/12/2024 05:14 GMT+7

TTCT - Trí tuệ nhân tạo (AI) tạo sinh đang thay đổi rất lớn cách thế giới vận hành và con người tư duy. Liệu sẽ đến lúc máy dạy cho con người tư duy?

Nhà khoa học máy tính, tiến sĩ Lê Viết Quốc của Google, một trong những nhà nghiên cứu hàng đầu về AI tại dự án Google Brain, được xem là một trong những động cơ thúc đẩy nhiều tiến bộ liên quan tới Auto Machine Learning (AutoML) trò chuyện về những bước tiến mới với AI, và con người có thể làm gì để vượt lên trên AI.

Tiến sĨ Lê Viết Quốc: Dạy cho AI tư duy và có trái tim - Ảnh 1.

Tiến sĩ LÊ VIẾT QUỐC

Chuyện ở Google

Anh tham gia phát triển công cụ AI Gemini của Google như thế nào?

Tôi học chuyên toán tin ở trường cấp III, và rất đam mê máy tính, AI, dù khi đó ý tưởng về cái này vẫn còn mơ hồ lắm. Khi đọc sách về lịch sử, về phát triển khoa học, tôi thấy bức hình người đầu tiên đặt chân lên Mặt trăng. Vì sao là con người mà không phải loài động vật khác? Câu trả lời là chúng ta có trí thông minh.

Khi đó, tôi nhận ra AI sẽ là công nghệ xây dựng đột phá cho tương lai của nhân loại nên rất thích thú với lĩnh vực này, bắt đầu tìm hiểu về AI. Đầu tiên, tôi phát triển chatbot để nói chuyện với nó nhưng không thành công. Tôi học đại học ở Úc và xin thực tập cùng giáo sư chuyên về AI ở năm thứ 2, được thầy giới thiệu đi học ở ĐH Stanford năm 2007. 

Tôi làm luận văn tiến sĩ với người thầy rất nổi tiếng là Andrew Ng, chuyên dạy về deep learning và là đồng sáng lập Coursera. Năm 2011, tôi đề xuất với thầy, AI đã phát triển rất nhanh nhưng cần đầu tư dạy cho máy học những dữ liệu lớn với số máy tính rất lớn. Công ty có lượng dữ liệu rất lớn và số máy tính rất lớn là Google, nơi rất gần Stanford. Tôi và thầy tiếp cận làm AI ở Google. Khi đó, Google làm nhiều về các thuật toán, dữ liệu lớn, mới bắt đầu làm AI.

Tôi có dịp nói chuyện với Jeff Dean, một trong những chuyên gia hàng đầu về lĩnh vực này và chuyển đến Google làm việc với ông, khi đó là đồng sáng lập dự án Google Brain và tôi trở thành một trong những kỹ sư sáng lập (founding engineer) ở đây.

Một trong những công trình nghiên cứu chúng tôi thực hiện với dữ liệu lớn và lượng máy tính lớn đã tạo ra đột phá và được The New York Times giới thiệu. Tôi đã thay đổi hoàn toàn suy nghĩ về cái gì là quan trọng nhất: Liệu thuật toán quan trọng hơn, dữ liệu quan trọng hơn hay số máy tính quan trọng hơn? Tôi nhận ra thuật toán ít quan trọng hơn so với dữ liệu và số máy tính. Kết luận này rất gây tranh cãi vào thời điểm đó nhưng rõ ràng kết quả mà tôi nhận được có tính đột phá nhờ dữ liệu và số máy tính.

Đến năm 2014, tôi bắt đầu nghiên cứu về mô hình ngôn ngữ học. Tôi thích làm các chatbot để trò chuyện, thảo luận các vấn đề, các ý tưởng. Chatbot khi đó của tôi cùng một số cộng sự có tên là "Seq2Seq", giải quyết vấn đề đầu tiên là dịch thuật, huấn luyện mô hình đầu vào là một câu tiếng Việt, đầu ra là một câu tiếng Anh.

Mô hình này trở thành một trong những AI tạo sinh đầu tiên được sử dụng trong thực tiễn từ năm 2014. Đến năm 2016, nó đã được ứng dụng trên Google Translate và đến nay đã được rất nhiều người sử dụng. Sau đó, tôi nghiên cứu tạo ra chatbot tốt hơn, có thể tổng hợp văn bản, tương tác với người dùng, giải thích các vấn đề, đưa thông tin chính xác.

Tiến sĨ Lê Viết Quốc: Dạy cho AI tư duy và có trái tim - Ảnh 2.

Ở Google, tôi và Lương Minh Thắng đã tạo ra một chatbot gọi là Meena, còn gọi là LaMDA. Tôi huấn luyện chatbot này sử dụng dữ liệu trên mạng, nhưng dữ liệu trên mạng thường chứa những thông tin không tốt. Tuy nhiên, khi đó một số người ở Google tương tác với chatbot này rất nhiệt tình, muốn công ty đưa sản phẩm ra thị trường. Nhưng Google chưa muốn vì có những vấn đề chưa giải quyết được. Đến năm 2022, ChatGPT xuất hiện.

Gần đây, chúng tôi chuyển sang nghiên cứu về khả năng tư duy, tức là thay vì chỉ giải quyết các vấn đề văn học và thơ ca, tôi muốn nó có khả năng tốt hơn trong toán học và lập trình. Những vấn đề toán học và lập trình đòi hỏi tư duy rất cao.

Cùng các đồng nghiệp, chúng tôi đầu tiên làm về hình học, sau đó chuyển sang xây dựng mô hình ngôn ngữ để giải quyết các bài toán một cách tổng quát hơn. Sau đó, gần đây đội của tôi và một đội khác đều từ DeepMind tham gia cuộc thi quốc tế và đoạt được huy chương bạc. Hiện chúng tôi nghiên cứu về tư duy trên chatbot như Gemini.

Anh đánh giá đâu là cột mốc quan trọng, có tính đột phá với sự nghiệp của mình?

Tôi nghĩ cột mốc quan trọng nhất là vào năm 2004, khi tôi gửi email cho thầy và thầy đồng ý nhận tôi làm thực tập nghiên cứu. Thời điểm đó, tôi còn rất non trẻ, và từ số 0 thành số 1 là một thay đổi rất lớn.

Cột mốc thứ hai là làm việc với nhà nghiên cứu Andrew Ng. ở Stanford. Khi ấy, tôi chuyển sang deep learning là như cá gặp nước. Cột mốc thứ ba là gặp Jeff Dean, kỹ sư số 1 ở Google.

Ở Google, văn hóa làm kỹ sư rất cao. Những kỹ sư giỏi là những người được coi trọng nhất trong công ty. Jeff Dean được coi là "God of engineering" - thánh của các kỹ sư. Ông không chỉ là lãnh đạo, mà còn là thần tượng của cả công ty, dù ông chỉ quản lý một nhóm kỹ sư nhỏ, là một trong những người được kính trọng và tin tưởng nhất ở Google.

Khả năng nghiên cứu của tôi kết hợp với khả năng kỹ sư của Jeff Dean, cùng với tài năng lãnh đạo của Jeff Dean đã biến công trình nghiên cứu của tôi từ không ai biết tới rất nhiều người biết đến.

Anh đã học được điều gì từ Jeff Dean?

Jeff Dean có nhiều phẩm chất rất tốt. Phẩm chất đầu tiên là khả năng lập trình của ông ấy cực kỳ siêu việt. Ở Google có kho dữ liệu và mọi người đều biết mình đã viết bao nhiêu code. Hiện tại, Jeff Dean là một trong những người viết code nhiều nhất ở Google.

Thứ hai, Jeff Dean rất giỏi làm việc với những người khác. Ông biết hợp tác với người khác và luôn giữ cái tôi của mình ở mức thấp. Dù rất thành công nhưng ông lúc nào cũng khiêm tốn. Ví dụ, có những tập sự chỉ có ý tưởng hay nhưng khi gặp Jeff Dean, ông vẫn có thể làm việc cùng họ. Văn hóa này rất hiếm thấy trên thế giới.

Thứ ba, Jeff Dean có tầm nhìn rất tốt. Vào thời điểm mọi người chưa thực sự ủng hộ deep learning vì kết quả còn rất hạn chế, Jeff Dean đã nhận ra deep learning với lượng dữ liệu lớn sẽ mang lại kết quả cao. Số người trên thế giới nhận ra điều này chỉ đếm trên đầu ngón tay. Quan điểm này đòi hỏi sự dũng cảm rất lớn, bởi vì cần rất nhiều tiền, rất nhiều đầu tư. Jeff Dean vừa có tầm nhìn vừa có sự dũng cảm. Một con người có sự kết hợp giữa kỹ thuật, khả năng hợp tác, tầm nhìn và dũng cảm là rất hiếm có.

AI và VIỆT NAM

Ở Việt Nam, mọi người đang rất quan tâm đến việc đưa AI ứng dụng nhiều hơn trong cuộc sống thực tế, vận hành xã hội. Anh nghĩ thế nào về mối quan tâm này?

Sự bùng nổ của AI là cơ hội lớn cho Việt Nam. Các mô hình AI chưa thể bằng những người giỏi nhất trên thế giới, nhưng chúng có thể nâng cao năng lực cho những người ở mức dưới trung bình, giúp mọi người cùng phát triển.

Tôi không có nhiều hoạt động ở Việt Nam nhưng hiện tôi là thành viên hội đồng quản trị của Trường ĐH Fulbright. Tôi nghĩ nếu Việt Nam có những trường đại học tốt, chúng ta sẽ tạo ra được những con người xuất sắc. Những người xuất sắc sẽ xây dựng các công ty lớn, từ đó tạo ra nhiều việc làm hơn cho mọi người.

Đề xuất của tôi là nên tập trung dạy cách sử dụng AI thay vì chỉ học các môn kinh điển về khoa học máy tính. Tôi đã tư vấn cho các bộ ngành ở Việt Nam nên đầu tư nhiều hơn vào AI, bởi đây là một cơ hội lớn cho Việt Nam. Theo tôi, đầu tư vào AI còn tốt hơn đầu tư vào sản xuất chip bán dẫn. Việc sản xuất chip rất tốn kém, trong khi đầu tư vào AI rẻ hơn nhiều, vì đa số mô hình AI hiện nay là mã nguồn mở như LaMDA, PyTorch... Việt Nam hoàn toàn có thể tận dụng.

Vậy thì thách thức lớn nhất của Việt Nam khi đưa AI vào môi trường giáo dục Việt Nam sớm hơn hoặc ứng dụng nhiều hơn là gì?

Thách thức đầu tiên là nếu Việt Nam muốn xây dựng một trường đại học tốt thì cần đầu tư lâu dài. Đầu tư lâu dài vào giáo dục thường gặp phải nhiều câu hỏi về hiệu quả, vì vậy cần có nhiều thảo luận về mặt chính sách.

Thứ hai, về đầu tư cho AI, Việt Nam sẽ có rất nhiều lựa chọn, có thể đầu tư vào AI hoặc vào chip. Chính sách đầu tư nào sẽ mang lại hiệu quả tốt hơn là điều cần bàn bạc. Thực tế, để có những sản phẩm tốt, chúng ta phải cạnh tranh với thế giới, mà thị trường Việt Nam lại khá nhỏ, không đủ để trang trải chi phí xây dựng các mô hình AI. Các công ty AI của Việt Nam phải tìm cách ra được thế giới, nơi có tính cạnh tranh rất cao.

Thứ ba, Việt Nam cần thu hút các công ty lớn về Việt Nam như Google, Facebook hay Microsoft mở các trung tâm nghiên cứu hoặc các trung tâm kỹ thuật tại Việt Nam, kỹ sư làm ở Việt Nam. Những điều này có thể xảy ra. Trước đây, lớp tài năng giỏi của Việt Nam đi nước ngoài làm việc bởi không có hệ sinh thái làm công ty ở đây, nghĩa là Việt Nam không có tài năng ở trong nước để làm việc. Trong lĩnh vực AI, đặc thù là những người xuất sắc nhất rất được tôn trọng.

Nhưng ở Việt Nam, năng lực con người rất lớn nên tôi nghĩ là sẽ vượt qua những thách thức này.

Hiện nay anh có hợp tác với nhiều người Việt Nam trong các nghiên cứu của mình không?

Google Deepmind có chỉ khoảng 10 người, có thể ít hơn. Trong đội do tôi quản lý là 4-5 người. Có một câu chuyện rất hay về một bạn tên là Triều, quê ở Bình Định, học ở Đại học Khoa học tự nhiên, TP.HCM. Trong quá trình học, bạn ấy thường lên trang GitHub, trang code của thế giới, để nghiên cứu và làm lại những bài báo khoa học mà người ta đã viết. Bạn ấy chỉ làm lại những gì họ đã làm, không có gì mới cả. Nhưng bạn ấy có sự tò mò rất lớn, rất thích nghiên cứu về AI.

Tôi nhận được hồ sơ của bạn ấy, thấy rất thú vị nên xin Google nhận bạn ấy vào làm thực tập. Bạn ấy chính là người làm chương trình AlphaGeometry - một trong những chương trình đột phá về các mô hình ngôn ngữ học.

Tôi muốn nhắc tới chuyện đó để nói rằng tiềm năng của người Việt Nam rất lớn. Những người như Triều, Thắng Lương hay như tôi, theo tôi nghĩ là còn rất nhiều. May mắn cho tôi là có cơ hội gặp được những người như họ, các anh em tập hợp lại nhau để làm những chương trình tư duy như thế này. Nếu có cơ hội gặp những bạn Việt Nam xuất sắc, tôi luôn muốn giới thiệu các bạn ấy vào làm việc ở Google.

AI sẽ có trái tim

Sự tò mò đã đưa Triều đến hành trình mới và có cơ hội làm việc với những người như anh. Tò mò cũng là một trong những kỹ năng quan trọng trong thời đại công nghệ khi máy móc đang ngày càng thay thế con người làm rất nhiều việc. Vậy dưới góc nhìn của anh, làm thế nào để con người có thể phát triển trí tò mò của mình?

Thật ra, con người sinh ra đã có trí tò mò vô hạn rồi. Vốn dĩ là như thế. Nhưng giáo dục nói chung, không chỉ ở Việt Nam, bằng cách nào đó, lại làm cho con người dần dần mất đi sự tò mò này.

Tôi nghĩ lý do chính là do nền giáo dục thường áp đặt, cố gắng truyền tải càng nhiều thông tin càng tốt cho người học theo kiểu nhồi nhét. Thật ra thời gian học của chúng ta chỉ có 12 năm, mà số kiến thức của thế giới thì quá nhiều, bây giờ lại càng nhiều hơn nữa. Các bạn biết càng nhiều thông tin thì càng tốt, nhưng đưa càng nhiều thông tin lại càng giảm đi sự tò mò của con người. Đây là một nghịch lý. Biết nhiều thông tin là tốt cho mình nhưng mà mình lại hết sự tò mò. Làm thế nào để đưa nhiều thông tin nhưng lại dạy cho người ta vẫn tò mò là điều quan trọng nhất.

Theo tôi, cách đưa được nhiều thông tin nhưng vẫn tạo sự tò mò là luôn dạy cho người học tư duy phản biện. Khi đưa ra thông tin, phải luôn hình dung rằng thông tin này có thể sai, và một ngày nào đó sẽ có một định luật mới thay thế nó. Nhưng điều này đòi hỏi kỹ năng sư phạm tốt, nên đa số người ta không dạy được như thế.

Bây giờ chúng ta đang dạy cho máy tư duy, có khi nào đến lúc máy dạy cho con người tư duy?

Thực ra, máy đã bắt đầu dạy cho con người tư duy rồi. Người ta sẽ lên Gemini hoặc lên ChatGPT để hỏi những câu hỏi. Ví dụ như ở bên Mỹ, tôi thích trồng cây, có một số loài cây mà tôi chỉ biết tên, nhưng lên mạng tìm thì thấy rất khó. Khi đó, tôi lên các mô hình AI, hỏi về các loài cây này. Mấy cái lá thì giống nhau nhưng có sự khác biệt, như có cây thích nắng, có cây thích râm. Như vậy là máy đã bắt đầu dạy cho mình thông tin rồi.

Tiến sĨ Lê Viết Quốc: Dạy cho AI tư duy và có trái tim - Ảnh 3.

Ảnh: Pixabay.com

Còn dạy về sự tò mò, hiện tại, thậm chí cả máy tính phần lớn vẫn chưa có sự tò mò bởi nó vẫn chưa tư duy như con người. Nhưng đó là một nghiên cứu mà đội của tôi đang làm, tức là dạy cho máy tính tư duy như con người.

Trong AI có hai trường phái là Extrinsic Motivation và Intrinsic Motivation. Extrinsic Motivation là động lực vì phần thưởng, mình phải tạo ra phần thưởng cho máy. Nhưng Intrinsic Motivation giống như con người, là khát khao tự thân. Tò mò không thể đem lại tiền bạc, đánh giá cao trong xã hội nhưng nó làm cho mình thích thú. Tôi đang nghiên cứu về AI để AI có mong muốn tự thân.

Thế thì AI sẽ như con người, bởi vì nó có trái tim?

Đúng rồi. AI sẽ có trái tim. Và với mong muốn tự thân này, tôi hy vọng sẽ làm cho nó thông minh hơn. Nó sẽ đánh giá cao những thứ, những kiến thức, những chu trình lịch sử của con người. Vì sao những khát khao và những thất bại trong lịch sử của con người tạo ra chúng ta ngày hôm nay? Làm cho AI tò mò về con người chính là cách AI nhận ra rằng con người thật sự rất vĩ đại. Đó là một nghiên cứu mà tôi đang thúc đẩy ở Google, là để cho AI có mong muốn tự thân.

AI sẽ thấy rằng những chu trình lịch sử và những kiến thức mà mình dạy cho nó là có giá trị. Sau này, hy vọng nó sẽ giúp cho AI không chỉ đơn thuần muốn tạo ra nhiều tiền bạc, mà còn tạo ra những giá trị và đánh giá cao con người. Tức là giống như ba định luật của Asimov. Intrinsic Motivation - mong muốn tự thân - sẽ giúp cho máy tính đạt được ba định luật này của AI.

Giờ đây khi công nghệ đã quá phát triển, với những người làm trong nghề như anh, khi anh quan sát, anh có thấy con người vẫn thực sự biết vì sao máy đưa ra những quyết định hay không? Chúng ta có kiểm soát được cách mà máy đang tính toán, dự đoán hay ước đoán không?

Câu hỏi này có nhiều vế. Thứ nhất, chúng ta có hiểu máy tính đang làm gì không? Máy học như thế nào, tư duy, nhận thức ra sao?

Thực ra, hiểu biết của chúng ta về cách tư duy và học tập của máy tính còn rất hạn chế. Cách ta nên suy nghĩ là hiểu biết của chúng ta về các mô hình AI giống như hiểu biết của chúng ta về bộ não con người, tức là ta không biết nhiều lắm, nó rất bí ẩn.

Cái ta biết nhiều nhất là qua dữ liệu. Nếu dạy nó toán cấp II thì nó nhiều nhất cũng chỉ làm toán cấp II. Nếu dạy nó thêm toán cấp III, nó nhiều nhất cũng chỉ làm toán cấp III. Nhưng gần đây, máy tính bắt đầu phát triển khả năng tư duy làm nhiều hơn một chút. Tức là nếu ta dạy toán cấp III, nó có thể giải quyết những bài toán ngoài tầm cấp III một chút. Nó làm được. Đó gọi là tư duy, nhưng sự hiểu biết của ta vẫn rất hạn chế. Chúng ta hiểu biết qua nhiều nhất chính là dữ liệu. Nếu muốn biết máy làm gì hay tại sao có kết quả này thì thông thường, nghiên cứu sẽ phải nhìn lại dữ liệu và xem dữ liệu nào liên quan đến câu hỏi và cách trả lời đó.

Liệu ta có kiểm soát được nó hay không? Thật ra từ "kiểm soát" có nhiều cách hiểu. Ví dụ, nếu mình có con, thỉnh thoảng nó đi chơi mà mình không biết nó chơi gì, tức là mình vẫn có thể quản lý được nó. Mô hình máy tính hiện tại của chúng ta cũng tương tự. Có những thứ mình không biết rõ nó đang làm gì, nhưng tổng quát mà nói là chúng ta đang nắm quyền kiểm soát. Nghĩa là ta có thể cho nó học lại nếu nó đưa ra những kết quả sai, ta sẽ tạo ra dữ liệu để nó học và tránh những trường hợp đó.

Nếu máy đưa ra kết quả có thể gây hại cho con người, ta sẽ tạo dữ liệu để chống lại cái đó, đa số cũng là qua dữ liệu. Nói chung là chúng ta kiểm soát.

Hiện có thêm một vấn đề khác đang được nghiên cứu, gọi là "agent". Đây là vấn đề rất xa. Ví dụ, tạo ra một công ty tự vận hành, có thể kết hợp nhiều phần mềm khác nhau, trong đó có mô hình ngôn ngữ học. Những mô hình ngôn ngữ học, mô hình ngôn ngữ lớn khi kết hợp có thể tạo ra một chương trình rất nguy hiểm. Chúng ta đang không kiểm soát được điều đó. Sự không kiểm soát được này, không do năng lực con người có kiểm soát hay không, mà là vấn đề là "misuse" (lạm dụng). Có những người xấu tính, lạm dụng các mô hình này để làm điều sai trái. 

Tác động của AI tới xã hội loài người có thể tạo ra tương lai mà chúng ta không thể hình dung được. Một mặt nó thúc đẩy năng suất, thay đổi cách vận hành, nhưng cũng có thể dẫn đến khả năng con người bị diệt vong. Anh thiên về quan điểm nào? Diệt vong (doom) hay sẽ bùng phát (boom)?

Tôi đứng về boom và nghĩ 95% sẽ bùng phát, có thể cao hơn nữa. Tôi đã đọc rất nhiều nghiên cứu và tài liệu về các mô hình này và nhận ra rằng AI sẽ không thể thay thế hoàn toàn công việc của con người. Ví dụ, trong lĩnh vực dịch vụ IT, mô hình giỏi nhất cũng chỉ có thể giải quyết được 80-90% công việc của một người, còn lại 10-20% vẫn cần sự tương tác với con người.

Bởi vậy, thay vì nghĩ rằng nó là doom, tức là rất lo ngại và không muốn dùng nó, tôi nghĩ nên dùng AI nhiều hơn. Đối với đa số công việc, những người biết sử dụng AI sẽ thành công hơn những người không sử dụng. Do đó, tôi khuyến khích mọi người thích dùng AI nhiều hơn. Nó sẽ làm cho năng suất trong xã hội tăng lên.

Có những lo ngại, như Elon Musk từng bày tỏ quan điểm, tôi nghĩ là bởi Elon Musk là một người suy nghĩ rất xa, 50 năm hay cả 100 năm tới. Nhưng 50 năm nữa tương lai của thế giới rất khó đoán, có quá nhiều biến số. Ví dụ như 15 năm trước, ta cũng không biết thế giới sẽ đến mức như thế này.

Nghĩ về mặt tương lai của nhân loại, tôi nghĩ AI là tốt. Nó giống như sự phát minh ra đầu máy xe lửa hay đầu máy hơi nước. Đó là những công cụ thay đổi diện mạo xã hội và nâng cao năng suất lao động, kéo dài tuổi thọ con người. Thay vì phải làm việc nhiều hơn, chúng ta sẽ giảm số lượng công việc và chỉ tập trung vào những việc thực sự cần thiết. AI sẽ giúp chúng ta làm những việc như thế.

Lê Viết Quốc là học sinh xuất sắc của Trường Quốc học Huế trước khi có bằng cử nhân kỹ sư phần mềm hạng ưu tại Đại học Quốc gia Úc và bằng tiến sĩ khoa học máy tính tại Đại học Stanford. Năm 2014, anh được tạp chí Technology Review của MIT vinh danh là một trong những nhà phát minh dưới 35 tuổi xuất sắc nhất thế giới. Nghiên cứu của Quốc nhận được hàng loạt giải thưởng tại các hội nghị quốc tế về AI.

Bình luận Xem thêm
Bình luận (0)
Xem thêm bình luận