Không dễ có "công chức GPT"

TỊNH ANH 15/03/2023 09:35 GMT+7

TTCT - ChatGPT đã đặt một số chính phủ trước sức hút khó cưỡng của một tương lai mà trí tuệ nhân tạo (AI) có thể thay thế hoặc hỗ trợ công chức để phục vụ người dân.

Công nghệ của hãng OpenAI quả là có thể áp dụng vào rất nhiều lĩnh vực, nhưng với quản lý nhà nước, vấn đề không phải là năng lực của "công chức GPT" mà là các mô hình AI này có thể được trao quyền đến đâu, bởi có nhiều thứ liên quan đến an ninh quốc gia và chủ quyền số.

Làm sao trao dữ liệu nhà nước cho AI?

Những nguy cơ tiềm tàng của việc áp dụng ChatGPT hay một mô hình AI tương tự vào dịch vụ công được tạp chí Analytics India Magazine nêu rõ trong bài "Liệu trợ lý AI này có thể thay đổi quản trị công ở Ấn Độ không?" vào ngày 16-2.

Bài viết mở đầu bằng nhận định của chuyên gia AI và khoa học dữ liệu Anurag Sahay rằng hạn chế lớn nhất của ChatGPT là nó không được đào tạo trên dữ liệu chuyên biệt trong lĩnh vực quản lý nhà nước, chẳng hạn tình trạng thuế của công dân. 

Tất nhiên, một chính quyền địa phương hay chính phủ có thể đặt hàng OpenAI cung cấp công nghệ để huấn luyện một mô hình AI tương tự ChatGPT với dữ liệu phù hợp với nhu cầu cụ thể, song điều này lại dẫn đến vấn đề nghiêm trọng hơn: bản địa hóa dữ liệu (data localization).

Chính phủ Ấn Độ nói riêng và nhiều quốc gia khác đều có các quy định cụ thể về việc lưu trữ dữ liệu người dùng của các nền tảng số. Dữ liệu tạo ra ở Ấn nhưng lại lưu trữ ở hải ngoại sẽ là một vấn đề chính phủ cần lưu tâm.

Ở đây có hai loại dữ liệu: thông tin người dùng (mà theo chính sách quyền riêng tư của OpenAI, ChatGPT có thu thập dữ liệu về địa chỉ IP, cài đặt trình duyệt của người dùng) và thông tin chính thức (dữ liệu công dân, bảo hiểm, y tế, an sinh xã hội) dùng để huấn luyện AI.

OpenAI cũng nêu rõ công ty này có thể chia sẻ thông tin cá nhân của người dùng với "các bên thứ ba mà không cần nêu rõ" để đáp ứng các mục tiêu kinh doanh. Điều này đồng nghĩa dữ liệu nhạy cảm của chính phủ có thể rơi vào tay các bên thứ ba không xác định này, nếu muốn ứng dụng ChatGPT vào dịch vụ công, theo Analytics India Magazine.

Ảnh: Frank Lambert/Adobe

Ảnh: Frank Lambert/Adobe

Anil Kaul, CEO và giám đốc bộ phận AI của Công ty Absolute Data, chỉ ra một vấn đề khác: các tranh cãi liên quan đến quyền riêng tư dữ liệu và đạo đức khi để AI lấy mất việc của con người. "Điều quan trọng là chính phủ phải xem xét cẩn thận những rủi ro này trước khi triển khai ChatGPT hoặc bất kỳ công nghệ AI nào khác, và thực hiện các bước để giảm thiểu chúng càng nhiều càng tốt" - Kaul nhấn mạnh.

Với Ấn Độ, theo các chuyên gia, dù không thể "bê nguyên xi" ChatGPT vào hệ thống dịch vụ công, chính phủ có thể sử dụng công nghệ lõi của nó - mô hình ngôn ngữ lớn (LLM) GPT3.5, được tinh chỉnh với kỹ thuật học tăng cường từ phản hồi của con người (reinforcement learning from human feedback) - để cải thiện, nâng cấp các chatbot sẵn có của nước này, chẳng hạn MyGov Helpdesk - chatbot thông qua WhatsApp của MyGov, cổng dịch vụ chính phủ - công dân của Ấn Độ. 

Sahay tin rằng những mô hình AI chuyên biệt như MyGov Helpdesk có lợi thế hơn ChatGPT vì chúng có thể tiếp cận các nguồn thông tin đặc thù mà công nghệ của OpenAI không thể có được.

Kịch bản lạc quan nhất là thay vì từng chatbot riêng lẻ như kể trên, Ấn Độ có thể phát triển được một chatbot sử dụng LLM duy nhất để tương tác với người dân - thông tin và hướng dẫn cách thực hiện các dịch vụ công, hoặc thông báo tiến độ các dịch vụ đang xử lý, chẳng hạn gia hạn bằng lái.

Có cần ChatGPT viết thay thầy thơ lại?

Quốc gia đã tiến gần hơn cả đến việc ứng dụng ChatGPT vào dịch vụ công là Singapore, với kế hoạch tích hợp AI này vào phần mềm Microsoft Word, nhằm giúp tới 90.000 công chức thực hiện những việc liên quan đến soạn thảo như email, báo cáo nhanh hơn.

Dự án do nhóm Pair thuộc OGP, đơn vị nghiên cứu và phát triển các sản phẩm ứng dụng công nghệ để phục vụ người dân của Chính phủ Singapore, trình bày tại cuộc thi lập trình sáng tạo do nhà nước tổ chức vừa kết thúc hồi tháng 2. 

"Chúng tôi muốn giải phóng công chức, để họ dành sức cho các nhiệm vụ cấp cao hơn. AI này có thể giúp họ gỡ bí với một bản thảo hóc búa hoặc tăng tốc công việc bằng cách tạo email mẫu hoặc thậm chí là bài phát biểu" - Moses Soh, quản lý dự án cao cấp tại OGP, nói với báo The Straits Times.

Trong phần minh họa, chatbot của Pair tóm tắt các đoạn thông tin dài và soạn báo cáo về các chủ đề liên quan đến chính sách trong vòng vài giây. Nó cũng có thể nhận ra thông tin nhạy cảm và loại bỏ chúng ngay lập tức nhằm đảm bảo không để lộ thông tin. Soh cho biết sẽ cung cấp AI này cho các đơn vị dịch vụ công trong vòng 2 tháng tới, bắt đầu từ Văn phòng Quốc gia thông minh và Chính phủ kỹ thuật số (SNDGO).

Một phiên bản khác, có thể truy cập và phân tích thông tin từ các cơ sở dữ liệu chính thức của chính phủ, đang được phát triển và chưa dự kiến ngày công bố. Tất nhiên, nhóm của Soh hiểu rõ các rủi ro về an ninh quốc gia và bảo mật dữ liệu. 

Dự án đã đạt thỏa thuận với Azure, dịch vụ đám mây của Microsoft có chứa máy chủ của OpenAI, bảo đảm rằng dữ liệu do Chính phủ Singapore xử lý sẽ được bảo mật và nằm ngoài tầm mắt của cả Microsoft lẫn OpenAI.

Ảnh: analyticsinsight.net

Ảnh: analyticsinsight.net

Trong một bài viết chung gửi cho Today Online (Singapore) hồi đầu tháng này, ba tác giả gồm Shashi Jayakumar và Benjamin Ang (giám đốc và phó giám đốc CENS - trung tâm chuyên trách an ninh quốc gia thuộc Đại học Công nghệ Nanyang) và Terence Ho (Trường Chính sách công Lý Quang Diệu) chỉ ra những mặt tốt, mặt xấu và các ẩn số khi để công chức Singapore sử dụng ChatGPT.

Nhóm tác giả không phủ nhận ChatGPT có thể giúp công chức viết bản thảo công văn, báo cáo, bài phát biểu, thông cáo báo chí và bài đăng trên mạng xã hội với giọng điệu, độ dài và phong cách chính xác, nhưng cũng đồng thời cảnh báo về hạn chế của AI này, nhất là về tính chính xác của thông tin - điều đã được nói nhiều từ những ngày đầu ChatGPT gây sốt toàn cầu.

Các tác giả đã kiểm tra năng lực ChatGPT bằng cách (1) yêu cầu nó lập danh sách những kẻ cực đoan bị giam giữ theo Đạo luật an ninh nội bộ và (2) hỏi nó Lawrence Wong là ai. 

Trong trường hợp đầu, ChatGPT "bó tay" và cho rằng đây là thông tin được bảo mật (trong khi thực tế nó thuộc phạm vi công cộng), còn với câu sau, nó nói đúng rằng Wong là Bộ trưởng Bộ Tài chính và Phát triển quốc gia, nhưng lờ đi việc ông là đương kim phó thủ tướng Singapore và còn "chế" thêm thông tin không chính xác rằng trước đây ông là giám đốc điều hành cấp cao trong lĩnh vực tài chính ngân hàng.

"Người ta có thể kỳ vọng rằng các lỗi và sự không chính xác này có thể giảm dần theo thời gian, khi AI được huấn luyện tốt hơn với dữ liệu cập nhật hơn... Nhưng những cải tiến trong tương lai sẽ không làm mất đi việc cần có con người để kiểm tra và chịu trách nhiệm về tính chính xác thực tế của nội dung do AI tạo ra" - các tác giả viết.

Về kế hoạch để công chức dùng Word có ChatGPT của nhóm Pair, ba tác giả cho rằng cuộc thử nghiệm ứng dụng ở SNDGO có thể là cơ hội để phát hiện các vấn đề mới phát sinh (điều khó tránh khỏi) và xem công cụ này có thể được tinh chỉnh thế nào, song họ băn khoăn việc có nhất thiết phải tiết kiệm công sức cho công chức trong chuyện gõ văn bản không.

"Liệu công chức có thể hoàn thành xuất sắc các nhiệm vụ cao cấp hơn nếu họ không hiểu các yếu tố cơ bản, chẳng hạn như viết tóm tắt?" - các tác giả viết. Họ cho rằng những kỹ năng mà ChatGPT có thể giúp công chức nhẹ gánh lẽ ra nên được những người kỳ cựu truyền đạt cho thế hệ sau khi họ mới vào nghề.

Tóm lại, theo Jayakumar, Ang và Ho, thông tin nạp vào tốt đến đâu thì ChatGPT hiệu quả đến đấy. Nếu muốn ứng dụng AI này vào dịch vụ công và quản trị nhà nước, dữ liệu nạp cho nó cần phải được làm sạch, loại bỏ dữ liệu không chính xác, không đầy đủ, lỗi thời, không hợp lệ và không nhất quán. "Đây là nhiệm vụ kém hấp dẫn nhất trong khoa học dữ liệu nhưng rất cần thiết, vì dữ liệu bị lỗi sẽ làm giảm giá trị của đầu ra" - các tác giả viết.

Nếu không muốn tích hợp ChatGPT hay sử dụng công nghệ của OpenAI, một quốc gia có thể phát triển một ChatGPT nội địa hay không? Về lý thuyết thì có, nhưng thực tế thì không dễ dàng.

Một ví dụ rõ nhất là Trung Quốc. "Nếu Trung Quốc muốn tạo ChatGPT riêng, chúng ta sẽ cần hàng chục ngàn con chip A100 mới cung cấp đủ sức mạnh điện toán (cho AI đó)" - Zheng Weimin, giáo sư Đại học Thanh hoa, nói với báo South China Morning Post ngày 27-2.

A100 là bộ xử lý đồ họa (GPU) của Hãng Nvidia (Mỹ), được xem là linh kiện chủ lực trong cuộc đua AI. Theo CNBC, công nghệ phát triển A100 ban đầu được sử dụng để hiển thị đồ họa 3D phức tạp trong trò chơi điện tử (vì thế gọi là GPU), nhưng ngày nay nó được cấu hình chuyên để thực hiện các tác vụ học máy và được lắp cho các trung tâm dữ liệu, vận hành hệ thống AI.

Nhờ khả năng thực hiện đồng thời nhiều phép tính đơn giản, điều rất quan trọng đối với việc đào tạo và sử dụng các mô hình mạng thần kinh trong phát triển AI, A100 là bộ xử lý lý tưởng cho các mô hình như ChatGPT, Bing AI hay Stable Diffusion.

Các công ty lớn hay start-up muốn phát triển AI cần phải có hàng trăm hoặc hàng ngàn chip của Nvidia - công ty này chiếm 95% thị phần xử lý đồ họa cho học máy, theo hãng nghiên cứu New Street Research.

Máy chủ DGX-A100 của Nvidia

Máy chủ DGX-A100 của Nvidia

Nvidia còn cung cấp hệ thống máy chủ DGX A100, gắn sẵn tám chip A100, với giá gần 200.000 USD/bộ. Theo New Street Research, mô hình ChatGPT vừa được tích hợp vào bộ máy tìm kiếm Bing của Microsoft cần tám GPU để có thể trả lời một câu hỏi trong vòng dưới 1 giây. Vì thế nếu muốn để toàn bộ người dùng có thể tìm kiếm Bing với ChatGPT, Microsoft sẽ cần khoảng 20.000 hệ thống DGX A100, tức 4 tỉ USD tiền đầu tư hạ tầng.

Vấn đề của Trung Quốc là họ chưa thể phát triển chip có sức mạnh tương đương như A100 (thậm chí chưa bằng được 50 - 70%, theo Yang) và cũng không thể bỏ tiền ra mua từ Mỹ vì A100 nằm trong số ít chip bị kiểm soát xuất khẩu vì lý do an ninh quốc phòng của chính quyền tổng thống Biden. Theo CNBC, Nvidia từng tuyên bố đã chỉnh sửa một số chip xuất sang Trung Quốc để tuân thủ lệnh hạn chế xuất khẩu của chính phủ.

Không chỉ khó làm chip mạnh như A100, ngành sản xuất chip của Trung Quốc cũng sẽ còn gặp nhiều khó khăn khi Mỹ được cho là đã đạt được thỏa thuận để Nhật và Hà Lan cắt giảm xuất khẩu các thiết bị và kỹ thuật sản xuất vật liệu bán dẫn tối quan trọng sang Trung Quốc.

Theo một báo cáo của Trung tâm Nghiên cứu chiến lược và quốc tế (CSIS), Nhật và Hà Lan gần như kiểm soát toàn bộ thị trường cung cấp công cụ in thạch bản, vốn rất quan trọng trong việc sản xuất chip thế hệ kế tiếp.

Bình luận Xem thêm
Bình luận (0)
Xem thêm bình luận