Cái chết của ngôn ngữ trong kỷ nguyên số

MINH THƯ (THEO PLOS ONE) 09/01/2014 03:01 GMT+7

TTCT - Chưa tới 5% ngôn ngữ thế giới hiện nay được dùng trên mạng, theo một nghiên cứu công bố cuối năm 2013 của nhà ngôn ngữ nổi tiếng người Hungary Andras Kornai. 95% ngôn ngữ còn lại có thể bị Internet tống tiễn xuống mồ!


Đây là kết luận rút ra từ một nghiên cứu công bố trên tạp chí Plos One nhan đề “Cái chết số của ngôn ngữ”. Cuộc nghiên cứu nhằm tìm trả lời cho câu hỏi: Có bao nhiêu ngôn ngữ được sử dụng trên không gian kỹ thuật số, và ngược lại có bao nhiêu ngôn ngữ bị “diệt chủng” trên Internet?

Kornai cung cấp con số: Hiện trên thế giới có 7.776 ngôn ngữ được sử dụng “offline”. Để tính được bao nhiêu ngôn ngữ được dùng trên Internet, Kornai thiết kế một chương trình lọc ra những miền web hàng đầu và lập danh mục số từ của mỗi ngôn ngữ trên Internet.

Ông cũng phân tích các trang Wikipedia, được ông cho là chỉ dấu then chốt cho độ lan tỏa của mỗi thứ tiếng, cũng như chọn lựa ngôn ngữ của các hệ điều hành và các bộ kiểm tra chính tả trên Internet. Kết quả: chưa tới 5% ngôn ngữ thế giới hiện hữu trên mạng.

Còn theo Liên minh vì sự đa dạng ngôn ngữ (ALD), hơn 40% ngôn ngữ trên thế giới đang bị đe dọa. Ngay cả những ngôn ngữ mà về kỹ thuật không bị đe dọa biến mất đi nữa có thể cũng chỉ có vài nghìn người sử dụng. Đó là các ngôn ngữ ở vùng châu Phi hạ Sahara, Đông Nam Á và Nam Mỹ, nơi sự thâm nhập của Internet vào đời sống còn thấp.


Nhà nghiên cứu Andras Kornai

Một ngôn ngữ sống về mặt kỹ thuật là ngôn ngữ mà ít nhất vẫn còn một người nói. Cần nhiều năm từ khi một ngôn ngữ bắt đầu suy tàn cho đến khi người cuối cùng sử dụng nó qua đời, trong khi giới trẻ chưa kịp làm quen và đưa vào ứng dụng trong cuộc sống, chẳng hạn trên Internet.

Kornai đưa ra một thí dụ ở Na Uy. Chính phủ nước này công nhận hai phiên bản của tiếng Na Uy: tiếng Bokmal và tiếng Nynorsk. Trong khi Bokmal được coi là phổ biến hơn Nynorsk, với 10-15% người dân, tương đương 500.000-750.000, nói tiếng Nynorsk. Và như thế đủ để ALD không xếp Nynorsk vào nhóm các thứ tiếng “đang gặp nguy cơ”.

Tuy nhiên, phân tích của Kornai chỉ ra rằng chỉ một cộng đồng nhỏ những người nói tiếng Nynorsk sử dụng nó trên mạng, trong khi đa số người Na Uy sử dụng tiếng Bokmal cho quảng cáo, nhạc pop, thời trang, giải trí và thế giới công nghệ... Như vậy, theo cách nói của Kornai, “mặc cho chính sách nhà nước hỗ trợ tiếng Nynorsk, người Na Uy đã chỉ chọn tiếng Bokmal đi theo họ vào kỷ nguyên số”.

Liệu có thể ngăn chặn cái chết của Nynorsk và những ngôn ngữ tương tự? Rất nhiều tổ chức, kể cả Wikipedia và ALD, đầu tư nguồn lực vào công việc này. ALD đã có một bách khoa toàn thư lớn về những ngôn ngữ bị diệt chủng, với những đoạn mẩu văn bản các thứ tiếng đó, như tiếng Nganasan (có 500 người nói, ở Nga) và Maxakali (802 người nói, ở Brazil). Wikipedia có một lô dự án ngôn ngữ mới (hay rất cũ).

Kornai cho rằng để một ngôn ngữ sống sót, rất cần một nhóm những người yêu thích nó, giống như những người đang cầm trịch Wikipedia hay những nhà phát triển các ứng dụng giáo dục trên không gian số. Chẳng hạn người Cherokee (người Mỹ bản địa, trước sống ở các bang Georgia, Bắc và Nam Carolina, Đông Tennessee) đã soạn ra một bộ Cherokee Wiki để người dùng có thể sử dụng tiếng bản xứ Cherokee.

Tuy nhiên ngay cả thế cũng không đủ để giữ một ngôn ngữ lụi tàn có thể sống sót trong dài hạn, nhất là khi có một ngôn ngữ thống trị khác dễ hơn cho người ta sử dụng trên mạng.

Và điều chắc chắn là kho ngôn ngữ tương lai sẽ không giàu có như hiện nay.

Vẽ lại bản đồ lộ trình cho “cái chết” của một ngôn ngữ, Kornai đúc kết như sau: 

1) Người nói tiếng đó ngưng sử dụng nó trong những khu vực thực tiễn như thương mại; 

2) Thế hệ trẻ không còn thích sử dụng ngôn ngữ đó; 

3) Thế hệ trẻ thật sự lãng quên.

Bình luận Xem thêm
Bình luận (0)
Xem thêm bình luận