Nghiên cứu của nhóm Pellegrino et al., (2011) được tiến hành trên 7 ngôn ngữ: Anh, Đức, Pháp, Ý, Nhật, Quan Thoại, và Tây Ban Nha, với tiếng Việt được chọn làm điểm tham chiếu (làm cơ sở để so sánh với các ngôn ngữ khác). Kết quả cho thấy tiếng Việt có mật độ thông tin cao nhất (=1), các ngôn ngữ khác đều có mật độ thấp hơn (<1) so với tiếng Việt (hình 1), các ngôn ngữ có mật độ thông tin gần nhất so với tiếng Việt là tiếng Anh và tiếng Quan Thoại.
Tiếng Việt có mật độ thông tin cao nhất trong 8 ngôn ngữ trong nghiên cứu.
Tiếng Việt xếp đầu trong bảng xếp hạng 17 ngôn ngữ với 8 bit cho mỗi âm tiết.
Trong đó, nghiên cứu cũng đề cập đến trường hợp của tiếng Nhật với mật độ thông tin chỉ bằng một nửa so với tiếng Việt (1 so với 0.49), có nghĩa là ở cùng một tốc độ, tiếng Việt truyền thông tin gấp đôi so với tiếng Nhật. Nếu tiếng Nhật nói nhanh gấp đôi tiếng Việt, thì cũng chỉ truyền thông tin tương đương khi tiếng Việt nói với một nửa tốc độ của tiếng Nhật.
Nghiên cứu của Coupé et al., (2019) được thực hiện trên 17 ngôn ngữ (Basque & Catalan (Tây Ban Nha), tiếng Đức, tiếng Anh, tiếng Pháp, tiếng Ý, tiếng Tây Ban Nha, tiếng Serbia, tiếng Nhật, tiếng Hàn, Tiếng Quan Thoại, tiếng Quảng Đông, Thái, Thổ Nhĩ Kỳ, Phần Lan và Hungary) cũng cho thấy kết quả tương tự, tiếng Việt là ngôn ngữ có mật độ thông tin cao nhất trong 17 ngôn ngữ được nghiên cứu.
Nghiên cứu đã tính toán mật độ thông tin của từng ngôn ngữ theo đơn vị bit - cùng một đơn vị mô tả tốc độ truyền thông tin của điện thoại di động, máy tính xách tay hoặc modem máy tính. Họ phát hiện ra rằng tiếng Nhật, chỉ có 643 âm tiết, có mật độ thông tin khoảng 5 bit cho mỗi âm tiết; trong khi tiếng Anh, với 6949 âm tiết, có mật độ chỉ hơn 7 bit cho mỗi âm tiết. Tiếng Việt, với hệ thống sáu thanh điệu phức tạp (mỗi thanh điệu có thể phân biệt thêm một âm tiết), đứng đầu bảng xếp hạng với 8 bit cho mỗi âm tiết (hình 2).
Các nghiên cứu này rất thú vị, giúp chúng ta biết thêm được một thông tin quan trọng về tiếng Việt. Trong cảm quan thường ngày, chúng ta có cảm giác tiếng Việt là một ngữ cô đọng, hàm súc, 'nói ít hiểu nhiều'; nghiên cứu này đã làm rõ hơn cảm nhận đó, tiếng Việt là ngôn ngữ có mật độ thông tin cao nhất khi được so sánh với nhiều ngôn ngữ trên thế giới.
Ngôn ngữ cô đọng, đơn giản, có mật độ truyền thông tin cao cũng phần nào thể hiện được sự phát triển trong tư duy của những người nói ngôn ngữ đó, khả năng tư duy có thể giúp rút ngắn được số lượng các từ cần nói để có thể diễn đạt ý của người muốn nói, từ đó hình thành nên 'chất lượng' của ngôn ngữ được thể hiện qua mật độ thông tin.
Đó cũng là một phần quan trọng trong di sản văn hóa của dân tộc Việt, tiếng Việt là ngôn ngữ mà người Việt đã giữ gìn từ thời Hùng Vương, vượt qua 1000 năm Bắc thuộc và qua những trắc trở của lịch sử, phát triển hoàn thiện tới ngôn ngữ cô đọng ngày nay mà chúng ta đang dùng.
Như Phạm Quỳnh đã nói: 'tiếng ta còn thì nước ta còn', tiếng Việt là tinh hoa, cũng chính là bản sắc, là linh hồn của văn hóa Việt, giúp dân tộc Việt còn đứng vững tới ngày hôm nay và mãi mãi sau này.
Việc hiểu được giá trị tiếng Việt qua nghiên cứu cũng là một nhắc nhở để chúng ta biết mình được kế thừa một di sản to lớn như thế nào, từ đó giữ gìn và góp phần làm giàu thêm ngôn ngữ vốn có của dân tộc. '