Các nhà ngữ học lịch sử làm việc giống như các nhà khảo cổ. Họ bắt đầu tìm tòi ở tầng đất trên mặt, là những tiếng nói mà thời nay người ta đang dùng. Tìm trong một số ngôn ngữ đó xem chúng có những điểm tương tự nào, trong từ vựng, trong cú pháp. Nếu có, sẽ thử nêu giả thuyết chúng bắt nguồn từ cùng một ngôn ngữ gốc, do cùng một mẹ sinh ra; đã biến đổi qua thời gian, dần dần khác nhau vì sống cách biệt. Sau đó lại đào sâu xuống nhiều tầng ngôn ngữ trong quá khứ, để xem trong số các ngôn ngữ cổ này có những nhóm nào chung một tổ tiên đời xưa hơn nữa hay không; đem xếp các tiếng nói đó vào một gia đình hay một họ.
Khi đào sới các tầng đất ngôn ngữ, người ta căn cứ vào những dấu hiệu nào để so sánh? Một điểm khởi hành đơn giản là các từ vựng, các chữ lẻ. Vào thời xa xưa nhất, loài người đã phát ra những âm thanh để gọi đất, cây, nước, lửa, sáng, tối, vân vân, những hiện tượng tự nhiên cần phải thông báo cho nhau trong cuộc mưu sinh và tự vệ. Những tiếng, những từ chỉ các hiện tượng thiên nhiên đó trong nhiều thứ tiếng mà giống nhau, chắc chúng có chung một ngôn ngữ gốc. Chẳng hạn, các từ vựng cùng chỉ một sự vật (thí dụ, lá cây, nước) hay một hành động (thí dụ, ăn, chạy, leo, trèo). Những tiếng giống nhau khi gọi cha, gọi mẹ; hay để chỉ các bộ phận trên thân thể, tay, chân, mặt. Những tiếng đó khi nói lên nghe thấy tương tự mũi thì chắc có họ hàng với nhau. So sánh như vậy, sẽ thấy nhiều giống dân ở cách rất xa nhưng chắc có họ hàng, vì tiếng nói cùng một gốc. Tổ tiên họ đời xưa tách ra thành nhiều nhóm, đi về các hướng khác nhau, trước đây hàng ngàn, chục ngàn năm, nhưng các tiếng nói chỉ mưa, gió, đi, đứng, mặt mũi, vẫn giữ được dấu tích cũ.
Người ta lại đi xa hơn nữa, quan sát nhiều yếu tố trong cách phát âm, cách ghép các âm tiết, theo phương pháp phân tích trong ngữ học. Có tiếng nói không dùng thanh điệu, khi họ nói “ba” hay “bà,” “bá” thì cùng một nghĩa, như tiếng Pháp. Có tiếng nói thì khi một âm tiết đổi giọng cao lên hay trầm xuống thì ý nghĩa thay đổi, như tiếng Việt. Có ngôn ngữ chỉ dùng những từ đơn âm tiết như tiếng Việt, tiếng Hoa; có khi dùng nhiều âm tiết để tạo nên một từ, như tiếng Nhật, tiếng Anh. Cách người ta ghép các từ lại với nhau, gọi là cú pháp, hay văn phạm, cũng biến ra nhiều kiểu. Đào xới các ngôn ngữ để quan sát những đặc điểm như trên, có thể xếp loại những tiếng nói giống nhau vào từng họ (family) trong mỗi họ có nhiều nhóm, rồi mỗi nhóm tách thành nhiều nhóm nhỏ. Nhưng phải coi chừng khi chỉ phân tích, so sánh các từ vựng. Tiếng Việt và tiếng Nhật có rất nhiều từ vựng giống tiếng Trung Hoa; nhưng cả ba thuộc các họ ngôn ngữ khác biệt. Đào xuống sâu hơn mới thấy là cấu trúc ba ngôn ngữ này khác nhau, tức là người ta ghép các từ vựng lại theo những cách khác nhau.
Hiện tượng một ngôn ngữ truyền từ vùng này sang vùng khác, hoặc gây ảnh hưởng trên một ngôn ngữ khác đã diễn ra qua các cuộc di dân, hay vì các sắc dân gặp gỡ qua những cuộc trao đổi mua bán, hoặc sau các cuộc chiến tranh, chinh phục. Những hiện tượng đó đã diễn ra trong thời tiền sử, hàng chục ngàn năm trước, và kéo dài cả ngàn năm. Không ngôn ngữ nào có thể nói là “thuần giống.” Dùng chung một ngôn ngữ cũng không có nghĩa là người ta chung một chủng tộc. Nói cho cùng thì 50, hay 60,000 năm trước đây tổ tiên loài người chắc nói chung một ngôn ngữ, khi cùng xuất hành từ Phi châu rồi di chuyển đi khắp các lục địa. Các nhóm di dân chia tay nhau, sống cách biệt, ngôn ngữ của họ phát triển theo những hướng khác nhau. Sau đó mỗi nhóm người lại chia ra nhiều nhánh đi sống ở các miền xa cách hơn, tiếng nói của họ lại biến hóa theo nhiều con đường, càng ngày càng phức tạp, sau năm, mười ngàn năm không thể “nói cho nhau nghe” được nữa! Cho nên mới có chuyện “Tháp Babel” trong Kinh Thánh, kể chuyện Thượng Đế hóa phép làm cho mỗi nhóm người nói một thứ tiếng để họ khó hợp tác làm nhà chọc trời, cho bớt tính kiêu ngạo đi. Nhưng cái ngã mạn của con người rất khó sửa. Một hậu quả không ngờ là sau đó lại có những nhóm vẫn kiêu ngạo, tự coi tiếng mình nói mới là hay, là đẹp, là “văn minh.” Có người còn quả quyết ngôn ngữ dân mình là mẹ đẻ ra các ngôn ngữ khác! Người Hy Lạp gọi những giống dân nói khác mình là “barbarophonos” nghĩa là bọn người nói toàn những tiếng “ba ba,” lộn xộn, không hiểu nổi! Sau này, người Tây phương thấy những người nói tiếng khác mình đều là dân “man di” (barbares, barbarians)!
Ở phía Đông lục địa châu Á, có mấy họ ngôn ngữ chính đã giao thoa và pha trộn với nhau, tiếng trong nghề gọi là “sprachbund.” Có các ngôn ngữ gốc là Hoa Tạng (Sino-Tibetan), Thái, hay Tai–Kadai, tiếng Mon–Khmer thuộc họ Nam Á, tiếng Nam Đảo hay tiếng Mèo (Hmong–Mien). Những người nói tiếng nói thuộc họ Nam Đảo (Austronesian), chưa thấy liên hệ chủng tộc rõ ràng; nhưng thuộc cùng một “họ ngôn ngữ” vì tiếp xúc, trao đổi với nhau trong nhiều ngàn năm. Trên toàn thể Á châu còn có những họ ngôn ngữ khác như tiếng Ấn – Ba Tư (Indo-Iranian), tiếng Munda, và Dravidian ở Ấn Độ, tiếng Thổ (Turkic), Mông Cổ (Mongolic). Tiếng Nhật Bản và Cao Ly đứng riêng, có thể xuất phát từ một họ ngôn ngữ gọi là Altaic, trong đó bao gồm cả tiếng nói của người Mông Cổ và người Thổ miền Trung Á và tại Thổ Nhĩ Kỳ bây giờ.
Nhiều tiếng nói vùng Á Đông chia sẻ các đặc tính giống nhau tuy không cùng một họ; chắc là do các tiếp xúc và trao đổi. Thí dụ, các tiếng Thái, Miến, Lào, Hmong, Trung Hoa, Tây Tạng và Việt Nam cùng là đơn âm tiết và có thanh điệu, mỗi tiếng một âm có đủ nghĩa, khi lên xuống bổng trầm thì đổi nghĩa. Nhưng trong số đó chỉ có tiếng Hoa và Tạng, hoặc Thái và Lào là thuộc cùng một gốc. Nghiên cứu tiếng nói thời cổ cho thấy tiếng Hoa, Tây Tạng, Miến Điện, Việt Nam trước kia không có thanh điệu. Các người nói tiếng này đã “đổi giọng” chắc nhờ giao tiếp với những người nói tiếng Tai–Kadai và Hmong–Mien, hai ngôn ngữ có thanh điệu từ thời rất xưa.
Việc xếp loại các ngôn ngữ trên đây đều chỉ là những giả thuyết, và còn được bàn cãi chưa xong. Có người xếp tiếng Tai–Kadai và Nam Á vào cùng một họ. Một giả thuyết nữa gộp tiếng Hoa với ngôn ngữ Nam Đảo. Nhiều người Trung Quốc nghiên cứu lịch sử ngôn ngữ thấy các tiếng Tai–Kadai, Hmong–Mien và Hoa Tạng cùng một gốc, trong khi nhiều nhà nghiên cứu Tây phương cho rằng chỉ tiếng Hoa và Tạng-Miến thuộc cùng một họ mà thôi.
Họ ngôn ngữ Hoa Tạng (Sino-Tibetan) đi từ cao nguyên Tây Tạng tiến xuống miền Bắc Trung Quốc khoảng cuối thiên niên kỷ thứ 5 Trước Công Nguyên, rồi tràn xuống miền Nam Trung Quốc. Một ngàn năm sau, những người nói ngôn ngữ Nam Đảo (Austronesian) từ miền Nam Trung Quốc đi sang Đài Loan rồi tỏa rộng tới các miền ven biển và các quần đảo, từ Phi Luật Tân, Indonesia, lan đi khắp miền Nam Thái Bình Dương. Trong cùng thời gian đó, tiếng Nam Á (Austroasiatic) từ Ấn Độ đi về phía Đông tới vùng trong lục địa Đông Nam Á và vùng Hoa Nam. Những người nói ngôn ngữ Thái Kadai và Miao-Yao đã từ Trung Quốc đi xuống miền Đông Nam Á trên đất liền vào khoảng đầu thiên niên kỷ thứ nhất trước Công Nguyên.
Cuộc di dân lớn của các thuyền nhân đưa tiếng nói của họ từ miền Nam lục địa Á Châu đi ra biển, về phía Đông rồi xuống các hòn đảo ở phía Nam. Khảo sát tiếng nói của các sắc dân sống trong đó mới thấy có họ hàng. Một cuộc di dân khác đem những người nói tiếng Tai Kadai xuống vùng Đông Nam Á, trong đó có nước ta, ở Việt Nam là tiếng Tày-Thái. Những di dân từ lục địa tới pha trộn các yếu tố Tày-Thái với ngôn ngữ Nam Đảo. Một nhịp cầu nối hai ngôn ngữ này được thiết lập khi có nhà ngữ học quan sát một nhóm ngôn ngữ gọi là “Kadai,” gồm những tiếng nói được dùng trong nhiều bộ lạc sống ở vùng sâu từ dẫy Trường Sơn đi vào trong lục địa Đông Nam Á. Tiếng nói của những nhóm thiểu số này còn giữ được nhiều đặc tính của hai giòng kết hợp Thái và Nam Đảo chưa biến thái, vì họ ít tiếp xúc với các tiếng nói khác. Khi tới Việt Nam thứ tiếng Thái pha Nam Đảo này lại gặp ngôn ngữ Môn-Khơ Me mà dân bản địa đã sử dụng từ nhiều đời trước. Cuộc gặp gỡ đó tạo thành tiếng “Việt-Mường,” sau này lại chia ra làm hai ngành là tiếng Mường và tiếng Việt, tạo thêm nhiều thanh điệu phong phú hơn.
Khi đến miền châu thổ sông Cái (Hồng Hà) rồi lan xuống đến sông Mã, sông Chu các đám di dân mới đã may mắn tìm thấy một vùng đất mầu mỡ do các con sông bồi đắp hàng ngàn triệu năm trước. Những người nói tiếng Thái Kadai gặp gỡ các nhóm dân đã tới từ trước thuộc ngôn ngữ Nam Đảo đã pha trộn với tiếng Môn – Khơ Me gốc Nam Á, thứ tiếng nói phát xuất từ miền Assam ở phía Tây Hy Mã Lạp Sơn. Các nhóm dân mới cũ hợp lại, giống như cuộc hôn nhân giữa Rồng từ biển vào với Tiên từ trên núi xuống. Họ sống chung, phát triển nông nghiệp trồng lúa nước, sản xuất thực phẩm dư dùng, để lại các dấu tích của nền văn minh Phùng Nguyên, hơn 1000 năm trước Công Nguyên. Người ta tìm ra cách trồng mỗi năm hai mùa lúa, trồng các loại củ ăn được, thừa thức ăn nuôi người lo việc khai mỏ, nấu đồng; có thời giờ nhàn rỗi để ca hát, múa may với y phục mặc áo đội mũ hình lông chim; cùng nhau tạo nên một nếp sống tiến bộ, hình ảnh còn để lại trên các di tích văn minh Hòa Bình, Đông Sơn mà các nhà khảo cổ đã tìm thấy. Sau hàng ngàn năm, các giống người này phối hợp thành một dân tộc, với các phong tục, tập quán, tín ngưỡng riêng, và sử dụng một ngôn ngữ riêng. Nền tảng của tiếng Việt đã thành hình trong mấy ngàn năm trước Công Nguyên; trước khi tiếp xúc với ngôn ngữ và chữ viết của người Hán.
Những tầng tiếng Việt
Không một ngôn ngữ nào đang dùng trên thế giới còn thuần nhất, tất cả đều chịu ảnh hưởng lẫn nhau; đó là sự thật đầu tiên chúng ta phải công nhận. Cho nên khi tìm hiểu xem tiếng Việt khác tiếng Trung Hoa như thế nào, chúng ta cũng biết trước rằng cả hai ngôn ngữ đó trong quá khứ đã cùng bị ảnh hưởng của những ngôn ngữ thứ ba, thứ tư khác; rồi sau đó tiếng Việt chịu ảnh hưởng của tiếng Hoa. Hiện tượng pha chế ngôn ngữ tương tự diễn ra khắp vùng đất liền ở Đông Nam Á; mỗi sắc dân đi về một hướng riêng tạo ra nhiều ngôn ngữ nhỏ hơn.
Tiếng Việt do nhiều tầng ngôn ngữ kết hợp. Nhà ngữ học Cao Xuân Hạo nêu lên những thí dụ về những tiếng thông thường mà chúng ta nghĩ là “tiếng Việt thuần túy;” nhưng tìm đến gốc gác sẽ thấy chúng thuộc nhiều tầng lịch sử. Những tiếng thông thường gọi con Chim (gốc Môn – Khờ me), Cá (Nam Á), Thỏ (Trung Hoa), vân vân, cho thấy mỗi ngày chúng ta vẫn sử dụng nhiều tầng ngôn ngữ. Nguyễn Du viết lời Tú Bà mắng Thúy Kiều: “Lão kia có giở bài bây, …;” Đào Duy Anh trong Từ điển Truyện Kiều” giải thích “bài bây” gốc tiếng Khơ Me: “Pai là cẩu thả, Piay là hư hỏng, bài bây ở đây nghĩa là xấu xa.” Khi sử dụng tiếng Việt chúng ta ít để ý rằng những tiếng để đếm như Một, Hai, Ba, vân vân, đều gốc từ tiếng Nam Á, nhưng khi đếm từ Vạn, Triệu trở lên thì lại dùng các từ gốc chữ Hán. Các tiếng nói về bộ phận như Mặt, Mũi, Miệng; hay thiên nhiên như Trời, Đất, Trăng, Gió; rồi tới các tiếng trong đời sống hàng ngày như Đi, Chạy, Bắn, Sông, Cá, vân vân đều có gốc Nam Á. Những tiếng Gà, Vịt, Cứng, Rụng, cho tới các bộ phận Bụng, Cổ, Lưng lại gốc từ tiếng Thái. Nói “Đất Thịt” (đất không có cát, không sũng nước, không phải đất sét), là nói như tiếng Tầy, một sắc dân thiểu số ở nước ta. Trên các tầng ngôn ngữ căn bản đó, mới thu nhận thêm một tầng các từ vựng mà người Hán mang tới sau, được biến đổi theo lối phát âm của người Việt. Các từ Hán Việt chỉ tăng bổ cho kho ngữ vựng nhưng không thay đổi cơ cấu tiếng Việt.
Các nhà ngữ học hiện nay đồng ý với giả thuyết của Haudricourt rằng nền tảng của tiếng Việt là tiếng Môn-Khơ Me, một hệ ngôn ngữ trải rộng trong vùng đất ở hai bên Trường Sơn, lên đến miền Tây Bắc Việt, và kéo vào trong lục địa Đông Nam Á tới Campuchia, Miến Điện. Tiếng Môn-Khơ Me cổ nhất hiện còn nhiều sắc tộc dùng, họ sống rải rác trên các cao nguyên ở Lào, Việt Nam và Thái Lan. Ngôn ngữ Môn-Khơ Me cũng lan tới cả một số vùng ở Trung Quốc, các nơi gần bờ biển, nhưng không nhiều người dùng như trong vùng Đông Nam Á.
Nhiều sắc tộc ở miền cao nguyên Việt Nam nay vẫn nói những thứ tiếng rất cổ trong họ Môn – Khơ me như ngôn ngữ của người Bahnar, Sedang, Bơnam, Rơngao, Cua, Hre trong vùng Kontum; tiếng Mnong Gar, Mnong Biat, Chrao, Koho ở phía Nam cao nguyên Trung phần; tiếng Katu, Bru, Pơkoh ở vùng cao tại Nam Phần; tiếng người Thượng ở Boloven, người Laven, Alak vùng Nam Lào; người Kui ở miền Đông Thái Lan; và tiếng Khmer mà người Campuchia còn sử dụng.
Môn – Khờ Me được coi là một trong những ngôn ngữ cùng họ tiếng Nam Á. Trong thời xa xưa ngôn ngữ Nam Á được phổ biến trong những vùng từ Đông Bắc lục địa Ấn Độ, Assam, qua Miến Điện và miền Nam Trung Hoa. Trong các ngôn ngữ gốc Nam Á thì tiếng Việt là một thứ tiếng hiếm hoi có thanh điệu (sắc, huyền, hỏi, ngã, nặng). Vì cách nói có thanh điệu này mà trước đây nhiều người chưa tìm hiểu đã nghĩ rằng tiếng Việt cũng là một chi nhánh của tiếng Trung Hoa.
Đầu thế kỷ 20 nhà nghiên cứu người Pháp Maspero căn cứ vào yếu tố thanh điệu đưa ra giả thuyết gốc của tiếng Việt – Mường là tiếng Thái. Sau này mọi người đã bỏ qua ý kiến đó. Giả thuyết gốc Môn – Khờ Me do nhà ngữ học Haudricourt nêu lên vào năm 1954, hiện nay được đa số công nhận là có chứng cớ vững hơn cả. Từ gốc đó, tiếng Việt – Mường gặp tiếng Thái nên có thanh điệu, tách khỏi các tiếng nói “anh chị em” khác cùng trong họ Môn – Khờ Me. Haudricourt cho biết tiếng Việt lúc đầu kỷ nguyên Tây Lịch chỉ dùng 3 thanh điệu. Đến thế kỷ 12 mới phát triển thành sáu thanh điệu như bây giờ.
Nền tảng tiếng Việt và Mường là ngôn ngữ Môn-Khơ Me, cơ chế vận hành lấy từ tiếng Tày Thái đem vào. Điều này cho phép chúng ta nghĩ rằng khi hai khối dân gặp nhau ở vùng châu thổ sông Cái, sông Mã, số người nói tiếng Môn-Khơ Me đã tới đó từ nhiều thế kỷ trước nên đông đúc hơn so với đám người nói tiếng Tầy-Thái đến sau. Hiện nay còn một số người trong các bộ lạc Chứt và Poọng ở miền núi phía Tây Quảng Bình vẫn nói thứ tiếng “Tiền Việt – Mường” cổ xưa, trong đó gốc Môn-Khơ Me còn chưa biến dạng bởi ảnh hưởng Tầy-Thái, như trong tiếng Mường và Việt bây giờ. P.E. Souvignet, trong sách Les Origines de la langue annamite (1922), đếm được 1088 tiếng Việt giống tiếng Môn-Khơ Me; như dùng trong các số đếm, các bộ phận thân thể, cây cối, trời đất, vân vân.
Nhà ngữ học Nguyễn Tài Cẩn nêu giả thiết rằng tiếng Việt được hình thành trong khoảng 12 thế kỷ, với hai lần tách đôi, ông gọi là “lưỡng phân.” Lần đầu khi một Ngôn Ngữ Mẹ được chia ra hai nhóm; một là Việt – Mường ở phía Bắc; hai là Pọng – Chứt ở phía Nam. Lần thứ hai, sau khi tiếp xúc với người Hán lại chia đôi lần nữa: Người miền đồng bằng bị ảnh hưởng của tiếng Hoa hơn những người ở miền núi, ảnh hưởng ở vùng sông Hồng mạnh hơn vùng phía Nam, cho nên dần dần tách ra hai nhánh mới, Việt và Mường.
Nhà ngữ học Phạm Đức Dương đã ghi lại nhiều thí dụ trong tiếng Việt hiện nay là kết hợp của một từ gốc tiếng Việt cổ, ghép với một tiếng Tầy hay Thái để tạo thành một từ mới có nghĩa. Cách kết hợp nhằm tạo tiếng mới để diễn tả một nghĩa rộng hơn thay cho tiếng cũ; hoặc để diễn tả cho nghĩa rõ ràng hơn. Thí dụ trong từ “dao phay,” tiếng Việt dao đứng trước tiếng phay gốc Thái; tiếng phay cũng nghĩa là con dao, ở đây được ghép vào để định rõ một loại dao có hình dạng riêng, lớn hơn con dao bài. Những từ khác như cá mú, lược bí, mưa phùn, mặt nạ, vân vân cũng kết hợp tiếng Việt với tiếng Thái như vậy.
Cách kết hợp khác nhằm dùng thêm tiếng mới để thay đổi ý nghĩa của tiếng cũ, như chó má. Tiếng má gốc Thái thêm vào đứng sau tiếng Việt để biến đổi thành nghĩa rộng hơn: Chó má nói chung về các loài chó, nhiều thứ chó. Các từ như cỏ giả, cây cối, xin xỏ, nhỏ nhoi, gây gổ cũng kết hợp theo lối làm rộng nghĩa. Những thí dụ ghép tiếng Thái vào sau tiếng Việt có thể kể ra rất nhiều, như: củi đuốc, bơi lội, sợ hãi, tươi tốt, trắng nõn, xanh lè, thơm phức, vân vân; trong đó tiếng gốc Thái mang công dụng thay đổi ý nghĩa tiếng Việt gốc. Trong tiếng Việt có những tiếng Tầy biến dạng như nạc (thịt nạc) gốc tiếng Tầy là “nựa.” Tiếng Tầy nói “phay” chỉ quả dâu (nuôi tằm); nhưng cả hai ngôn ngữ Việt và Tầy đều dùng tên gọi đó, phay hoặc dâu, để chỉ người “con dâu,” điều này chắc không phải tình cờ.
Nghiên cứu ngôn ngữ Tiền-Việt-Mường các nhà ngữ học thấy trong đó còn giữ nhiều từ vựng biểu hiện cuộc sống trong thời kỳ con người còn kiếm ăn bằng việc săn bắt, hái lượm hoặc đốt rừng làm rẫy. Trong ngôn ngữ đó chưa thấy những từ vựng nói về việc làm ruộng. Khi biến chuyển thành ngôn ngữ Việt Mường thì mới có những từ vựng mới, phản ảnh công việc trồng lúa trong ruộng nước. Ông Phạm Đức Dương thấy những tên gọi cây lúa và các loại lúa, các tiếng về việc trồng lúa, cho đến nhiều hành động ăn uống, bếp núc trong tiếng Việt-Mường và Tầy-Thái rất giống nhau. Điều này cho thấy đám dân nói tiếng Tầy-Thái đến sau đã mang thêm nhiều hiểu biết và kỹ thuật canh nông mới mẻ chia sẻ với dân bản địa. Nhiều ngôn ngữ dùng trong gia đình, làng xã, thuộc tiếng Việt-Mường và Tầy-Thái cũng giống nhau. Việc kết hợp ngôn ngữ này phản ảnh những hiện tượng kết hợp khác trong đời sống chung của hai nhóm dân, một nhóm nói tiếng Môn-Khơ Me, một nói tiếng Tầy-Thái. Ngoài hai gốc chính đó, trong ngôn ngữ Việt-Mường cũng chứa đựng các yếu tố lấy từ các ngôn ngữ Mã Lai, Tạng, Miến. Đó là di sản do những cuộc giao tiếp, kết hợp từ đời trước để lại, khi tiếng Thái gặp tiếng Hoa-Tạng; hay tiếng Môn-Khơ Me chung đụng với hệ ngôn ngữ Mã Lai.
Tiếng Việt đã thành hình trên những nền tảng kiên cố lâu đời trước khi tiếp xúc với tiếng Trung Hoa, nhờ thế sau một ngàn năm tổ tiên chúng ta vẫn giữ được, không mất tiếng nói. Trong thời Bắc thuộc, số người Việt giao dịch trực tiếp với người Hán chắc cũng không nhiều lắm. Họ có học tiếng nói của các quan đô hộ thì cũng chỉ dùng trong phạm vi các cuộc giao tiếp với người Hán mà thôi. Những người Việt khác không chung đụng với người Hán thì chỉ nói ngôn ngữ của mình có từ đời trước. Hiện tượng này giống các nông dân Phần Lan trước thế kỷ 18 vẫn bảo vệ ngôn ngữ của họ.
Điều đáng chú ý là khi những người Việt học thêm các chữ Hán phần lớn họ cũng dùng các từ vựng mới khác với lối mà ông thầy dậy. Vì cơ cấu một ngôn ngữ không thể thay đổi một cách dễ dàng. Một lối nói quen thuộc cứ thế mang trong đầu, có khi nói tiếng ngoại quốc mà trong đầu vẫn suy nghĩ và sử dụng ngôn ngữ mới như mình đang nói tiếng mẹ đẻ. Có một giáo sư người Việt Nam dậy cùng trường với tôi, Đại học Québec tại Montréal (UQAM). Ông đã học tiếng Pháp từ nhỏ, lớn lên cũng đi học bên Pháp, rồi sống ở Canada mấy chục năm, trong cộng đồng những người nói tiếng Pháp. Nhưng ông vẫn có thói quen gọi sinh viên “lên bảng” như khi nói tiếng Việt. Thay vì ra lệnh “Đi tới cái bảng, Allez au tableau” như trong tiếng Pháp; ông bảo học trò “Montez au tableau!” Người học trò kinh ngạc, không biết làm sao ông thầy lại bảo mình chèo lên, “monter” lên cái bảng đen! Làm sao leo lên trên tấm bảng đen được? Chỉ vì ông thầy vẫn quen lối nói tiếng Việt: “Lên bảng” có nghĩa là đi tới cái bảng đen.
Hiện tượng người Việt dùng chữ Hán theo lối Việt Nam cho thấy tiếng nói cũng là một lợi khí bảo tồn một truyền thống văn hóa, nhờ thế đưa tới tinh thần tự chủ.