ĐỂ TIẾN ĐẾN VIỆC
MÁY MÓC HÓA CÔNG TÁC DỊCH THUẬT
Góp ý kiến với Tỳ kheo THÍCH MINH CHÂU
Gần đây, tỳ kheo Thích Minh Châu trong một bài báo đăng trên tạp chí này nhan đề “Thử tìm một đường hướng giáo dục cho Cao đẳng Phật học viện” đã bàn đến một số vấn đề liên quan tới việc giáo dục tăng ni của nền Phật giáo nước ta, trong đó tác giả đã vạch ra một số những nhu cầu, mà một nền giáo dục tăng ni Phật giáo ngày nay đã đáp ứng. Trong những nhu cầu ấy, nhu cầu phiên dịch tam tạng kinh điển ra Việt văn đã không những bao hàm một ý nghĩa trọng đại đối với Phật giáo Việt nam và Phật giáo đồ Việt nam, mà còn bao hàm một ý nghĩa rất trọng đại đối với nền giáo dục Việt nam và người Việt nam. Nói là trọng đại và rất trọng đại, bởi vì hiện nay ở miền Nam này đa số những người có trách nhiệm đại học không những không đứng lên chủ trương những tạp chí khoa học kỹ thuật nhằm làm nơi chốn công bố những thành quả nghiên cứu khoa học kỹ thuật cho nhân dân ta trong tiếng mẹ đẻ của họ và chỉ bằng lòng đi công bố chúng qua những tạp chí khoa học ngoại quốc trong những ngôn ngữ ngoại quốc xa lạ với người Việt nam và sinh viên, học sinh Việt nam, mà còn không thực sự đóng góp vào việc làm phong phú tiếng nước ta qua việc dịch thuật những sách vở ngoại quốc, nhất là những sách vở khoa học và kỹ thuật. Họ chỉ bằng lòng viết ra những luận văn tiếng Pháp tiếng Anh một cách rất thông thạo như một số cha ông họ trước đây đã lấy làm hãnh diện trong việc đọc thuộc lòng những sách vở tiếng Trung quốc và viết ra những văn chương thi phú tiếng Trung quốc một cách hoa mỹ. Nguy hiểm hơn nữa, họ lại là những người có công tác đào tạo ra những người Việt nam có giáo dục, và như vậy, nếu cái đà viết và nghĩ theo ngoại quốc này cứ tiếp tục, những người Việt nam có giáo dục mới này lại bước theo vết chân họ, viết và nghĩ theo ngoại quốc, và lại đi công bố những thành quả nghiên cứu khoa học của họ qua những tạp chí ngoại quốc, như cha anh họ đã làm, thế thì chẳng bao lâu nữa tiếng nước ta, tiếng nói của toàn bộ dân tộc ta, phải thoái bộ và bãi vị như một ngôn ngữ dân tộc, như một ngôn ngữ khoa học và kỹ thuật của kỷ nguyên khoa học và kỹ thuật này, và con cháu ta suốt đời không những phải học và nói cho sửa tiếng mẹ đẻ của chúng, mà còn phải học và nói tiếng của những dân tộc khác để có thể phát biểu tư tưởng của chúng. Tình trạng này càng trở nên nghiêm trọng hơn khi chúng ta nhìn đến những con số thống kê trạng huống trí thực của thời đại ta ngày nay. Chẳng hạn trong số 100% những nhà khoa học đã từng sống trong lịch sử nhân loại, thi hơn 95% những nhà khoa học này hiện đang sống và làm việc trên thế giới, và đa số những thành quả nghiên cứu của phần lớn họ đều xuất bản trong những ngôn ngữ như Anh, Pháp, Nga, Đức, mà một phần đáng kể trong chúng đã đến từ những người đã không chịu viết trong tiếng mẹ đẻ của họ. Và nếu nhìn đến con số thống kê những xuất bản của những chuyên khoa đại học ngày nay, người ta mới thấy chung kếch xù như thế nào. Lấy hóa học làm thí dụ. Chỉ dùng số những công bố, mà Chemical Abstracts của Hội hóa học Mỹ đã toát yếu qua ba phần tư thế kỷ này, người ta nhận ra: là, số những công bố hóa học gấp bội một cách lũy thừa, cứ sau mỗi tám năm: Hội ấy đã toát yếu trong một năm hơn một phần tư triệu công bố hiện nay(1). Trong một viễn tượng như thế, nếu muốn theo kịp với những tiến bộ của những nước khác, ngay cả những nước đã kỹ nghệ hóa ngày nay như Mỹ-Nga-Anh-Pháp cũng đã phải bàn đến công tác dịch thuật những công bố khoa học và kỹ thuật và cách thế để thi hành nó một cách có hệ thống và hữu hiệu nhằm thông báo cho những nhà khoa học của họ những thành quả nghiên cứu của những khoa học gia ngoại quốc, huống nữa là nước ta với một tình trạng kinh tế phải kỹ nghệ hoá, một tình trạng giáo dục phải canh tân và một tình trạng tri thức phải được phong phú. Do vậy, việc tỳ kheo Thích Minh Châu bàn đến công tác dịch thuật trên có ý nghĩa trọng đại và rất trọng đại không những cho những người quan tâm với tình trạng trí thức của nền Phật giáo Việt nam, mà còn cho những ai còn lo nghĩ đến tương lai dân tộc và giáo dục Việt nam. Điều đáng tiếc là thầy chỉ bằng lòng đưa ra một giải pháp dài hạn ngay cả cho việc giải quyết công tác phiên dịch tam tạng kinh điển Phật giáo, đấy là đào tạo ra một số dịch sự cần thiết, chứ khoan nói chi tới đóng góp vào việc giải quyết công tác dịch thuật một cách tổng quát. Chúng tôi vì thế xin đóng góp thêm một vài ý kiến ở đây trước cho việc giải quyết vấn đề phiên dịch những tam tạng kinh điển Phật giáo, mà tỳ kheo Thích Minh Châu đã nêu lên và sau để vạch thử ra một cách thế để giải quyết vấn đề phiên dịch một cách căn đễ nhằm sửa sai tình trạng khuyết hám trên của đời sống trí thức của dân tộc ta. Chúng tôi xin bàn đến việc máy móc hóa công tác dịch thuật.
I
Nói đến việc máy móc hóa công tác dịch thuật hay việc dịch bằng máy ở đây nhất là đối với kinh điển như kinh điển Phật giáo tất sẽ không tránh khỏi những bàn tán dị nghị và đôi khi những chỉ trích xuyên tạc. Điều này, nếu xảy ra ở nước ta hiện nay, dĩ nhiên không phải là không có tiền lệ. Zhirkov(2) trước đây khi bàn một báo cáo của Kulagni và Mel’chuk về khía cạnh ngôn ngữ học của bản dịch bằng máy cuốn sách toán học từ tiếng Pháp ra tiếng Nga đã kể lại cho chúng ta câu chuyện của Smirnov-Troyansky, theo đó Troyansky phát minh ra một phương pháp phiên dịch bằng máy vào năm 1939 và đến nhờ Hàn lâm viện khoa học Số viết nghiên cứu nó về phương diện ngôn ngữ học, nhưng những nhà ngữ học Nga thời đó coi nó như không thực tiễn và hoàn toàn không cần thiết. Đến năm 1944 một đại hội cao cấp những chuyên viên cơ học, kỹ thuật điện học và ngôn ngữ học được triệu tập ở Viện tự động học và viễn cơ học của Hàn lâm viện để bàn về nó và kết quả là những chuyên viên cơ học và điện học tìm cách chứng minh «tính bất khả hữu» của việc dịch bằng máy, và Zhirkov kể tiếp, những chuyên viên này lại nói đến những chuyện như chữ đồng âm dị nghĩa, chữ đồng nghĩa dị âm đến nghĩa bóng nghĩa đen vv… để làm nản lòng việc tạo ra một máy dịch thí nghiệm cỡ nhỏ. Tiền lệ này, xin nhớ là, chỉ xảy ra cách đây hơn 25 năm và do đó không xưa xóc gì cho lắm. Vì vậy, nếu sự cổ xuý việc phiên dịch kinh điển Phật giáo có tạo nên những dị nghị, điều ấy cũng là một thường tình. Điểm quan trọng là, trong khi các nước khác đang nghiên cứu cách thế để hoàn thiện công tác phiên dịch bằng máy, trong ngôn ngữ của nước họ, thì ít nhất nước ta cũng phải bắt đầu sửa soạn bàn đến việc phiên dịch bằng máy những sách vở ngoại quốc ra tiếng ta, hầu đóng góp vào việc giải quyết cái nghèo nàn trí thức hiện nay ở miền Nam này. Không những thế, những người ngoại quốc đã bắt đầu hơn mười năm lại đây nghiên cứu sách ta nhằm dịch sách ta ra tiếng họ. Andreyev chẳng hạn trong một báo cáo cho Hội nghị quốc tế về việc dịch bằng máy đã cho biết là, phòng thí nghiệm phiên dịch bằng máy ở trường Đại học Leningrad của ông đã phát triển một cách tính phân tích độc lập cho tiếng ta. Việc đó, ngoài công tác làm giàu ngôn ngữ và trí thức của dân tộc ta bằng dịch máy, bắt buộc chúng ta phải đóng góp ít nhiều vào việc nghiên cứu tiếng ta trong viễn tượng dịch này cho thế giới. Ngay cả khi gạt bỏ những lý luận này việc phiên dịch bằng máy tự chính nó cũng vẫn đang theo đuổi nhất là đối với nền điển tịch Phật giáo, một nền điển tịch khá phồn tạp và đa biệt. Nếu nhìn lại lịch sử truyền dịch của nền điển tịch này trong những nước khác nhau, chúng ta có thể thấy tại sao giải pháp những dịch sư chỉ là một giải pháp dài hạn.
Hiện nay, kinh điển Phật giáo được bảo tồn trong bốn tạng kinh khác nhau, nếu ta loại bỏ tạng Mông cổ và tạng Mãn châu, cả hai được dịch giữa những thế kỷ 17 và 18, đấy là tạng Phạn vẫn gồm luôn những bản văn thuộc Phạn văn hổn chũng và tục văn, hạng Pali, tạng Hán văn và tạng Tạng văn. Qua bốn tạng này hai tạng Hán và Tạng văn, dù là dịch tạng, đóng một vai trò quan trọng cho việc tìm hiểu Phật giáo không kém gì hai tạng trước và lịch sử truyền dịch của chúng cho ta thấy gì? Về Hán tạng, lịch sử hình thành nó trải dài trên gần một ngàn năm và hoàn toàn thực hiện nhờ vào lịch sử dưới sự bảo trợ của chính quyền đương thời, mà thí dụ nổi bật là Kumarajiya ở Trường an dưới triều Tiên Tấn, Gunabbdra ở Nam kinh dưới triều Lương, Jñàgupta ở Trường an dưới đời Tùy Huyền Tráng ở Trường an dưới triều Đường vv… Về phía tạng Tạng văn, vấn đề truyền dịch điển tịch, dù có hệ thống và phân cách hơn tạng Hán văn nhiều, cũng vẫn trải dài trên hơn 400 năm với những dịch sự thạc học uyên bác. Kinh nghiệm truyền dịch của tạng kinh này cho chúng ta những gì? Ngay khi đã hệ thống nguyên tắc và dịch ngữ tới một mức độ đồng nhất chưa từng thấy, mà kết quả là thiết lập nên bản mục lục Ldandkar mà tổng kê những kinh điển dịch cho tới khoảng năm 812 tượng trưng giai đoạn dịch thuật thứ nhất và cuốn từ vựng Mahavyutpatti làm cơ sở cho dịch ngữ của giai đoạn dịch thuật thứ hai của nó sau vụ tranh luận Bsamyas, các dịch sư Ấn và Tây tạng cũng tốn hơn 300 năm để hoàn tất việc dịch tạng kinh Tây tạng như chúng ta có nó hôm nay. Nếu kinh nghiệm truyền dịch hại tạng kinh này kéo dài đến một thời gian như vậy với hệ thống những dịch sư, thì như vậy phải chăng chúng đã được thực hiện với những phương pháp cổ truyền? Trả lời câu hỏi này, chúng ta lấy trường hợp Quốc dịch nhất thiết kinh (Kokuyaku Issaikyo) của Nhật bản. Nó được thực hiện và xuất bản giữa những năm 1928-1945. Đại thể cách tổ chức và nguyên tắc phiên dịch của tạng này như sau. Mỗi một loại văn hệ được giao phó cho một chuyên viên của văn hệ đó nghiên cứu và dịch, như Bát nhã thì giao phó cho Shiio Benkyô, Niết bàn thì giao cho Matsumoto, Đại tập cho Mochizuki v.v…, rồi mỗi chuyên viên này sẽ chọn lấy một bản kinh, nếu bản kinh ấy có nhiều trùng dịch để dịch tham khảo với Phạn bản hay Tạng bản, nếu nguyên bản Phạn và Tạng bản còn, và trình bày một phân tích cho nó như lời tựa nhằm báo cáo cho người đọc biết lịch sử hình thành bản kinh đó cùng địa vị của nó trong lịch sử điển tịch cũng như tư tưởng của Phật giáo. Vì thế, tạng dịch kinh này thực sự không gì hơn là một tạng tuyển dịch, và văn khí của nó trên nguyên tắc hầu như chỉ là một thay đổi nhỏ mọn văn khí tạng Hán văn. Dẫu thế, nó cũng tốn hơn hai mươi năm để thực hiện. Và đây chưa kể đến vấn đề nhân sự, mà công tác này đã yêu cầu, và đã được đào tạo hơn ba mươi năm về trước. Những dịch giả như Ui, Ono, Tokiwa, Yabuki vv… cùng với những tên kể trên là những người đã được huấn luyện không phải như là những dịch sư, mà là như những giáo sư đại học và những học giả. Với kinh nghiệm này, chúng ta vì thế phải đặt một chương trình dài hạn cho việc phiên dịch tam tạng kinh điển Phật giáo, theo giải pháp dịch sư không phải 5, 10 hay 20 năm, mà ít nhất là 30 năm nếu chúng ta muốn việc phiên dịch tam tạng kinh điển không phải là một tuyển dịch tạng Hán như Kokuyaku Issaikyô hai tuyển dịch tạng Pali như tạng Anh văn, và nếu chúng ta muốn việc Việt dịch tam tạng kinh điển không chỉ giới hạn vào tạng Hán văn hay Pali, mà cả tạng Phạn văn và Tạng văn, như chúng xuất hiện ngày nay. Nói cách khác, việc huấn luyện những dịch sư có khả năng dịch đòi hỏi chúng ta phải làm cho họ có khả năng hiểu biết một cách tương đối phải chăng những bản văn họ sẽ dịch và những gì liên hệ với nó, mà trong trường hợp này của nền điển tịch Phật giáo với tất cả những đa tạp ngôn ngữ và phổ phí tư liệu không gì hơn là Phạn văn, tục văn, Pali, Hán văn, Tạng văn, Mông cổ, và nếu có thể, Mãn châu, và một số những ngôn ngữ địa phương Ấn độ, Ba tư và Trung Á khác như Ma ga dhi, Xau me ri, Gandha ri, Sa ca, Sốc đa, Tốc ca, Cố tan v… Và đây là chưa kể đến việc giáo dục những dịch sư này cho họ có những kiến thức tổng quát về những vấn đề lịch sử chính trị, xã hội, kinh tế, địa lý liên quan với vấn đề là bản văn họ nghiên cứu. Trong khi thực hiện việc giáo dục và huấn luyện này, mà thời gian có thể kéo dài 10, 15 năm, chúng ta tiếp tục chỉ có những dịch kinh điển Phật giáo một cách lẻ tẻ không hệ thống. Nói thế, chúng ta cũng chưa bàn đến tình trạng nhân sự hiện nay của Giáo hội với sự thiếu thốn những cán bộ lãnh đạo và hoằng pháp có thực học và kinh nghiệm biểu hiện không những qua sự vắng mặt một cách đáng phàn nàn của công tác hoằng pháp giữa những dân tộc thiểu số anh em sống bên cạnh dân ta và thuộc vào đại gia đình những người Việt nam, mà còn qua sự khuyết phạm những cán bộ lãnh đạo cấp dưới nhằm cho hạ tầng tổ chức của Giáo hội, nói riêng, và cho toàn bộ tổ chức Giáo hội nói chung. Sự thiếu thốn này chúng ta phải nhấn mạnh và cân nhắc cách kỹ lưỡng và thân thiết, khi vạch nên một đường hướng cho Cao đẳng Phật học viện và khi bàn đến công tác dịch thuật tam tạng kinh điển trong khuôn khổ tình trạng nhân sự đây, mà cùng với vấn đề giáo dục kể trên không thể giải quyết một sớm một chiều được. Do vậy, chúng tôi thiết nghĩ việc máy móc hóa công tác dịch thuật không những hứa hẹn nhiều giải quyết cho vấn đề phiên dịch những kinh điển Phật giáo, mà chúng ta sẽ tạm thời lo lắng ở đây, nhưng còn phiên dịch nói chung những sách vở khoa học và kỹ thuật ngoại quốc nhằm đóng góp một cách thiết thực vào công tác mở mang giáo dục và kinh tế nước ta và cải thiện một phần nào cái tình trạng trí thức lạc hậu nói trên của những người có giáo dục ở miền Nam này.
II
Bàn đến việc phiên dịch bằng máy, chúng ta phải bàn đến hai vấn đề sau. Vấn đề thứ nhất là vấn đề ngôn ngữ học của những bản văn muốn dịch và vấn đề thứ hai là vấn đề kỹ thuật học của cái máy dịch. Về vấn đề ngôn ngữ học, công tác phiên dịch bằng máy ngày nay đang đối diện với những khó khăn đáng chú ý, mà nhiều cách thế quan điểm giải quyết đã được đề ra. Chỉ đến lúc chúng ta vượt qua những khó khăn ấy phiên dịch bằng máy mới được thực hiện một cách hữu hiệu, bởi vì việc chế tạo nên một máy dịch hầu như hoàn toàn tùy thuộc vào việc xác định một quá trình phiên dịch, mà chiếc máy đó phải thực hiện. Thế thì, những khó khăn đó là gì và chúng ta sẽ giải quyết như thế nào? Về khía cạnh lý thuyết, những khó khăn đó nằm trong việc tìm trả lời cho một số câu hỏi kiểu dưới đây. Vấn đề phiên dịch thông thường đòi hỏi ít nhất bốn điều kiện để được thỏa mãn, đấy là (1) sự hiểu biết ngôn ngữ của bản văn phải dịch hay ngôn ngữ gốc và ngôn ngữ mà bản văn phải được dịch vào hay ngôn ngữ đích, (2) một sự hiểu biết tổng quát những gì liên quan với bản văn phải dịch và phải được dịch, (3) một kiến thức chuyên môn về nội dung của bản văn phải được dịch, và (4) sự biết lợi dụng kinh nghiệm dịch để làm việc dịch mỗi ngày mỗi hơn, và bốn điều kiện này thông thường được những người thực hiện công tác dịch thỏa mãn. Bây giờ, máy dịch có thể thỏa mãn những điều kiện này không? Trả lời câu hỏi này, nhiều lý thuyết gia của khoa dịch máy: đã vạch ra hoặc máy dịch không thể thỏa mãn tất cả bốn điều kiện ấy, vì vậy một bản dịch hoàn thiện bằng máy dịch sẽ không bao giờ thực hiện được, (4) hoặc máy dịch, mặc dù có tất cả những khó khăn và bất toàn của nó, cần phải được phân tích kỹ lưỡng hơn nhằm đề lên những cách chữa trị mới (5). Chúng ta dĩ nhiên không cần phải đi sâu vào những tranh luận lý thuyết này ở đây, dù chúng có những hàm ngụ khá sâu xa đối với việc giải quyết vấn đề dịch máy. Điều cần nói là, chúng không phải là con đẻ của thời đại đó. Những ai đã từng thử dịch một bản văn hay một đoạn văn đều nhận thấy là, ngay cả khi cùng một dịch giả dịch cùng một bản văn, nếu nó được thực hiện hai lần khác nhau, chúng ta tất cả hai bản dịch khác nhau. Tình trạng này như vậy khinh thường mọi nỗ lực nhằm thiết định một tiêu chuẩn thực nghiệm cho việc đánh giá một bản dịch. Và hậu quả là một bản dịch hoàn thiện chỉ là một lý tưởng hóa của lý thuyết. Điểm này không có chứng minh một cách thực nghiệm. Lịch sử phiên dịch của Phật giáo Trung quốc là một thí dụ. Cái tình trạng «ngũ thất bản» và «tam bất dịch», mà Thích Đạo An đã vạch ra gần 17 thế kỷ trước đây, ngày nay vẫn còn là những vấn đề cho những ai lưu tâm đến phiên dịch. Trong hai thế kỷ đầu của lịch sử Phật giáo, hai trường phái phiên dịch đã xuất hiện trong việc trả lời cho câu hỏi phải dịch kinh điển Phật giáo như thế nào. Một bên gồm có An Thế Cao và Chi Thuyền chủ trương phải dịch một cách trung thực theo sát nguyên bản Phạn văn và bên kia ngược lại gồm Chi Khiêm và Dharmaraksa chủ trương bản dịch không cần phải theo sát và chỉ cần dịch một cách bóng láng hoa mỹ những ý chính của nguyên bản. Hai quan niệm này sau đó thay nhau chi phối lịch sử phiên dịch Phật điển Trung quốc mặc dù những lý luận và phàn nàn của Thích Đạo An, mà ta đã thấy qua cái tình trạng ngũ thất bản tam bất dị kể trên. Không lâu sau Đạo An chết chẳn hạn, Kumarajiva đã tiếp tục khuynh hướng dịch của Chi Khiêm và Dharmaraksa: dù lần này cẩn thận và đầy đủ điều kiện hơn, với cái lý luận rằng, kẻ đọc dịch bản giống như những kẻ được trún cơm chỉ ăn những gì người khác đã mem nhai cho, vì vậy nhiệm vụ của người dịch là làm sao chuyền đạt nguyên ý của bản văn qua cho người đọc bản dịch văn, chứ không cần phải dịch sát nguyên bản. Huyền Tráng hơn hai trăm năm sau cũng không làm gì hơn là bước theo những vết chân của Kumarajiva, dẫu người viết tiểu sử ông đã cho chúng ta biết tại sao vì những cơn ác mộng mà Huyền Trang đã bỏ cái ý định «tương thuận chúng ý như La Thập sở phiên trừ hệ khử trọng». Và cái tình trạng «ngũ thất bản tam bất dị» của Đạo An vẫn tiếp tục ngự trị lịch sử phiên dịch Trung quốc. Về phía dịch bản Tây Tạng, chúng ta có một tình trạng hoàn toàn tương phản. Những dịch giả Tây tạng không những đã dịch sát từng chữ một những nguyên bản Phạn văn, nhờ đó công tác tái kiến những nguyên bản từ những đoạn phiến đã trở thành dễ dàng đối với những học giả ngày nay, mà còn đóng góp vào việc tạo nên một ngôn ngữ Tây tạng theo hình dáng của ngôn ngữ Phạn văn. Điểm này tương tự như sự lệ thuộc nước Đức vào «đế quốc La mã» đã làm ngôn ngữ Đức mang một hình dáng của ngôn ngữ La tinh. Qua những thí dụ này, chúng ta có thể rút ra một kết luận khá lôi cuốn, đó là tình trạng phát triển của một ngôn ngữ ảnh hưởng khá lớn đối với lập trường phiên dịch của ngôn ngữ đó. Điều đấy dẫn nhiều người đến việc coi việc xác định một bản dịch hoàn thiện là không thể làm được với tất cả những khả biến nhân sự và ngôn ngữ vừa nói. Vậy thì vấn đề ngôn ngữ học của việc dịch máy phải được giải quyết như thế nào và cách thế giải quyết sẽ ảnh hưởng những giải đáp cho câu hỏi lý thuyết trên ra sao?
Trả lời những câu hỏi này, chúng ta phải bàn về khía cạnh – thực tiễn của vấn đề đó, mà trong trường hợp này không gì hơn là việc phiên dịch Hán văn và Tạng văn ra Việt văn. Không cần phải nói là, tạng Hán và Tạng văn ngày nay tượng trưng hai nguồn tài liệu chính và kếch xù nhất của nền văn học Phật giáo. Việc chúng ta lựa chọn hai tạng này, ngoài lý do vừa kể, đến từ cái ý nghĩ là, vì đây là một dự án đầu tiên của việc dịch bằng máy, chúng ta nên chọn những ngôn ngữ nào gần gũi nhất với ngôn ngữ ta, để xem tác vi của ngôn ngữ ta như thế nào trong những bản dịch như thế và để giảm trừ những rắc rối cú pháp và luận lý tới mức độ tối thiểu, mà, nếu chọn một ngôn ngữ khác như Pàli hay Phạn, sẽ tràn giải ra không biết bao nhiều ngành ngọn. Vấn đề ngôn ngữ học của những ngôn ngữ này trong liên hệ với ngôn ngữ ta qua một bản dịch máy ra sao? Trước hết, ngôn ngữ Trung quốc và ngôn ngữ ta chia xẻ một số lớn những ngữ vựng chung tới gần 70-80%, và tình trạng này càng trở nên rõ rệt và thông thường hơn trong các sách vở Phật giáo, vì thế trong khi dịch hán văn ra Việt văn, chúng ta có thể để nguyên không phải dịch một số lớn những từ ngữ mà phần trăm có thể lên đến 20 cho đến 30 và đôi khi 50. Tuy nhiên, nền văn học Phật giáo Trung Quốc như kẻ khai sinh ra cho nền văn học biền văn và tiểu thuyết Trung quốc tất phải đầy dẫy những ngôn ngữ hằng ngày của người Trung quốc của thời đại những bản văn được dịch, mà số từ ngữ có thể lên đến 80%. Do vậy, vấn đề ngôn ngữ học đầu tiên là thiết lập một cuốn từ vựng lấy nghĩa làm đơn vị nhằm giải quyết số từ ngữ thông thường ấy. Cách giải quyết này tất rất giới hạn trong tính hữu hiệu của nó, mà những thí nghiệm trong những năm qua với những ngôn ngữ khác đã chứng tỏ, dẫu nó là cách thuận lợi và rẻ tiền nhất. Việc thiết lập nên một tự vựng sẽ gồm hai công tác sau. Công tác thứ nhất nằm trong việc phân tích cơ cấu của ngôn ngữ Trung quốc và ngôn ngữ ta, nhằm thiết định một số những cú pháp và đặc ngữ, mà cách giải quyết tự vựng có thể giải quyết và không cần đến những thủ tục luận lý máy móc rắc rối. Chẳng hạn, những kiến trúc như «vân hà… gia?», «thị thời», «dĩ thời», «dĩ hà duyên cố» v.v… có thể tổ chức thành những đặc ngữ với những tương đương của tiếng ta. Công tác thứ hai là phân tích những từ ngữ thành hai loại: loại thông ngữ dùng hằng ngày và phải được dịch ra tiếng ta, và loại thuật ngữ có chung với tiếng ta không cần phải dịch. Để hoàn tất công tác này, chúng ta có một số từ điển Phật giáo Hán Anh, Hán Nhật và một số những Hán ngữ thực dụng khác. Nhưng để bắt đầu, chúng tôi thiết nghĩ, chúng ta phải chia lịch sử phiên dịch Trung quốc thành ít nhất ba giai đoạn, như người xưa đã làm, đây là giai đoạn cố dịch, cựu dịch và tân dịch. Trong mỗi giai đoạn, chúng ta lại phải xếp dịch bản của một dịch giả thành một đơn vị, để có thể thiết lập nên những dụng ngữ và cú pháp đặc biệt của dịch giả đó. Chẳng hạn, chúng ta phải xếp những dịch bản của An Thế Cao thành một đơn vị, của Lokaksema thành một đơn vị khác, Dhammaraksa thành một đơn vị thứ ba v,v… Tất nhiên, trong khi làm việc này, vấn đề một số dịch bản thất dịch cũng như một số khác dịch giả bất tường khả nghi sẽ đặt nên những khó khăn. Dầu thế, chúng không phải là không thể vượt qua. Những nghiên cứu của các học giả khác sẽ giúp giải quyết chúng một cách khá ổn định, hay nếu không, với công tác thiết lập từ vựng và phân tích cơ cấu văn thể chúng ta ít nhất cũng có thể giải quyết và sửa sai những giải quyết của các học giả trước. Sau khi đã xếp đặt những dịch bản thành những đơn vị, chúng ta bắt đầu thiết lập những bản từ vựng và cú pháp cũng như những nguyên tắc chỉ đạo phiên dịch, mà dịch giả đã đề ra, để hiểu thêm hơn cách dịch của họ. Việc bây giờ là xác định tần số của những từ ngữ của cuốn từ vựng, để biết những từ ngữ nào xuất hiện nhiều lần nhất và phần trăm của chúng là bao nhiêu trong liên hệ với những từ ngữ xuất hiện ít lần hơn hay chỉ xuất hiện một hai lần, với mục đích giúp xác định một phần nào những điều kiện, mà một máy dịch phải thỏa mãn. Sự tính tần số này dĩ nhiên có thể miễn trừ cho những thuật ngữ, vì chúng sẽ không ảnh hưởng đến nhiều vấn đề ngôn ngữ học phải giải quyết ở đây. Về thông ngữ, chúng tôi thiết nghĩ, số nó không lên quá 4000 chữ, nhất là những chữ với một tần số cao, dẫu trong mỗi bản kinh nó chiếm đôi khi gần tới 80%. Điều này cố nhiên không có gì lạ, bởi vì, nếu tần số của chúng cao thì lượng số của chúng phải nhỏ, một hàm số nghịch biến. Đến đây, chúng ta có thể khởi sự sửa soạn việc dịch bằng máy. Để sửa soạn (10), chúng ta còn có hai vấn đề nữa phải giải quyết. Vấn đề thứ nhất là chúng ta phải mật mã hóa chữ Hán như thế nào? Cứ tình trạng hiện tại, chúng tôi nghĩ, cách tiện nhất là, chúng ta triệu tập một số khoảng hai ba người hay nhiều hơn nếu có thể, rồi nhờ họ đọc hết tất cả những bản dịch Đại tạng kinh chữ Hán theo cách đọc tiếng Việt ta, như «như thị ngã văn nhất thời…», cho chúng ta ghi lên những cuốn băng. Sau khi đã có những cuốn băng và đã kiểm soát chúng, để xem những người đọc có bỏ sót câu chữ nào không hay đã đọc một chữ theo những phát âm khác nhau (như «nhất thiết» với «nhất thế», «thì hữu Bà tha chủng xuất gia lai nghệ phật sở hiệp chưởng vấn tấn» với «thì hữu Bà sa chưởng xuất gia lai nghệ phát sở hợp chưởng») nhằm sửa chúng lại, xong, chúng ta có thể hoặc giao cho những người đánh máy đánh ra, rồi đưa qua cho người đánh máy thủng đánh thủng những bản dịch đó vào những thẻ dùng cho máy tính điện tử, hoặc giao trực tiếp cho những người đánh máy thủng đánh thủng vào những thẻ, hoặc, nếu có máy đọc trực tiếp cho máy tính, cho đánh máy với một máy chủ thích hợp rồi giao cho máy đọc. Vấn đề thứ hai là, chữ Hán đọc theo tiếng ta có một số những chữ đồng âm dị nghĩa như thị (thấy) với thị (là), thị (cho), vv…, mà chỉ cần đọc sơ qua cuốn Hán Việt tự điển của Đào Duy Anh cũng có thể cho ta một vài ý niệm. Thế thì chúng ta phải giải quyết chúng thế nào? Đây là một vấn đề tương đối khó khăn nhất của việc phiên dịch bằng máy. Qui patrem sum necat non peccat! Nhất là trong những trường hợp như của chúng ta, ở đó những chữ đồng âm dị nghĩa đôi khi lên tới những mười hai mười ba chữ. Chúng tôi thiết nghĩ, chúng ta có thể dùng một thủ tục luận lý, theo đó chữ thị chẳng hạn sẽ được gắn lên một dãy những số 1, 2, 3, 4, vv… và một dãy những Việt nghĩa tương đương như là, thấy, bày, hầu, nhờ v…, cùng số rồi ta sẽ ra lệnh cho máy tính điện tử bằng thảo chương là, mỗi một lần bạn vẫn có một chữ thị và chữ đó có một số nào đó, thì nó phải tìm ra Việt nghĩa tương đương với số thích hợp (11). Đây là một số vấn đề ngôn ngữ học liên quan đến tạng kinh Hán văn, mà chúng ta phải giải quyết, để có thể dịch chúng ra tiếng ta bằng máy. Thời gian để hoàn thành những công tác này chúng tôi nghĩ có lẽ không lâu, nếu chúng ta có: (1) tài liệu, nghĩa là, những bản văn, những tự điển, những cuốn văn phạm cần thiết, mà trong trường hợp này chúng tôi tin tưởng là thư viện Viện Đại học Vạn Hạnh và những thư viện quốc gia có thể thỏa mãn, (2) nhân sự, nghĩa là, một số người biết đọc chữ Hán và làm việc dưới một người hướng dẫn biết cách, cả hai đều có thể thỏa mãn với tình trạng nhân sự nghèo nàn hiện nay của Giáo hội, và (3) dụng cụ, mà ở giai đoạn này tất cả chúng ta cần là một số máy ghi âm, dẫu rằng không cần thiết cho lắm, nếu những người có trách nhiệm đọc chữ Hán ra tiếng ta đọc trực tiếp cho người đánh máy hay họ tự đọc và đánh máy, và dĩ nhiên máy đánh chữ, giấy bút, một số lớn thẻ cỡ 3 x 6 cm, và máy đánh thủng.
Về tạng kinh Tạng văn, một mặt nó đưa ra những thuận lợi đáng mong muốn cho việc giải quyết những vấn đề ngôn ngữ học hơn là tạng Hán văn, nhưng mặt khác nó cũng có những bất thuận lợi của nó. Những thuận lợi, chúng ta có, có thể tóm tắt như sau. Trước hết, nó không đưa ra một số lớn những vấn đề liên quan đến việc lượm lặt những thuật ngữ, như tạng Hán văn, bởi vì chúng ta có thể dựa hoàn toàn vào bản Mahāvyut patti để thiết lập nên một bản tự vựng tương đương tạng Việt cho máy dịch. Về phía những thông ngữ, số từ ngữ theo chỗ chúng tôi ước định có lẽ không lên tới 1/5 số thuật ngữ, một điểm khá lôi cuốn, nghĩa là khoảng 2000 cho đến 2500 chữ, và tầng số của một số lớn trong chúng có thể nói là từ trung bình cho đến cao. Do đó, việc lượm lặt những thông ngữ có lẽ không tạo nên một số những khó khăn nào. Tiếp đến, tạng Tạng văn không chịu đựng cái tình trạng tam bất dị ngũ thất bản của tạng Hán văn với những đa tạp dịch giả và dụng ngữ, trái lại, việc phiên dịch nó được thực hiện một cách nghiêm chỉnh theo đúng những qui tắc và dụng ngữ phiên dịch đã được vạch ra. Chúng ta vì thế sẽ không phải tốn hao thời giờ trong việc phân đoạn xếp đặt và tổ chức tài liệu, mà tạng Hán văn đã đòi hỏi chúng ta. Cuối cùng, so với tạng Hán văn, tạng Tạng văn dù kếch xù tự nó không đến nỗi to lớn cho lắm, do đó thời gian dùng cho việc tạo nên một cuốn tự vựng không đến nỗi quá hao tốn. Về những bất thuận lợi điểm đầu tiên và nổi bậc nhất là sự khác biệt hầu như căn đề giữa kiến trúc cú pháp của Tạng ngữ và của tiếng ta. Tạng ngữ không những vì đóng khuôn theo Phạn ngữ mà đã có những kiến trúc biến cách và thi cách, không có trong ngôn ngữ ta, ngược lại còn có những kiến trúc cú pháp khá xa lạ với tiếng ta và tiếng Trung quốc, cả ba đều thuộc ngữ tộc tạng Hán. Cái tình trạng này tương tự như tình trạng của ngôn ngữ Đức đối với ngôn ngữ Anh chẳng hạn. Kiến trúc cú pháp đại thể của Tạng ngữ có thể nói như gồm một chủ từ đứng đầu câu, một động từ đứng cuối câu và những gì còn lại đều dồn vào giữa lòng của hai biên giới chủ động từ đó. Chẳng hạn, câu «sdar ma dpung las mi rgyal te / dpah bo dpung las rgyal bar hgyur / rgyal yang de ni lom sems med /» mà nếu dịch chữ theo chữ ta sẽ có như «kẻ nhút nhát những đội quân không chiến thắng, kẻ dũng cảm những đội quân chiến thắng sẽ / chiến thắng dù kẻ đó kiêu hãnh lòng không có, / nghĩa là, «kẻ nhút nhát không chiến thắng những đội quân, kẻ dũng cảm sẽ chiến thắng những đội quân, dù chiến thắng kẻ đó không có lòng kiêu hãnh». Những kiến trúc cú pháp kiểu này đưa ra những khó khăn rất lớn cho công tác dịch bằng máy dựa trên nguyên tắc dịch từng đơn vị nghĩa của ngôn ngữ gốc ra ngôn ngữ đích và dùng cú pháp của ngôn ngữ gốc làm tiêu chuẩn; và chúng lại là những kiến trúc cơ bản tiêu chuẩn của tạng Tạng văn và của nền văn học cổ điển Tây tạng. Việc giải quyết chúng do đó không phải là dễ dàng gì. Điều may mắn là, vì kiến trúc «chủ + x + động», trong đó X có thể là một danh từ, một tính từ, một mệnh đề phụ hay một mệnh đề danh động từ v..v… là kiến trúc tiêu chuẩn, chúng ta có thể dùng một thủ tục luận lý nhằm ra lệnh cho máy tính điện tử hoặc phân tích cú pháp của tiếng ta và ổn định theo đòi hỏi của cú pháp đó những Việt dịch, hoặc học lấy những bất biến từ chỉ biến cách của Tạng ngữ và chỉ định những biến cách thích hợp, để khi dịch lại nó có đủ tin tức mà sửa sai chúng theo cú pháp Việt ngữ. Vì chưa thí nghiệm cả hai trường hợp này, chúng tôi không rõ chúng sẽ như thế nào, dẫu rằng Tạng ngữ, như Bacot trước đây đã ví nó một thứ cờ với những nguyên tắc rất giản dị nhưng lại rất khó chơi, hứa hẹn những phân tích và giải quyết một cách khá thỏa mãn bằng máy tính điện tử. Điểm bất thuận lợi thứ hai nằm ở chỗ, Tạng ngữ, tự nguyên ủy có lẽ không là một ngôn ngữ biến cách, như ta có nó ngày nay. Chính nhờ tính biến cách này của nó là những kiến trúc kiểu kể ra trước đã có thể, do đó nó đưa ra một vài khó khăn đáng bàn. Trước hết, Tạng ngữ, để trở thành biến cách, đã nhờ một số biến từ, mà ý nghĩa của chúng đôi khi bao hàm nhiều khía cạnh khác nhau. Chẳng hạn bất biến từ las trong dud kha las song «bằng qua ống khói nó đi» và trong bzo mkhan las gcig «một trong những người thợ». Tình trạng này không phải là không có trong tiếng ta. Những câu như: Cho tôi ăn đã, rồi tôi mới làm và tôi đã ăn và tôi làm việc, trong đó chữ đã xuất hiện có thể nói là mang những ý nghĩa khá khác nhau, là những thí dụ. Và nó cũng không lạ lùng gì cho mấy với chữ Hán, mà ta có thể vạch ra qua những câu «vấn tấn dĩ thối tọa nhất diện» và «ngã dĩ tam vấn sa môn cù đàm», ở đây chữ dĩ trước có nghĩa là xong và chữ dĩ sau có nghĩa đã. Điểm bất thuận lợi cuối cùng liên quan với những biến thể của động từ. Vì là ngôn ngữ của ngữ tộc Hán tạng, Tạng ngữ vẫn giữ cái cách cố hữu của ngữ tộc này trong việc tạo ra động từ danh từ, đây là đặt danh từ vào địa vị của động từ, nhưng đã tăng khả năng tạo động từ của nó cũng biến cách của những động từ này với những thêm bớt hay thay đổi một hay vài âm của chữ liên hệ. Chẳng hạn, bug pa là một danh từ và có nghĩa cái lổ, để biến thành động từ làm thủng đâm thành lổ, nó trở thành sbug pa, hay để chỉ những thời gian và thể cách khác nhau, động từ rgal ba «đi qua» trở thành brgal «sẽ đi qua» và rgol «hãy đi qua». Hai điểm bất thuận lợi này dĩ nhiên đều có thể giải quyết bằng những thủ tục luận lý, nhưng chúng tôi nghĩ, chúng có lẽ đòi hỏi một số lớn và vì thế khá rắc rối lôi thôi. Do đó, đối với điểm bất thuận lợi thứ hai, người ta có thể hoặc gồm chúng dưới những ý nghĩa có thể của chúng và ra lệnh cho máy dịch, dịch hết những Việt ngữ tương đương của một biến từ hay bất biến từ Tạng ngữ, hoặc để nguyên không dịch những biến từ và bất biến từ không có Việt nghĩa tương đương rồi máy dịch sẽ loại chúng ra khi nó dịch loạt hai, mà cũng có thể dùng để loại ra những Việt nghĩa tương đương trong những trường hợp đa nghĩa có Việt nghĩa tương đương nhưng không cần thiết, hoặc dùng cách phân tích những nhóm chữ và lợi dụng những luật xuyên bộ và cộng bộ để thích hợp cho tổ chức nhị phân của máy dịch. Về điểm bất thuận lợi cuối cùng, cách giải quyết hay nhất có lẽ là đặt nên những dạng thức của những động từ liên hệ và cho chúng những ý nghĩa tương đương trong tiếng ta, như các nhà dịch máy của các ngôn ngữ Ấn Âu đã làm.
Sau khi đã vạch ra những thuận lợi và bất thuận lợi ngôn ngữ học của Tạng ngữ, chúng ta cần phải nói thêm một vài điểm ngoại tại khác. Như tạng Hán văn, tạng Tạng văn có những ấn bản khác nhau và đôi khi đưa ra nhiều bất thường trong sự so sánh các bản in. Tuy thế, đối với Hán tạng, chúng ta có thể dựa vào một số những ấn bản khác nhau để sửa sai. Chẳng hạn, nếu cách chấm câu trong bản in Taisho không được thuần nhất cho lắn, người ta có thể dựa vào bản in Tokyo để tăng bổ… (14). Trong trường hợp Tạng bản, người ta chỉ có một bản ảnh ấn duy nhất cho đến ngày nay do Suzuki tài đoàn xuất bản dùng ấn bản Bắc kinh như tiêu chuẩn. Những ấn xưa hơn và có lẽ trung thực hơn đã không được dùng như Sde sge, Snay thang v.v… hay ít nhất không cho những sai khác có thể giữa chúng như bản in Taisho đã làm đối với tạng Hán văn. Vì thế, nếu muốn in một bản văn nào từ Tạng bản, người ta bắt buộc phải tham khảo nhiều ấn bản khác nhau, và một vài nỗ lực lẻ tẻ đã được thực hiện đối với văn hệ bảo tích hay bát nhã (15). Do vậy, vấn đề tư liệu của tạng Tạng văn không phải dễ giải quyết gì, nhất là trong tình trạng nghiên cứu hiện nay của ta. Không những thế, giá trị của một cách tính cho Tạng ngữ không hứa hẹn nhiều ích lợi thiết thực, mà một cách tính cho Hán ngữ chẳng hạn sẽ mang lại cho ta qua việc đóng góp vào sự phiên dịch những sách vở khoa học và kỹ thuật từ tiếng Trung quốc ra tiếng ta. Cuối cùng, Tạng ngữ có một số mẫu tự giới hạn, mà Hán ngữ không có, nhờ thế nó có thể hứa hẹn rất nhiều cho việc tạo ra một máy đọc. Điều đáng tiếc là, bản ảnh ấn Suzuki của Tạng văn không những đã có những mẫu âm tương đối giống đến độ có thể lầm lẫn được, mà còn có những mẫu âm mờ ảo khó đọc và đôi khi có những vết mực kết nối chúng lại, một sự kiện làm việc áp dụng máy đọc rất khó thực hiện.
Đã bàn một cách sơ lược như trên về những vấn đề ngôn ngữ học của tiếng ta trong liên lạc với những ngôn ngữ Hán và Tạng, người ta cũng có thể có một vài ý niệm về những trả lời cho câu hỏi, phải giải quyết những vấn đề ngôn ngữ học của việc dịch máy như thế nào. Trước hết, nó thú nhận rằng, trong giai đoạn này bản dịch bằng máy, để trở thành «hoàn thiện», phải nhờ đến sự tổ hợp giữa máy và người dịch. Máy dịch được đưa vào công tác này, bởi vì những thiếu thốn nhân sự có khả năng của chúng ta. Như thế, dù việc nghiên cứu cách thể để hoàn thiện công tác dịch bằng máy vẫn tiếp tục, nó không phải là mục đích tiện yếu và chính yếu, ngược lại chúng ta nhờ đến máy và nhằm làm nhẹ bớt những việc làm có thói quen và gia tăng tốc độ của một việc làm như vậy. Tiếp đến, vì là một công tác tổ hợp giữa người và máy, vai trò của chúng ta không những cung cấp cho máy những nhập liệu những tín liệu và mệnh lệnh bằng thảo chương, mà còn phải sửa chữa những sản liệu, mà máy dịch đã cho ta. Với những bàn cải trên, việc sửa chữa này là một cần thiết, để bản dịch có thể được hiểu cho những người đọc. Chúng tôi thiết nghĩ, trong trường hợp những đại tạng kinh, nếu tính trung thực của bản dịch được coi như có giá trị tối thượng, thì việc sửa chữa sẽ không đến một mức độ lạm phát và đòi hỏi. Nói cách khác, mỗi một bản dịch, sau khi đã được máy dịch xong, sẽ giao cho một độc giả trung bình đọc để xem mức có thể được hiểu biết của nó như thế nào, rồi nhờ một người chuyên môn sửa lại những chỗ cần thiết. Một sự nhuận sắc và kiểm duyệt như vậy có thể thực hiện được. Cuối cùng, việc dịch máy không chỉ giới hạn ở những tạng kinh kếch xù bàn trên hay cả những tạng kinh nhỏ hơn tạng Pali hay tạng Phạn văn. Nó còn hứa hẹn những áp dụng thiết thực cho việc phiên dịch những sách vở ngoại quốc khác cũng như việc nghiên cứu ngôn ngữ học tiếng ta cả về có câu cũng ý nghĩa học.
[Tạp chí Tư Tưởng số 7, năm 1971]
(xem tiếp trang 2)