Thứ Ba, 12 tháng 5, 2009

Bó hand - Google Translate chưa thể vượt qua sự phức tạp của tiếng Việt

Cuối cùng thì người dùng internet Việt Nam đã có thể sử dụng công cụ trực tuyến Google Translate để dịch tự động qua lại giữa tiếng Việt và hơn 30 ngôn ngữ khác nhau

Thử nghiệm ban đầu cho thấy, Google Translate có tốc độ dịch khá nhanh so với các công cụ dịch trực tuyến hiện có. Để có được tốc độ này, Google đã tự phát triển riêng một cỗ máy dịch thuật sử dụng kỹ thuật "dịch máy" (machine translation technology) dựa trên phương pháp tra cứu các cặp từ/văn bản song song kết hợp với tham khảo cơ sở dữ liệu các đoạn văn bản mẫu. Nhờ có một khối lượng dữ liệu khổng lồ cùng với hạ tầng thuộc hàng "khủng" của Google mà Google Translate có thể hoàn tất một cách xuất sắc nhiệm vụ khi chuyển ngữ giữa các ngôn ngữ gần gũi với tiếng Anh.

Tuy nhiên, bình luận trên blog của Google, một cựu lập trình viên của IBM cho rằng kỹ thuật "dịch máy" ngày nay vẫn chưa có gì tốt hơn so với 40 năm về trước. Theo ông, muốn tự động hóa việc chuyển đổi các ngôn ngữ của con người cần phải có một cách tiếp cận khác hơn. Điều này càng thể hiện rõ hơn nếu bạn sử dụng các "máy dịch thuật" này để dịch các văn bản không thuộc la-tinh hoặc các văn bản có cấu trúc khác với tiếng Anh.

Đặc biệt là khi dịch với các ngôn ngữ "phức tạp" về mặt ngữ nghĩa như tiếng Việt thì rất nhiều trường hợp bạn nhận được những kết quả khá "ngây ngô", ngay cả Google cũng không ngoại lệ. Ví dụ một số từ hoặc câu nói thông thường của người Việt được Googe dịch ra như sau:
bó tay --> bó hand
miễn bàn --> free table
thích thì chiều --> enjoy the afternoon (tương tự như like is afternoon)

Một điểm đáng chú ý khác của Google Translate là việc sử dụng tiếng Anh làm ngôn ngữ trung gian trong quá trình dịch thuật. Theo đó, nếu bạn cần dịch 1 đoạn văn bản từ tiếng Pháp, tiếng Trung,... sang tiếng Việt thì trước tiên Google Translate sẽ dịch chúng sang tiếng Anh (tất nhiên là nội dung sẽ bị sai sót một phần) sau đó mới thực hiện dịch lần thứ 2 từ tiếng Anh sang tiếng Việt. Điều này có thể giúp cho Google giảm nhẹ việc đầu tư cho cơ sở dữ liệu các cặp từ/văn bản song song, nhưng chính quy trình "tam sao thất bản" này lại làm cho kết quả càng thêm tệ hại.

Dù sao thì Google Translate cũng là công cụ dịch trực tuyến lớn đầu tiên đã chính thức hỗ trợ tiếng Việt với 2 công cụ hữu ích là dịch các đoạn văn bản trực tiếp hoặc dịch toàn bộ 1 trang web. Điều này phần nào giúp cho cộng đồng sử dụng Internet Việt Nam thuận tiện hơn trong quá trình "lướt net", nhất là khi buộc phải truy cập vào các trang web sử dụng các ngôn ngữ mà mình hoàn toàn "mù tịt".

Rất tiếc là công cụ tra từ điển trực tuyến Google Dictionary hiện tại vẫn chưa hỗ trợ tiếng Việt, bên cạnh đó, việc dịch tiếng Việt vẫn còn khá nhiều lỗi.

Không có nhận xét nào:

Đăng nhận xét