Trí tuệ nhân tạo (Deep learning A.I) đang giúp chúng ta đối phó với rất nhiều vấn đề trong thế giới hiện đại. Nhưng đồng thời nó cũng có vai trò trong việc giúp giải quyết một số vấn đề cổ xưa – chẳng hạn như hỗ trợ dịch thuật các tài liệu/ văn tự được truyền lại đất sét 2.500 năm từ Đế chế Ba Tư Achaemenid.
Những văn tự này được phát hiện ở Iran vào năm 1933, kể từ đó các học giả không ngừng nghiên cứu trong nhiều thập kỷ. Tuy nhiên, họ đã tìm thấy quy trình dịch thuật cho các văn tự cổ – trong hàng chục nghìn ký tự- rất dễ sai sót trong quá trình giải nghĩa. Và công nghệ A.I đã đóng góp một vai trò khá lớn trong việc giúp đỡ các nhà khảo cổ học.
Ông San Sanayay Krishnan, trợ lý giáo sư tại khoa Khoa học Máy tính của Đại học Chicago, nói với Digital Trends, “Chúng tôi có những thử nghiệm ban đầu bằng việc áp dụng machine learning (trong deep learning A.I) để xác định các chữ tượng hình nào có trong hình ảnh của một bản văn tự cổ”.
Machine learning hoạt động bằng cách ngoại suy các mẫu từ các ví dụ từ con người và điều này cho phép chúng tôi tự động hóa các chú thích trong tương lai. Chúng tôi lạc quan rằng đó là một bước tiến tới tự động hóa đáng kể trong việc phân tích và nghiên cứu các văn tự cổ xưa này.
Tại DeepScribe, với sự hợp tác giữa các nhà nghiên cứu từ Viện Nghiên Cứu Đại học Chicago Oriental và khoa Khoa học Máy tính, họ đã thực hiện quá trình đào tạo gồm hơn 6.000 hình ảnh và chú thích để xây dựng một mạng lưới tư duy ngôn ngữ có thể đọc các văn tự cổ không rõ nghĩa trong bộ sưu tập.
Khi thuật toán và deep learning được thử nghiệm trên các tài liệu văn tự khác, nó có thể dịch các dấu hiệu chữ tượng hình với mức độ chính xác khoảng 80%. Hy vọng sẽ tăng điểm chuẩn này trong tương lai. Tuy nhiên, ngay cả khi điều đó không xảy ra, hệ thống có thể được sử dụng để dịch một lượng lớn các văn tự cổ xưa, điều này giúp ích rất lớn cho các nhà khảo cổ khi có thể tập trung vào những vấn đề khác khó khăn hơn.
Cuneiform (văn tự tượng hình cổ) là một bộ ký tự được sử dụng từ thiên niên kỷ thứ ba trước Công nguyên để viết nhiều ngôn ngữ bao gồm Sumerian, Akkadian và Elamite.
Cuneiform đặt ra một loạt các thách thức đặc biệt cho ngôn ngữ dịch thuật của máy tính (deep learning machine).
Đầu tiên, nó được viết bằng cách dùng một cây bút gỗ viết lên bề mặt đất sét ướt. Điều này làm cho các ký tự trở thành một trong số rất ít hệ thống chữ viết ba chiều.
Thứ hai, chữ Cuneiform là một hệ thống chữ viết phức tạp sử dụng hàng trăm ký hiệu khác nhau. Mỗi ký hiệu có ý nghĩa khác nhau tùy thuộc vào bối cảnh của nó.
Thứ ba, văn tự cuneiform là cổ vật. Chúng thường bị hỏng và khó giải mã, điều đó có nghĩa là sẽ mất rất nhiều thời gian để giải mã ý nghĩa của một đoạn văn tự cổ này.
Theo ông Peter Krishnan, cho đến nay chúng ta đã có một bản mẫu đầu tiên cho thấy các kỹ thuật như vậy rất hiệu quả trong một môi trường có kiểm soát. Với một hình ảnh rõ ràng của văn tự, [chúng ta có thể] xác định được xem đó là gì. Bước tiếp theo của chúng tôi là thông qua Deep Learning A.I để phát triển các mô hình mạnh mẽ hơn, và có thể giải mã được ý nghĩa về mặt bối cảnh và chất lượng dữ liệu.
Với sự phát triển không ngừng của khoa học công nghệ, đặc biệt là khoa học máy tính (machine learning, deep learning, A.I …) mọi thứ trong cuộc sống trở nên dễ dàng và thuận tiện hơn.
Hãy cùng theo dõi các bài viết khác về công nghệ và khoa học nhé.
Chúc các bạn một ngày vui vẻ.