Lần đầu tiên trên thế giới, các nhà nghiên cứu đã phát triển một hệ thống trí tuệ nhân tạo (AI) không xâm lấn có khả năng giải mã suy nghĩ của con người thành văn bản.
Trung tâm Trí tuệ nhân tạo xoay quanh con người GrapheneX-UTS (gọi tắt là HAI) tại Đại học Công nghệ Sydney (UTS) ở Úc đã phát triển thành công một hệ thống di động AI không xâm lấn có thể giải mã những suy nghĩ con người và biến chúng thành văn bản. Nghiên cứu trên được chọn làm nghiên cứu nổi bật tại hội nghị NeurIPS. Đây sự kiện thường niên giới thiệu các nghiên cứu tiên phong trên thế giới về AI và học máy, được tổ chức tại New Orleans (Mỹ), theo bài viết được đăng trên website UTS hôm 12/12.
Theo đó, công nghệ này có thể hỗ trợ giao tiếp cho những người mất khả năng nói do bệnh tật hoặc chấn thương như liệt, đột quỵ. Hệ thống cũng cho phép giao tiếp liền mạch giữa con người và các loại máy móc như cánh tay sinh học hoặc robot.
Nghiên cứu được chủ trì bởi giáo sư Chin-Teng Lin, Giám đốc Trung tâm GrapheneX-UTS HAI, cùng với tác giả Yiqun Duan và nghiên cứu sinh Tiến sĩ Jinzhou Zhou từ Khoa Kỹ thuật và CNTT của UTS.
Trong nghiên cứu, những người tham gia đọc thầm các đoạn văn bản trong khi đội một chiếc mũ. Chiếc mũ này đặc biệt ở chỗ nó có thể ghi lại hoạt động điện não qua da đầu bằng cách sử dụng điện não đồ (EEG).
Sóng EEG được phân thành các đơn vị riêng biệt để nắm bắt các đặc điểm và kiểu mẫu cụ thể từ não bộ. Điều này được thực hiện bởi một mô hình AI có tên DeWave do các nhà nghiên cứu phát triển. DeWave dịch tín hiệu EEG thành từ và câu bằng cách học số lượng lớn dữ liệu EEG.
Ông Lin cho biết: "Nghiên cứu này thể hiện nỗ lực tiên phong trong việc dịch sóng EEG thô trực tiếp sang ngôn ngữ, đánh dấu một bước đột phá đáng kể trong lĩnh vực này".
"Đây là lần đầu tiên các kỹ thuật mã hóa rời rạc được kết hợp với nhau trong quá trình dịch suy nghĩ trong não sang văn bản, là một cách tiếp cận sáng tạo để giải mã thần kinh. Việc tích hợp với các mô hình ngôn ngữ lớn cũng đang mở ra những cánh cửa mới trong khoa học thần kinh và AI", vị giáo sư nhận định.Trước đây, các công nghệ dịch tín hiệu não sang ngôn ngữ sẽ cần phải phẫu thuật để cấy các điện cực vào não, chẳng hạn như Neuralink của tỷ phú Elon Musk, hoặc quét bằng máy MRI, một loại máy lớn, chi phí cao và khó sử dụng trong sinh hoạt hàng ngày.
Các phương pháp này cũng khó ứng dụng thực tế do không thể theo dõi bằng mắt thường trong việc chuyển đổi tín hiệu não thành các phân đoạn cấp độ từ. Với công nghệ mới, tính năng theo dõi bằng mắt có thể tùy chọn có hoặc không.
Nghiên cứu của UTS được thực hiện với 29 người tham gia. So với công nghệ giải mã trước đây chỉ thử nghiệm trên 1 - 2 người, công nghệ mới mạnh mẽ và dễ thích ứng hơn nhiều do sóng EEG giữa các cá nhân không giống nhau. Nghiên cứu đã báo cáo hiệu suất hiện đại, vượt qua các tiêu chuẩn của các công nghệ trước đó.
"Mô hình này thành thạo kết hợp các động từ hơn là danh từ. Tuy nhiên khi nói đến danh từ, chúng tôi nhận thấy hệ thống có xu hướng sử dụng các cặp đồng nghĩa hơn là dịch chính xác", tác giả nghiên cứu Duan nói.
"Chúng tôi nghĩ hiện tượng này là do khi não xử lý những từ này, những từ tương tự về mặt ngữ nghĩa có thể tạo ra các dạng sóng não tương tự", ông giải thích. "Bất chấp những thách thức, mô hình của chúng tôi có khả năng đưa ra kết quả có nghĩa, sắp xếp các từ khóa và hình thành các cấu trúc câu tương tự".
Hiện hệ thống có điểm dịch chính xác khoảng 40% theo chỉ số BLEU-1. Điểm BLEU là một số từ 0 đến 1 để đo lường mức độ tương đồng của văn bản được dịch bằng máy với một tập hợp các bản dịch tham chiếu chất lượng cao.
Các nhà nghiên cứu hy vọng điểm số sẽ được cải thiện lên mức tương đương với các chương trình dịch ngôn ngữ hoặc phần mềm nhận dạng giọng nói truyền thống với độ chính xác gần 90%.
|