Nhóm nghiên cứu người Mỹ vừa công bố một công nghệ đột phá có thể chuyển đổi những ǵ con người nh́n thấy hoặc tưởng tượng thành mô tả bằng chữ với độ chính xác cao.
Công nghệ "mind captioning" đang khiến giới khoa học sửng sốt khi có thể biến tín hiệu năo bộ thành những câu mô tả chính xác về h́nh ảnh hoặc khung cảnh mà con người đang nghĩ tới. Đây là công nghệ mới do nhóm nhà khoa học Mỹ công bố - một bước tiến đáng chú ư trong lĩnh vực trí tuệ nhân tạo và khoa học thần kinh: Công nghệ “mind-captioning” (tạm dịch: “chú thích suy nghĩ”).
Hệ thống này có thể giải mă hoạt động của năo và chuyển đổi những ǵ con người nh́n thấy hoặc tưởng tượng trong đầu thành câu mô tả bằng chữ với độ chính xác đáng kinh ngạc.
Công tŕnh được công bố trên tạp chí Science Advances, mở ra viễn cảnh mới trong việc hiểu cách năo bộ con người diễn giải thế giới xung quanh. Đồng thời, công nghệ mới này cũng gợi mở tiềm năng ứng dụng trong hỗ trợ người mắc các chứng rối loạn ngôn ngữ, chẳng hạn như sau đột quỵ.

Công nghệ “mind-captioning” có thể giải mă hoạt động năo và chuyển đổi những ǵ con người nh́n thấy hoặc tưởng tượng trong đầu thành câu mô tả bằng chữ với độ chính xác cao. (Ảnh: Nature.com)
Theo nhóm nghiên cứu tại Đại học California, Berkeley (Mỹ), kỹ thuật này sử dụng công nghệ chụp h́nh năo không xâm lấn để ghi nhận hoạt động thần kinh. Sau đó, các nhà khoa học dùng mô h́nh ngôn ngữ AI tiên tiến để dự đoán và mô tả chính xác điều mà người tham gia đang nh́n hoặc tưởng tượng.
“Hệ thống có thể dự đoán ở mức độ chi tiết rất cao những ǵ một người đang nh́n thấy. Đây là điều chưa từng có tiền lệ”, nhà khoa học thần kinh tính toán Alex Huth khẳng định.
Trong hơn một thập kỷ, giới nghiên cứu đă t́m cách dự đoán h́nh ảnh hoặc âm thanh dựa trên tín hiệu năo. Tuy nhiên, việc “dịch” những nội dung phức tạp như video hoặc h́nh dạng trừu tượng thành ngôn ngữ vẫn là một thách thức lớn.
Các phương pháp trước đây chỉ nhận diện được từ khóa đơn lẻ thay v́ toàn bộ ngữ cảnh như chủ thể, hành động và môi trường xung quanh.
Để vượt qua giới hạn này, nhóm nghiên cứu của ông Tomoyasu Horikawa – nhà khoa học thần kinh tại Pḥng thí nghiệm Khoa học truyền thông NTT (Nhật Bản) đă phát triển mô h́nh AI ngôn ngữ sâu. Đầu tiên, họ sử dụng một mô h́nh ngôn ngữ sâu để phân tích phụ đề của hơn 2.000 video, chuyển mỗi đoạn thành một “chữ kư ư nghĩa” – biểu đồ số thể hiện nội dung video.
Sau đó, nhóm huấn luyện một hệ thống AI khác nhận diện mối liên hệ giữa các “chữ kư ư nghĩa” này và hoạt động năo của 6 người tham gia khi họ xem video.
Kết quả cho thấy, AI có thể “dịch” chính xác những ǵ người tham gia đang xem hoặc tưởng tượng thành câu mô tả hoàn chỉnh, không chỉ liệt kê từ khóa.
Các chuyên gia nhận định, công nghệ “mind-captioning” không chỉ là cột mốc trong nghiên cứu khoa học thần kinh mà c̣n mở ra khả năng ứng dụng thực tiễn rộng lớn. Trong tương lai, kỹ thuật này có thể hỗ trợ người mất khả năng nói, giúp họ giao tiếp thông qua tín hiệu năo.
Dù c̣n ở giai đoạn đầu, “mind-captioning” đánh dấu bước tiến lớn trong hành tŕnh giải mă ngôn ngữ của tư duy con người, đưa viễn cảnh “đọc suy nghĩ” vốn chỉ có trong các bộ phim khoa học viễn tưởng đến gần hơn với thực tế.
VietBF@sưu tập