Một hệ thống trí tuệ nhân tạo mới có thể chuyển các tín hiệu từ năo người thành văn bản với độ chính xác lên đến 97%.
Vài năm trở lại đây, chúng ta đă quen với công nghệ chuyển đổi lời nói thành văn bản nhờ các trợ lư ảo của Amazon hay Google. Nhưng giờ đây, nhân loại đă có thêm một cột mốc ấn tượng nữa trong lịch sử phát triển với công nghệ chuyển đổi ư nghĩ thành văn bản.
Trong quá tŕnh giải mă điện tâm đồ bệnh động kinh, một nhóm nghiên cứu thuộc pḥng thí nghiệm của bác sĩ Edward Chang, Đại học California San Francisco (UCSF) đă t́m cách ghi lại tín hiệu phát ra từ vỏ năo bệnh nhân.
Các bác sĩ yêu cầu người bệnh đọc và lặp lại một số câu nói cho sẵn, đồng thời dùng các điện cực ghi lại tín hiệu cùng hoạt động của năo tại thời điểm đó.
Tín hiệu từ vỏ năo của bệnh nhân được ghi lại bằng các xung điện. Ảnh: mc.ai.
Từ dữ liệu thu thập được, nhóm này phân tích các tín hiệu của năo tương ứng với tín hiệu giọng nói nhất định: nguyên âm, phụ âm, chuyển động miệng…
Sau đó họ dùng một hệ thống thần kinh nhân tạo khác để giải mă ngược các tín hiệu này thành văn bản. Kho dữ liệu của thí nghiệm chỉ bao gồm khoảng 30-50 câu nói. Hệ thống sẽ cố gắng dự đoán và sắp xếp văn bản dựa trên tín hiệu của vỏ năo.
Ở điều kiện tốt nhất, hệ thống chuyển đổi này chỉ sai sót khoảng 3%. Xét trong điều kiện thí nghiệm, đây gần như là việc đọc suy nghĩ của người khác. Tuy nhiên, nhóm nghiên cứu cũng chỉ ra rằng những dự đoán không chính xác của hệ thống khác với với việc sai lệch mà chúng ta nghe nhầm bởi tai người.
Ví dụ: “The museum hires musicians every evening” (Bảo tàng thuê nhạc công vào mỗi tối) bị dự đoán thành “The museum hires musicians every expensive morning” (Bảo tàng thuê nhạc công vào mỗi sáng đắt đỏ).
Hoặc “Part of the cake was eaten by the dog” (Một phần chiếc bánh đă bị chó ăn) bị dự đoán thành “Part of the cake was the cookie” (Một phần chiếc bánh làm từ bánh quy).
Trong các trường hợp sai sót nhiều nhất, các lỗi ở văn bản đầu ra hầu như không liên quan về mặt ngữ nghĩa hay ngữ âm so với lời nói gốc.
Mặc dù vẫn c̣n nhiều hạn chế, nhưng hệ thống này có tiềm năng phát triển hướng đi mới cho việc giải mă hoạt động năo dựa trên trí tuệ nhân tạo AI để diễn tả lời nói của con người (với mức sai sót 5%).
Tất nhiên sự so sánh này chưa thực sự công bằng. Con người chuyển tải lời nói bằng việc dùng tới hàng chục ngh́n từ vựng. Ngược lại, hệ thống này chỉ phải học tín hiệu của khoảng 250 từ vựng với một tập hợp câu ngắn và hạn chế.
Nhóm nghiên cứu cho rằng trong tương lai, hệ thống sẽ đóng vai tṛ quan trọng trong việc hỗ trợ những bệnh nhân mất khả năng tṛ chuyện.
VietBF © sưu tầm