Con người từ lâu luôn bị thu hút bởi khả năng giao tiếp được với các loài động vật. Kỹ thuật máy học (Machine Learning) ngày càng tiến bộ, có thể biến khát vọng này trở thành hiện thực.
Thông thường, trí tuệ nhân tạo (AI) học hỏi thông qua hoạt động huấn luyện từ các thông tin cung cấp bởi nhiều nguồn như internet hay sách điện tử. Với mô hình ngôn ngữ của con người thì cách thức huấn luyện thường là đưa ra một câu với nhiều chỗ trống yêu cầu điền thêm chữ vào. Hiện nay, có vài phương cách sáng tạo hơn, chẳng hạn như ghép lời nói khớp với hoạt động của não.
Thế nhưng, việc phân tích ngôn ngữ của động vật lại hoàn toàn khác biệt . Giới khoa học máy tính phải hướng dẫn chương trình phần mềm tìm ra thông tin gì, tổ chức thông tin như thế nào? Quy trình này không chỉ dựa vào sự tích lũy lượng lớn các thông tin về âm thanh mà còn đòi hỏi ghép thông tin thu thập được với hành vi xử thế của động vật.
Ví dụ, một nhóm nghiên cứu về loài dơi ăn quả Ai Cập ghi lại hình ảnh bầy dơi để cung cấp hình ảnh cho tư liệu âm thanh mà họ thu thập được. Một nhóm khác nghiên cứu về cá voi dự tính sử dụng video clip, âm thanh, thẻ theo dõi ghi lại các chuyển động để giải mã cú pháp, ngữ nghĩa và cuối cùng là ý nghĩa đằng sau những gì cá voi đang giao tiếp với nhau. Vài nhóm nghiên cứu khác thì đề nghị phát lại thông tin âm thanh cho động vật nghe và xem các phản ứng của chúng ra sao!
Tạo ra dạng "Google dịch" cho động vật là một dự án đầy tham vọng đã được thực hiện trong nửa thập kỷ qua. Máy Học cho đến nay đã có thể xác định sự hiện diện của động vật, thậm chí nhận diện chính xác động vật qua tiếng gọi. Mặc dù vậy, chương trình phần mềm vẫn chưa thể hiểu hết các sắc thái phức tạp của ngôn ngữ loài động vật.
Nhiều người đã chỉ ra, mô hình ngôn ngữ AI còn thiếu sót trong sự hiểu biết mối liên quan giữa từ ngữ với đối tượng mà từ ngữ sẽ đề cập đến. Giới khoa học cũng chưa hiểu hết về thế giới động vật. AI hiện chỉ dựa vào việc lập bản đồ mối liên hệ giữa từ ngữ và hình ảnh, các mô hình này ít nhiều đều có sai sót riêng.
Một yếu tố khác là sự giao tiếp giữa các động vật có thể không hoạt động giống sự giao tiếp của con người, nếu nhân cách hóa chúng có thể làm sai lệch kết quả cuối cùng.
Có đề xuất nhằm sử dụng thuật toán máy học tự giám sát để phân tích dữ liệu âm thanh, máy tính cho giới khoa học nắm biết thêm về mô thức ngôn ngữ thể hiện trong dữ liệu phân tích.
|