Rời Mỹ về nước, Nguyễn Hoàng Quân cùng các cộng sự tại VILM, phát triển hệ thống trí tuệ nhân tạo (AI) miễn phí cho người Việt sử dụng trong các lĩnh vực chăm sóc khách hàng với hơn trăm nghìn lượt tải mỗi tháng.
Tháng 6/2023, Nguyễn Hoàng Quân, 25 tuổi, cùng các cộng sự Phạm Nhựt Huy, 23 tuổi, kỹ sư trí tuệ nhân tạo tại ZaloAI và Đào Minh Dũng, 24 tuổi, nghiên cứu sinh tại University of Cork, Ireland, đồng sáng lập tổ chức phi lợi nhuận VILM, với mong muốn giúp người Việt được trải nghiệm công nghệ AI tiên tiến nhất một cách tối ưu.
Sau gần 6 tháng nghiên cứu và ứng dụng, nhóm phát triển thành công ba mô hình AI miễn phí gồm OpenHermes, VinaLlama và Vistral. Đây là các nghiên cứu nền để phát triển hệ thống AI có thể hiểu và hành động theo ý người dùng (Large Action Model - Mô hình hành động lớn). Các mô hình này để ứng dụng trong các lĩnh vực công nghệ như sử dụng trong điều khiển máy móc, robot giúp hỗ trợ người khuyết tật tốt hơn mà không cần người chăm sóc, hoặc giúp lập trình viên chỉnh sửa lỗi, trợ lý ảo chăm sóc khách hàng hoặc hỏi đáp miễn phí.
OpenHermes đạt 85.000 lượt tải mỗi tháng, đạt top 10 các mô hình ngôn ngữ được tải nhiều nhất trên HuggingFace (trang chia sẻ mô hình AI lớn nhất thế giới). Ảnh chụp màn hình
Mô hình OpenHermes là mô hình ngôn ngữ lớn hỗ trợ tiếng Anh giống ChatGPT, song có điểm số vượt trội. Chúng cho phép người dùng tải mô hình về máy tính cá nhân sử dụng mà không cần internet. Đặc biệt, lượng dữ liệu huấn luyện của OpenHermes chỉ bằng 1/100 dung lượng dữ liệu huấn luyện của ChatGPT từ OpenAI. Hiện ứng dụng này nhận được hơn 50.000 lượt tải mỗi tháng. OpenHermes-2.5 và OpenHermes-2.5-Vision đang được hơn 40 nhà khởi nghiệp tại Silicon Valley (Mỹ) sử dụng,
Còn VinaLlama và Vistral là hai mô hình ngôn ngữ tập trung vào phục vụ thị trường Việt, hướng tới giúp người dùng trong nước được trải nghiệm công nghệ AI tiên tiến nhất một cách dễ dàng hơn.
Hoàng Quân từng có 7 năm học tập tại Mỹ và làm việc tại công ty OpenAI với vai trò kỹ sư nghiên cứu cho mô hình trí tuệ nhân tạo ChatGPT dù chưa tốt nghiệp đại học. Năm 2022, cậu làm kỹ sư dữ liệu cho sản phẩm Bing Chat của Microsoft và OpenAI với mức thu nhập nghìn USD. Đến năm 2023, đứng trước làn sóng sa thải công nghệ tại Mỹ, Quân nhận thấy thị trường lao động sau khi tốt nghiệp rất ảm đạm, song nhìn được cơ hội ở Việt Nam nên cậu quyết định về nước.
Tại VILM, Quân là kỹ sư trưởng chịu trách nhiệm chính trong nghiên cứu các kỹ thuật cải tiến dữ liệu cũng như huấn luyện AI. Trong khi Nhựt Huy đảm nhiệm vai trò nghiên cứu kỹ thuật khi huấn luyện AI và Minh Dũng đề xuất các phương pháp mới trong nghiên cứu lý thuyết.
Quân giải thích, các mô hình ngôn ngữ lớn hiện nay như ChatGPT (Large Language Model) chỉ có thể cung cấp dữ liệu đầu ra là chữ, trong khi con người có rất nhiều cách để giao tiếp và thu nhận kiến thức. Đó là lý do nhóm đặt mục tiêu tạo hệ thống có thể vận hành linh hoạt giữa các loại input và output (có thể nhận và xuất các loại dữ liệu như ngôn ngữ, hình ảnh, video, âm thanh) khác nhau, không chỉ dừng ở mức ngôn ngữ.
Để đạt được mục tiêu tạo ra mô hình hành động lớn (Large Action Models), nhóm phải vượt qua hai bài toán: bảo mật và tốc độ. Các ứng dụng AI hiện tại đa số dùng dữ liệu của người dùng và gửi đến máy chủ của các công ty như OpenAI để xử lý, điều này gây ra quan ngại về bảo mật. Nhóm tập trung tạo ra các mô hình AI đủ nhỏ và nhanh để có thể xử lý trực tiếp trên các thiết bị di động, đồng thời phải cân đối giữa hiệu năng và tốc độ để tránh ảnh hưởng đến trải nghiệm của người dùng.
Nhóm thử nghiệm sử dụng dữ liệu được sinh ra từ AI để cho chính AI học lại, thay vì đi theo con đường sử dụng dữ liệu từ nguồn thật. Ban đầu họ gặp khó khăn trong việc tìm nguồn lực về tính toán (máy tính để huấn luyện AI), nhưng sau đó đã thuyết phục được các công ty, phòng lab lớn trên thế giới tài trợ.
Quân cho hay việc làm các sản phẩm này chủ yếu hỗ trợ mọi người tiếp cận các ứng dụng AI nhanh chóng và chất lượng không thua kém ChatGPT hay Bing Chat và giúp việc nghiên cứu, sáng tạo các mô hình AI sau này có thể đơn giản hơn. Thay vì sử dụng ChatGPT còn hạn chế trong ngôn ngữ và văn hóa Việt, các doanh nghiệp Việt Nam có thể tải VinaLlama bằng tiếng Việt.
Mô hình ngôn ngữ VinaLlama xử lý dễ dàng một bài toán trong tiếng Việt, trong ảnh là demo của sản phẩm VinaLlama trong việc giải toán. Ảnh chụp màn hình.
Ông Đặng Hải Lộc, Founder nền tảng xây dựng Chatbot AI Mindmaid, cho hay dưới góc độ người làm AI ứng dụng, ông nhận thấy chi phí và an toàn dữ liệu (data privacy) là hai vấn đề mà doanh nghiệp thường bận tâm nhất khi triển khai ứng dụng AI. Giải pháp thỏa đáng nhất cho bài toán này là các mô hình LLM nguồn mở, có khả năng chạy trên hạ tầng của doanh nghiệp và có thể học (fine-tune) thêm dữ liệu riêng của doanh nghiệp. Do đó các mô hình LLM nguồn mở tiếng Việt như VinaLlama, Vistral... rất có giá trị trong việc thúc đẩy ứng dụng AI tại Việt Nam.
"Các mô hình nguồn mở này cũng tạo điều kiện cho nhiều lập trình viên, người đam mê công nghệ có thể tiếp cận với lĩnh vực AI Engineer hơn chỉ với một chiếc macbook thay vì phải đầu tư hạ tầng GPU (Card màn hình) tốn kém. Điều này cũng sẽ thúc đẩy lực lượng AI Engineer tại Việt Nam, một vai trò đang có nhu cầu rất cao trong thời gian tới", ông Lộc nói.
Theo Quân, người Việt có nền tảng rất tốt về lý thuyết khoa học, giỏi AI và cả ChatGPT cũng có nhân lực tham gia nghiên cứu, nhưng lại gặp khó khăn hơn trong bắt kịp nhanh chóng làn sóng công nghệ luôn thay đổi. "Điều người Việt cần là trải nghiệm trong làm sản phẩm cho người dùng cuối để thực sự hiểu được các vấn đề họ gặp phải nhằm định hướng đúng nghiên cứu của mình", Quân nói về lý do nghiên cứu các mô hình AI miễn phí nhằm hỗ trợ người Việt làm công nghệ. Cậu cho biết đã hợp tác với nhiều nhóm quốc tế và luôn sẵn sàng hợp tác với các nhóm nghiên cứu tại Việt Nam.