Deepseek công bố mô h́nh mới với khả năng tự tạo và kiểm chứng lời giải toán học, mở ra cuộc cạnh tranh minh bạch hiếm thấy giữa các pḥng thí nghiệm AI lớn.

Mô h́nh DeepseekMath-V2 đạt hiệu suất khủng khi giải toán. Ảnh: Decoder.
Deepseek vừa công bố mô h́nh DeepseekMath-V2, mô h́nh đạt thành tích tương đương huy chương vàng tại hàng loạt cuộc thi toán học uy tín. Động thái này đặt công ty của Trung Quốc vào vị trí cạnh tranh trực tiếp với các pḥng thí nghiệm AI hàng đầu của Mỹ, vốn dẫn đầu trong khả năng suy luận của mô h́nh ngôn ngữ.
Theo tài liệu kỹ thuật, DeepseekMath-V2 đạt kết quả ở mức huy chương vàng tại Olympic Toán học quốc tế (IMO) 2025 và kỳ thi CMO Trung Quốc 2024. Trong kỳ thi Putnam, mô h́nh ghi 118/120 điểm, vượt xa mốc 90 điểm của thí sinh con người đạt điểm cao nhất trong lịch sử. Những kết quả này là minh chứng cho khả năng xử lư các bài toán phức tạp.
Công ty Trung Quốc giải thích rằng hạn chế của các mô h́nh AI trước đây nằm ở việc dù có thể đưa ra đáp án đúng, chúng lại không tŕnh bày được lời giải hợp lệ. Để khắc phục, DeepseekMath-V2 sử dụng quy tŕnh nhiều giai đoạn gồm để đánh giá tính đúng đắn, kiểm tra các phản biện và đưa ra kết quả sau cùng. Cách vận hành này cho phép hệ thống tự rà soát và tinh chỉnh lời giải theo thời gian thực, tránh t́nh trạng kết luận đúng nhưng lập luận sai.
Điểm đáng chú ư là tài liệu của Deepseek không nhắc đến việc mô h́nh sử dụng công cụ bên ngoài như máy tính hay tŕnh thông dịch mă. Thiết lập thử nghiệm cho thấy mọi kết quả được tạo ra hoàn toàn bằng ngôn ngữ tự nhiên.
Deepseek nhấn mạnh rằng hiệu suất đạt được đến từ khả năng tự phê b́nh và tự điều chỉnh lời giải, không dựa vào phần mềm toán học chuyên dụng. Đối với các bài toán khó, hệ thống tăng quy mô tính toán bằng cách tạo nhiều đáp án song song, từ đó nâng độ tin cậy của kết quả sau cùng.
Sự xuất hiện của DeepseekMath-V2 diễn ra ngay sau khi OpenAI và Google DeepMind thông báo các mô h́nh chưa công bố của họ cũng đạt mức huy chương vàng tại IMO. Đây là thành tích từng nằm ngoài khả năng của mô h́nh ngôn ngữ lớn. Tuy vậy, thông tin về các hệ thống này hiện rất hạn chế, ngoại trừ việc một nhà nghiên cứu của OpenAI cho biết phiên bản toán học mạnh hơn sẽ xuất hiện trong vài tháng tới.
Trái ngược với sự bí mật từ các công ty Mỹ, Deepseek lựa chọn công bố chi tiết phương pháp và kiến trúc kỹ thuật. Cách tiếp cận này giúp hăng thể hiện sự minh bạch, đồng thời tạo áp lực cạnh tranh lên hệ sinh thái AI của Mỹ. Theo The Economist, một số startup của Mỹ đă cân nhắc chuyển sang dùng mô h́nh nguồn mở giá rẻ từ Trung Quốc để tiết kiệm chi phí.
VietBF@ sưu tập