VietBF - View Single Post

PinaColada

Deepseek công bố mô hình mới với khả năng tự tạo và kiểm chứng lời giải toán học, mở ra cuộc cạnh tranh minh bạch hiếm thấy giữa các phòng thí nghiệm AI lớn.

Mô hình DeepseekMath-V2 đạt hiệu suất khủng khi giải toán. Ảnh: Decoder.
Deepseek vừa công bố mô hình DeepseekMath-V2, mô hình đạt thành tích tương đương huy chương vàng tại hàng loạt cuộc thi toán học uy tín. Động thái này đặt công ty của Trung Quốc vào vị trí cạnh tranh trực tiếp với các phòng thí nghiệm AI hàng đầu của Mỹ, vốn dẫn đầu trong khả năng suy luận của mô hình ngôn ngữ.

Theo tài liệu kỹ thuật, DeepseekMath-V2 đạt kết quả ở mức huy chương vàng tại Olympic Toán học quốc tế (IMO) 2025 và kỳ thi CMO Trung Quốc 2024. Trong kỳ thi Putnam, mô hình ghi 118/120 điểm, vượt xa mốc 90 điểm của thí sinh con người đạt điểm cao nhất trong lịch sử. Những kết quả này là minh chứng cho khả năng xử lý các bài toán phức tạp.

Công ty Trung Quốc giải thích rằng hạn chế của các mô hình AI trước đây nằm ở việc dù có thể đưa ra đáp án đúng, chúng lại không trình bày được lời giải hợp lệ. Để khắc phục, DeepseekMath-V2 sử dụng quy trình nhiều giai đoạn gồm để đánh giá tính đúng đắn, kiểm tra các phản biện và đưa ra kết quả sau cùng. Cách vận hành này cho phép hệ thống tự rà soát và tinh chỉnh lời giải theo thời gian thực, tránh tình trạng kết luận đúng nhưng lập luận sai.

Điểm đáng chú ý là tài liệu của Deepseek không nhắc đến việc mô hình sử dụng công cụ bên ngoài như máy tính hay trình thông dịch mã. Thiết lập thử nghiệm cho thấy mọi kết quả được tạo ra hoàn toàn bằng ngôn ngữ tự nhiên.

Deepseek nhấn mạnh rằng hiệu suất đạt được đến từ khả năng tự phê bình và tự điều chỉnh lời giải, không dựa vào phần mềm toán học chuyên dụng. Đối với các bài toán khó, hệ thống tăng quy mô tính toán bằng cách tạo nhiều đáp án song song, từ đó nâng độ tin cậy của kết quả sau cùng.

Sự xuất hiện của DeepseekMath-V2 diễn ra ngay sau khi OpenAI và Google DeepMind thông báo các mô hình chưa công bố của họ cũng đạt mức huy chương vàng tại IMO. Đây là thành tích từng nằm ngoài khả năng của mô hình ngôn ngữ lớn. Tuy vậy, thông tin về các hệ thống này hiện rất hạn chế, ngoại trừ việc một nhà nghiên cứu của OpenAI cho biết phiên bản toán học mạnh hơn sẽ xuất hiện trong vài tháng tới.

Trái ngược với sự bí mật từ các công ty Mỹ, Deepseek lựa chọn công bố chi tiết phương pháp và kiến trúc kỹ thuật. Cách tiếp cận này giúp hãng thể hiện sự minh bạch, đồng thời tạo áp lực cạnh tranh lên hệ sinh thái AI của Mỹ. Theo The Economist, một số startup của Mỹ đã cân nhắc chuyển sang dùng mô hình nguồn mở giá rẻ từ Trung Quốc để tiết kiệm chi phí.

VietBF@ sưu tập