Ngày 29/1, Công ty công nghệ Trung Quốc Alibaba đã phát hành phiên bản mới của mô hình trí tuệ nhân tạo Qwen 2.5 mà họ tuyên bố đã vượt qua DeepSeek-V3 đang Bđược ca ngợi rất nhiều.
Alibaba tung ra mô hình trí tuệ nhân tạo vào thời điểm bất thường. Ảnh: Reuters.
Thời điểm phát hành Qwen 2.5-Max bất thường, vào ngày đầu tiên của Tết Nguyên đán khi hầu hết người dân Trung Quốc nghỉ làm và ở bên gia đình, cho thấy áp lực mà sự trỗi dậy nhanh chóng của công ty khởi nghiệp AI Trung Quốc DeepSeek trong 3 tuần qua không chỉ đặt lên các đối thủ ở nước ngoài mà còn cả đối thủ cạnh tranh trong nước.
"Qwen 2.5-Max vượt trội hơn ... hầu như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B" - đơn vị đám mây của Alibaba cho biết trong một thông báo được đăng trên tài khoản WeChat chính thức của mình, ngụ ý đến các mô hình AI nguồn mở tiên tiến nhất của OpenAI và Meta.
Bản phát hành ngày 10/1 của trợ lý AI DeepSeek, được hỗ trợ bởi mô hình DeepSeek-V3, cũng như bản phát hành ngày 20/1 của mô hình R1, đã gây sốc cho Thung lũng Silicon và khiến cổ phiếu công nghệ lao dốc, với chi phí phát triển và sử dụng được cho là thấp của công ty khởi nghiệp Trung Quốc này khiến các nhà đầu tư đặt câu hỏi về kế hoạch chi tiêu khổng lồ của các công ty AI hàng đầu tại Mỹ.
Nhưng thành công của DeepSeek cũng dẫn đến một cuộc chạy đua giữa các đối thủ cạnh tranh trong nước để nâng cấp các mô hình AI của riêng họ.
Hai ngày sau khi phát hành DeepSeek-R1, chủ sở hữu TikTok là ByteDance đã phát hành bản cập nhật cho mô hình AI hàng đầu của mình, mà họ tuyên bố là vượt trội hơn o1 của OpenAI do Microsoft hỗ trợ trong AIME, một bài kiểm tra chuẩn mực đo lường mức độ hiểu và phản hồi của các mô hình AI đối với các hướng dẫn phức tạp.
Điều này lặp lại tuyên bố của DeepSeek rằng mô hình R1 của họ cạnh tranh với o1 của OpenAI trên một số điểm chuẩn hiệu suất.
DeepSeek so với các đối thủ trong nước
Tiền thân của mẫu V3 của DeepSeek, DeepSeek-V2, đã gây ra cuộc chiến giá mô hình AI tại Trung Quốc sau khi được phát hành vào tháng 5 năm ngoái.
Thực tế là DeepSeek-V2 là mã nguồn mở và có giá rẻ chưa từng có, chỉ 1 nhân dân tệ (0,14 USD) cho 1 triệu mã thông báo - hoặc đơn vị dữ liệu được xử lý bởi mô hình AI - đã khiến đơn vị đám mây của Alibaba tuyên bố giảm giá tới 97% cho một loạt các mô hình.
Các công ty công nghệ Trung Quốc khác cũng làm theo, bao gồm Baidu (công ty đã phát hành phiên bản tương đương đầu tiên của Trung Quốc với ChatGPT vào tháng 3/2023) và công ty internet có giá trị nhất của đất nước là Tencent.
Liang Wenfeng, nhà sáng lập bí ẩn của DeepSeek, đã nói trong một cuộc phỏng vấn hiếm hoi với hãng truyền thông Trung Quốc Waves vào tháng 7 rằng công ty khởi nghiệp này "không quan tâm" đến cuộc chiến giá cả và mục tiêu chính của họ là đạt được AGI (trí tuệ nhân tạo tổng quát).
OpenAI định nghĩa AGI là các hệ thống tự động vượt qua con người trong hầu hết các nhiệm vụ có giá trị kinh tế.
Trong khi các công ty công nghệ lớn của Trung Quốc như Alibaba có hàng trăm nghìn nhân viên, DeepSeek hoạt động giống như một phòng thí nghiệm nghiên cứu, chủ yếu do những sinh viên mới tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc điều hành.
Liang cho biết trong cuộc phỏng vấn vào tháng 7 rằng ông tin rằng các công ty công nghệ lớn nhất của Trung Quốc có thể không phù hợp với tương lai của ngành AI, khi so sánh chi phí cao và cơ cấu theo hướng từ trên xuống của họ với hoạt động tinh gọn và phong cách quản lý lỏng của DeepSeek.
"Các mô hình nền tảng lớn đòi hỏi sự đổi mới liên tục, khả năng của các gã khổng lồ công nghệ có giới hạn của chúng", ông nói.
VietBF@ sưu tập