AI "giá rẻ" của Trung Quốc làm Thung lũng Silicon chao đảo: Đ̣n khắc chế Bắc Kinh của Mỹ vô hiệu?
DeepSeek - công ty trí tuệ nhân tạo (AI) Trung Quốc đă khiến Thung lũng Silicon kinh ngạc về cách lập tŕnh viên của họ đạt được những thành tựu gần như tương đương với các đối thủ Mỹ mặc dù sử dụng chip kém tiên tiến hơn.
Các mô h́nh AI từ DeepSeek đă vươn lên và lọt vào top 10 toàn cầu về hiệu suất trên bảng xếp hạng Chatbot Arena. Theo đánh giá của Wall Street Journal (WSJ), điều này cho thấy những hạn chế xuất khẩu của Mỹ đang gặp khó khăn trong việc ngăn chặn những tiến bộ nhanh chóng ở Trung Quốc.
Sản phẩm được DeepSeek ra mắt trong bối cảnh Mỹ vẫn duy tŕ các hạn chế xuất khẩu ngặt nghèo áp đặt lên ngành công nghiệp bán dẫn của Trung Quốc. Đây vốn là một trong những nỗ lực quy mô lớn của chính quyền Mỹ tiền nhiệm nhằm cản trở khả năng của Trung Quốc trong việc tiếp cận và sản xuất các chip mà Washington cho là có thể giúp thúc đẩy AI, phục vụ cho các ứng dụng quân sự, hoặc có thể đe dọa an ninh quốc gia của Mỹ.
Thung lũng Silicon phải bất ngờ
Ngày 20/1, DeepSeek đă cho ra mắt R1, một mô h́nh chuyên biệt được thiết kế cho các nhiệm vụ yêu cầu suy luận và giải quyết vấn đề phức tạp.
"Deepseek R1 là một trong những phát triển đáng kinh ngạc và ấn tượng nhất mà tôi từng thấy," Marc Andreessen, nhà đầu tư mạo hiểm Thung lũng Silicon từng tham gia cố vấn cho Tổng thống Trump nhận xét trong một bài đăng trên X.
Hiện tại, cả 2 mô h́nh R1 và V3 của Deepseek đều nằm trong top 10 trên Chatbot Arena, nền tảng do các nhà nghiên cứu tại Đại học California, Berkeley tổ chức nhằm đánh giá hiệu suất chatbot. Gemini của Google giữ vị trí đầu bảng, trong khi DeepSeek vượt qua mô h́nh Claude của Anthropic và Grok do xAI của Elon Musk phát triển.
Các chuyên gia cho rằng công nghệ của DeepSeek vẫn kém hơn so với OpenAI và Google nhưng thừa nhận công ty Trung Quốc là đối thủ sát sườn dù sử dụng chip kém tiên tiến hơn, với số lượng ít hơn, và trong một số trường hợp c̣n bỏ qua những bước mà các nhà phát triển Mỹ coi là cần thiết.
Mô h́nh AI "giá rẻ"
DeepSeek tiết lộ, họ mất 5,6 triệu USD để đào tạo một trong những mô h́nh mới nhất của ḿnh, thấp hơn nhiều so với mức 100 triệu đến 1 tỷ USD mà Dario Amodei, giám đốc điều hành của startup AI Anthropic đưa ra hồi năm ngoái cho chi phí để xây dựng 1 mô h́nh.
Barrett Woodside, đồng sáng lập công ty phần cứng AI Positron tại San Francisco, cho biết ông và đồng nghiệp của ḿnh đă bàn tán sôi nổi về DeepSeek. "Thật là tuyệt vời," Woodside vừa nói vừa chỉ vào các mô h́nh mă nguồn mở của DeepSeek, trong đó mă phần mềm đằng sau mô h́nh AI được cung cấp miễn phí.
Mặc dù mô h́nh của DeepSeek là miễn phí, nhưng người dùng sẽ mất phí để kết nối ứng dụng của ḿnh với mô h́nh và cơ sở hạ tầng tính toán của DeepSeek. Ví dụ như trường hợp một doanh nghiệp muốn khai thác công nghệ để cung cấp câu trả lời AI cho câu hỏi của khách hàng.
Đầu năm ngoái, DeepSeek đă giảm giá dịch vụ này xuống chỉ bằng một phần so với các nhà cung cấp khác. Điều này cho thấy ngành công nghiệp ở Trung Quốc đă bắt đầu cuộc chiến giá cả.
Anthony Poo, đồng sáng lập một công ty khởi nghiệp đặt trụ sở ở Thung lũng Silicon, cho biết công ty của ông đă chuyển từ mô h́nh Claude của Anthropic sang sử dụng mô h́nh của DeepSeek vào tháng 9. Các thử nghiệm cho thấy DeepSeek hoạt động tương tự chỉ với khoảng một phần tư chi phí.
"Mô h́nh của OpenAI là tốt nhất về hiệu suất, nhưng chúng tôi không muốn trả tiền cho những tính năng mà chúng tôi không cần", Poo nói.
Một số nhà nghiên cứu cho rằng mô h́nh DeepSeek thiếu một số tính năng nhất định của các đối thủ đắt tiền hơn, chẳng hạn như duy tŕ ngữ cảnh trong các cuộc hội thoại dài.
Cái khó ló cái khôn
DeepSeek phát triển từ đơn vị nghiên cứu AI của High-Flyer, đơn vị quản lư quỹ pḥng hộ với 8 tỷ USD tài sản, nổi tiếng với việc sử dụng AI để giao dịch.
Năm 2019, High-Flyer bắt đầu xây dựng một cụm chip phục vụ cho nghiên cứu AI, một phần từ nguồn vốn thu được nhờ kinh doanh tài chính. Công ty này sau đó đă xây dựng một cụm chip lớn hơn với khoảng 10.000 đơn vị xử lư đồ họa Nvidia, có thể được sử dụng để đào tạo các mô h́nh ngôn ngữ lớn.
Chỉ có một vài công ty ở Trung Quốc có cơ sở hạ tầng máy tính đủ mạnh để phát triển những mô h́nh như vậy vào cuối năm 2022, khi OpenAI phát hành ChatGPT.
DeepSeek cho biết trong một báo cáo kỹ thuật rằng họ đă sử dụng một cụm hơn 2.000 chip Nvidia để đào tạo mô h́nh V3 của ḿnh, ít hơn so với hàng chục ngh́n chip mà các nhà phát triển khác đă sử dụng để đào tạo các mô h́nh cùng kích thước.
Một số chuyên gia AI Mỹ gần đây đă đặt câu hỏi liệu High-Flyer và DeepSeek có đang tiếp cận sức mạnh hạ tầng vượt trội hơn những ǵ họ đă công bố hay không.
Đối với mô h́nh mới nhất được phát hành hôm 20/1, DeepSeek đă bỏ qua quá tŕnh tinh chỉnh có giám sát (SFT), trong đó các lập tŕnh viên nhập vào kiến thức của các chuyên gia để cho mô h́nh một khởi đầu. DeepSeek cho biết mô h́nh của họ có thể sánh ngang với mô h́nh lư luận o1 của OpenAI dù bỏ qua quá tŕnh SFT và tập trung vào quá tŕnh học tăng cường (RL).
Jim Fan, nhà khoa học nghiên cứu cấp cao tại Nvidia đă khen báo cáo của DeepSeek là đột phá. Ông cho biết, DeepSeek khiến ông nhớ tới các chương tŕnh AI tiên phong từng làm chủ các tṛ chơi như cờ vua "từ con số 0, mà không phải bắt chước các kỳ thủ hàng đầu trước".
Zack Kass, cựu giám đốc điều hành tại OpenAI, nhận xét rằng những tiến bộ mà DeepSeek có được dù gặp phải hạn chế từ Mỹ "nhấn mạnh một bài học lớn hơn: Cái khó ló cái khôn".
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. V́ một tương lai tươi đẹp cho các thế hệ Việt Nam hăy ghé thăm chúng tôi, hăy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.