OpenAI cho biết có bằng chứng công ty Trung Quốc DeepSeek sử dụng các mô hình độc quyền của họ để đào tạo ra chatbot cạnh tranh.
OpenAI tuyên bố đã phát hiện bằng chứng cho thấy công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek của Trung Quốc có thể đã sử dụng các mô hình độc quyền của họ để đào tạo mô hình AI mã nguồn mở cạnh tranh. Thông tin này được đưa ra trong bối cảnh lo ngại ngày càng gia tăng về vi phạm sở hữu trí tuệ trong lĩnh vực AI.
Theo Financial Times, OpenAI cho biết họ đã tìm thấy một số bằng chứng liên quan đến kỹ thuật "chưng cất" (distillation), nghi ngờ xuất phát từ DeepSeek. Kỹ thuật này thường được các nhà phát triển sử dụng để cải thiện hiệu suất của các mô hình nhỏ hơn bằng cách tận dụng đầu ra từ các mô hình lớn và mạnh hơn, giúp đạt được kết quả tương tự với chi phí thấp hơn.
Mặc dù "chưng cất" là phương pháp phổ biến trong ngành, vấn đề nằm ở việc DeepSeek có thể đang sử dụng nó để xây dựng mô hình cạnh tranh của riêng mình, điều này vi phạm điều khoản dịch vụ của OpenAI. Công ty từ chối bình luận thêm hoặc cung cấp chi tiết về bằng chứng cụ thể. Điều khoản dịch vụ của OpenAI quy định người dùng không được "sao chép" bất kỳ dịch vụ nào hoặc "sử dụng đầu ra để phát triển các mô hình cạnh tranh".
"Mấu chốt là khi bạn sử dụng nó để tạo ra mô hình riêng phục vụ mục đích cá nhân", một nguồn tin thân cận với OpenAI chia sẻ.
Logo ứng dụng DeepSeek trên điện thoại (Ảnh: AFP)
Theo Bloomberg, OpenAI và đối tác Microsoft đã điều tra các tài khoản được cho là của DeepSeek vào năm ngoái. Những tài khoản này đã sử dụng giao diện lập trình ứng dụng (API) của OpenAI và bị chặn truy cập do nghi ngờ vi phạm điều khoản. Hiện tại, cả Microsoft và DeepSeek đều chưa đưa ra bình luận chính thức.
Trước đó, ông David Sacks, chuyên gia AI và tiền số của Tổng thống Mỹ Donald Trump, nhận định rằng "có khả năng" việc đánh cắp sở hữu trí tuệ (IP) đã xảy ra. "Trong AI có một kỹ thuật gọi là 'chưng cất' (distillation)... khi một mô hình học hỏi từ một mô hình khác và hấp thụ kiến thức từ mô hình gốc", ông Sacks cho biết trong cuộc phỏng vấn với Fox News ngày 28/1. "Có bằng chứng đáng kể cho thấy DeepSeek đã chưng cất kiến thức từ các mô hình của OpenAI, và tôi không nghĩ OpenAI hài lòng về điều này".
DeepSeek khẳng định họ chỉ sử dụng 2.048 card đồ họa Nvidia H800 và chi 5,6 triệu USD để đào tạo mô hình V3 với 671 tỷ tham số, một con số nhỏ so với chi phí mà OpenAI và Google bỏ ra để đào tạo các mô hình có quy mô tương đương. Tuy nhiên, một số chuyên gia nhận định rằng mô hình của DeepSeek tạo ra các phản hồi cho thấy nó có thể đã được đào tạo dựa trên đầu ra từ GPT-4 của OpenAI, điều này sẽ vi phạm điều khoản dịch vụ của công ty.
Ông Ritwik Gupta, chuyên gia về AI tại Đại học California, Berkeley, cho biết: "Việc các công ty khởi nghiệp và học giả sử dụng đầu ra từ các mô hình ngôn ngữ lớn (LLM) thương mại như ChatGPT để đào tạo một mô hình khác là rất phổ biến. Tôi không ngạc nhiên nếu DeepSeek được cho là cũng làm điều tương tự".
VietBF@sưu tập