Bạn có bắt đầu làm quen với sự
"toàn năng" của ứng dụng nổi tiếng
DeepSeek hay không?
DeepSeek dường như có thể mang đến cho bạn mọi câu trả lời thỏa đáng và thích thú: viết ra một bản kế hoạch; tra cứu một vấn đề về y khoa; t́m một lời khuyên hay ngay cả cho giải mă một giấc mơ...
Nhưng trên thực tế, không một ai có thể ngờ rằng,
DeepSeek, vốn đang ngày càng được nhiều người tin tưởng, lại thực sự có thể nói ra những điều
"vô nghĩa một cách nghiêm túc".

(Minh họa)
AI không phải phương tiện toàn năng, thậm chí c̣n gây hoang mang v́ cung cấp rất nhiều thông tin hoàn toàn sai lệch
"DeepSeek không đáng tin cậy cho việc t́m kiếm các tài liệu", một giáo sư từ một trường đại học nổi tiếng ở Quảng Châu (TQ) gần đây đă lên tiếng kêu ca, phàn nàn. Ban đầu, giáo sư này muốn sử dụng
DeepSeek để t́m kiếm thông tin về
"Tiếng Quảng Đông toàn cầu: Sự lan tỏa của ngôn ngữ và văn hóa Quảng Đông". Tuy nhiên, sau khi xác minh ra, ông đă phát hiện tác giả mà
DeepSeek cung cấp là
"giả mạo", "năm tháng không đúng" và "nơi xuất bản hoàn toàn không có liên quan ǵ cả". Sau khi trao đổi thêm,
DeepSeek đă thừa nhận các thông tin đó là sai, cảm ơn ông đă sửa lỗi và bày tỏ lời xin lỗi.
Gần đây, Zhan Guoshu, một nhân vật trong giới truyền thông nổi tiếng và là cựu tổng biên tập của ấn bản nước ngoài của tờ Nhân dân Nhật báo, cũng đă đăng một bài viết có tựa đề:
"Sai sót chết người của DeepSeek: thông tin bịa đặt".
Zhan Guoshu đă cho trích dẫn ra kinh nghiệm cá nhân của ḿnh trong bài viết và yêu cầu
DeepSeek viết về
"Sử kư của Đại sử gia: Tiểu sử của Chiêm Quốc Thư". Tuy nhiên, thông tin căn bản nhất như nơi sinh và họ mẹ được hiển thị trong câu trả lời đầu tiên đă bị ghi là
"SAI". Sau đó, ông yêu cầu
DeepSeek viết ra một bài tường thuật của một phóng viên nào đó, với phong cách sống động và kèm theo nhiều ví dụ. Tuy nhiên, khi nó được chuyển cho chính người phóng viên, anh ta đă phủ nhận hoàn toàn mọi thứ.

(Minh họa)
Người ta ca tụng rằng,
DeepSeek có kỹ năng viết tuyệt vời và tŕnh độ văn chương cao, nhưng tác phẩm nổi tiếng
"Thế giới b́nh thường" của Lục Dao lại bị lầm lẫn khi cho là tác phẩm tiêu biểu của Chiêm Quốc Thư. Điều này là hết sức nguy hại, bởi v́ nếu không có kiến thức hiểu biết vững vàng, người dùng rất dễ bị
"đánh lừa" từ những thông tin sai lệch được
DeepSeeK đưa ra.
Trên thực tế, việc thể hiện ra thông tin không chính xác gần như đă trở thành một trong những vấn đề bị phàn nàn nhiều nhất của ứng dụng
DeepSeek này. Trong đó, việc lầm lẫn khi
"râu ông nọ cắm cằm bà kia" của các tác phẩm và tác giả là điều thường xuyên xảy ra. Bởi vậy, nhiều người đă cho rằng
DeepSeek chỉ phù hợp để viết mă và tính toán, và hoàn toàn không thân thiện hoặc hữu ích ǵ với sinh viên chuyên ngành nghệ thuật tự do.
Một số người đă thử sử dụng DeepSeek để ôn thi cấp quốc gia và cấp tỉnh đă phải học lại sách giáo khoa bởi v́ những thông tin căn bản đều bị sai lệch quá lớn.
Một số cư dân mạng cố gắng giải tỏa nguồn lực thông qua
DeepSeek cũng bị nếm
"quả lừa đảo thậm tệ". Ví dụ, một người đă sử dụng
DeepSeek để viết ra một bài báo và trích dẫn với bốn ví dụ, nhưng khi cho xác minh lại thông tin, anh ta không thể t́m thấy ba ví dụ trong số đó. Cuối cùng, anh ta phát hiện ra rằng, tất cả chúng đều do chính
DeepSeek cố t́nh bày vẽ ra.
"Tôi nghĩ rằng tôi đến đây để giúp giải thoát bản thân, nhưng không ngờ tôi phải tốn nhiều công sức hơn để xác minh ra thông tin", người dùng này than văn.
Nhưng điều đáng sợ nhất lại là: Sự bịa đặt trắng trợn

Một người dùng ở Thiểm Tây (TQ) luôn bị bối rối trước thực tế là sự quy hoạch đường bộ ở Tây An đ̣i hỏi phải đi đường ṿng qua An Định Môn. Khi anh hỏi cảnh sát giao thông địa phương và tài xế taxi đang làm nhiệm vụ, nhưng họ không thể có câu trả lời rơ ràng. Thấy ứng dụng
DeepSeek được nhiều người ưa chuộng, anh quyết định thử và hỏi
DeepSeek,
"Trong quy hoạch đường bộ của Tây An, tại sao các anh không đi thẳng từ phần phía Bắc của Đường vành đai Tây đến phần phía Nam của Đường vành đai Tây, mà lại phải đi đường ṿng qua An Định Môn?"
DeepSeek lần đầu tiên đề xuất khái niệm
"Khu vực hạn chế tiếng ồn của thành phố" trong phần giải thích của ḿnh, nêu rằng theo
"Kế hoạch bảo vệ thành phố lịch sử và văn hóa Tây An (2020-2035)", các khu vực bảo vệ cấp một và cấp hai được chỉ định chung quanh An Định Môn. Bản chất của việc này là bảo vệ các di tích văn hóa và ngăn ngừa sự rung động quá mức.
DeepSeek thậm chí c̣n liệt kê số liệu không gian cụ thể, chẳng hạn như khoảng cách sẽ tăng lên bao nhiêu và độ sâu truyền rung động sẽ thay đổi ra sao.
Thoạt nh́n, lời giải thích này nghe có vẻ rất hợp lư với các lư thuyết, số liệu và chính sách có độ tin cậy cao. Tuy nhiên, khi cư dân mạng cho kiểm tra, họ phát hiện ra rằng không hề có khái niệm
"khu vực hạn chế tiếng ồn" trong văn bản
"Kế hoạch bảo vệ thành phố văn hóa lịch sử Tây An (2020-2035)". Câu trả lời có vẻ rất chuyên nghiệp và hợp lư này nhưng thực chất chỉ là sự
"bịa đặt trắng trợn".
Người dùng đă phản hồi cho
DeepSeek và nó rất trung thực và chân thành xin thừa nhận lỗi lầm của ḿnh. Thực sự không có đề cập nào đến
"vùng hạn chế tiếng ồn" trong tài liệu. Đôi khi, để làm cho câu trả lời của ḿnh có giá trị sâu sắc,
DeepSeek sẽ cho sử dụng một số thuật ngữ chuyên môn. Khi
"ngôn từ" đi vượt quá nhận thức của người dùng, điều đó có thể thực sự gây ra hoang mang cho mọi người và khiến cho họ khó phân biệt đâu là thật hay giả.
Câu hỏi đặt ra là, tại sao DeepSeek lại giả vờ biết điều ǵ đó trong khi nó không hề biết đến, thậm chí c̣n đi nói dối?
Nguyên nhân chẳng qua là do ảo giác của AI. Ngành kỹ nghệ sử dụng thuật ngữ này để mô tả hiện tượng
AI "nói dối", tức là câu trả lời đầu ra có vẻ hợp lư và mạch lạc về nội dung, nhưng
"không nhất quán với ư định của câu hỏi đầu vào, không có nhất quán với kiến thức thế giới, không có nhất quán với thực tế hoặc số liệu đă biết hoặc không thể xác minh ra được".
Đây không chỉ là lỗi của
DeepSeek. Tháng 8 năm ngoái,
Arthur AI, một công ty khởi nghiệp về trí tuệ nhân tạo và nền tảng giám sát máy học có trụ sở tại New York, đă công bố một báo cáo so sánh khả năng xuất hiện ảo giác trong các mô h́nh ngôn ngữ lớn do
OpenAI, Meta, Anthropic và
Cohere phát minh ra. Báo cáo nghiên cứu cho thấy những mô h́nh lớn này sẽ có thể gây ra ảo giác.
Tuy nhiên, so với các thiết bị tương tự, hiện tượng
"ảo giác" của
DeepSeeK-R1 lại rơ ràng hơn. Trong thử nghiệm ảo giác
Vectara HHEM AI (một thử nghiệm có thẩm quyền trong ngành đánh giá tỷ lệ ảo giác của mô h́nh bằng cách phát hiện xem nội dung do mô h́nh ngôn ngữ tạo ra có phù hợp với bằng chứng ban đầu hay không, giúp tối ưu hóa và lựa chọn mô h́nh),
DeepSeek-R1 cho thấy tỷ lệ ảo giác là 14,3%. Con số này không chỉ cao hơn gần 4 lần so với thế hệ trước là
DeepSeek-V3 mà c̣n vượt xa mức trung b́nh của ngành AI này.

(Minh họa)
Bản thân
DeepSeek cũng thừa nhận rơ ràng
"những hạn chế về mặt kỹ thuật" bao gồm: logic căn bản của việc tạo ra nội dung mô h́nh với quy mô lớn hiện nay dựa trên xác suất và thực sự có một thách thức về độ tin cậy không đồng đều của các thông tin được tạo ra. Nói một cách đơn giản hơn, nó không
"chính thức". Bất cứ nội dung nào trên Internet, dù đúng hay sai, đều có thể trở thành tài liệu tham khảo cho
DeepSeeK và
DeepSeeK chỉ chịu trách nhiệm suy luận dựa trên nội dung hiện có và không chịu trách nhiệm về thông tin được thu thập đó có chính xác hay không.
Lư do khiến cho ảo giác của
DeepSeek-R1 nghiêm trọng hơn là v́ nó làm tăng cường
"chuỗi suy nghĩ" (CoT) và khả năng sáng tạo. Ví dụ,
DeepSeek-R1 không chỉ có thể viết ra năm chữ khổ thơ và bảy chữ khổ thơ, mà c̣n viết rất trôi chảy, có hiểu biết riêng về quan niệm nghệ thuật của thơ ca. Khả năng sáng tạo mạnh mẽ như vậy là do tính sáng tạo của mô h́nh liên tục được khuyến khích trong quá tŕnh đào tạo tăng cường
DeepSeek-R1 trong các nhiệm vụ nghệ thuật tự do.
Tuy nhiên, nó cũng đi kèm với các
"tác dụng phụ". Ví dụ, trong quá tŕnh tăng cường
"chuỗi tư duy",
DeepSeek-R1 không tối ưu hóa các thao tác tương đối đơn giản như cho tóm tắt, dịch thuật và viết tin tức, mà bổ sung cách suy nghỉ ở nhiều cấp độ khác nhau và sẽ tiếp tục cho mở rộng. Do đó, khi đối mặt với các vấn đề phức tạp hoặc khó khăn, khó có thể thực hiện vượt quá mức b́nh thường và thậm chí chỉ đưa ra những câu trả lời bất ngờ. Tuy nhiên, khi đối mặt với một số nhiệm vụ đơn giản,
DeepSeek-R1 có thể thực hiện vượt mức v́ nó đă quen với lối suy nghỉ sâu.
Làm thế nào để tránh được những "cú lừa tức tưởi"?

(Minh họa)
Khi cho đem ra để so sánh,
DeepSeek-R1 thực sự logic hơn trong ngành
"khoa học", nhưng trong
"nghệ thuật tự do", nó có thể liên kết nội dung không có liên quan và bịa ra chuyện. V́ lư do này, khi kỷ nguyên AI ngày càng tiếnt triển, chúng ta cần t́m kiếm sự thật hơn bao giờ hết và nâng cao khả năng phân biệt đúng sai và cách thức suy nghĩ độc lập.
Hiện tượng này chỉ ra thật chính xác những sự rủi ro tiềm tàng và gióng lên hồi chuông cảnh cáo cho kỷ nguyên AI sắp tới. Với tư cách là người dùng, điều mà chúng ta có thể làm là t́m ra cách áp dụng AI theo đúng cách và không để bị lừa. Ví dụ, phương pháp đơn giản nhất là phải siêng năng và tiến hành t́m kiếm sự so sánh thông qua các công cụ t́m kiếm khác. Hoặc bạn có thể nhấp vào nguồn web được
DeepSeek trích dẫn trong câu trả lời để xem xét trường hợp được đề cập ra có thực sự tồn tại hay không.
Trong môi trường bùng nổ thông tin ngày nay và khó phân biệt sự thật và sự dối trá, mọi người nên liên tục tăng cường nhận thức đúng đắn về bản thân. Một lối suy nghĩ độc lập hơn có nghĩa là ít có khả năng bị lừa dối hơn. Cuối cùng, AI không thể giải quyết vấn đề một lần và măi măi. Thay vào đó, nó đặt ra những mức yêu cầu cao hơn, bao gồm cách đặt câu hỏi, cách giao tiếp với AI và cách phân biệt ra thông tin đúng sai.