HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other > Computer News|Tin Vi Tính


Reply
Thread Tools
 
 
  #1  
Old  Default Chatbot AI đang trở nên 'điên' hơn
Một làn sóng mới của các hệ thống "suy luận" từ các công ty như OpenAI đang khiến thông tin sai lệch xảy ra thường xuyên hơn. Điều nguy hiểm là các công ty cũng không biết tại sao.

Tháng 4, một bot AI xử lý hỗ trợ kỹ thuật cho Cursor, công cụ mới nổi dành cho các lập trình viên, đã thông báo cho một số khách hàng về một thay đổi trong chính sách của công ty. Cụ thể, thông báo cho biết họ không còn được phép sử dụng Cursor trên nhiều hơn một máy tính.

Trên các diễn đàn và mạng xã hội, khách hàng đã đăng bài bày tỏ sự tức giận. Một số thậm chí còn hủy tài khoản Cursor. Tuy nhiên, một số còn tức giận hơn khi nhận ra điều gì đã xảy ra: bot AI đã thông báo một thay đổi chính sách không tồn tại.

"Chúng tôi không có chính sách như vậy. Bạn tất nhiên có thể sử dụng Cursor trên nhiều máy. Thật không may, đây là một phản hồi không chính xác từ một bot hỗ trợ AI", Michael Truell, giám đốc điều hành và đồng sáng lập của công ty viết trong một bài đăng trên Reddit.

Thông tin giả nhiều không kiểm soát
Hơn hai năm sau sự xuất hiện của ChatGPT, các công ty công nghệ, nhân viên văn phòng và người tiêu dùng hàng ngày đều đang sử dụng bot AI cho một loạt các tác vụ với tần suất ngày càng cao.

Tuy nhiên, vẫn chưa có cách nào đảm bảo rằng các hệ thống này tạo ra thông tin chính xác. Có một nghịch lý rằng các công nghệ mới và mạnh mẽ nhất, hay còn được gọi là hệ thống "suy luận" từ các công ty như OpenAI, Google và DeepSeek, lại đang tạo ra nhiều lỗi hơn.


Đoạn hội thoại vô nghĩa của ChatGPT khi người dùng hỏi có nên cho chó ăn ngũ cốc không. Ảnh: Reddit.
Trái với kỹ năng toán học đã cải thiện đáng kể, khả năng nắm bắt sự thật của các mô hình ngôn ngữ lớn (LLM) lại trở nên lung lay hơn. Đáng nói, đến chính các kỹ sư cũng hoàn toàn không rõ tại sao.

Theo New York Times, các chatbot AI ngày nay dựa trên các hệ thống toán học phức tạp để học kỹ năng bằng cách phân tích lượng dữ liệu số khổng lồ. Tuy nhiên, chúng không thể quyết định điều gì đúng và điều gì sai.

Từ đó, tình trạng "ảo giác" (hallucinate) hay tự bịa đặt thông tin xuất hiện. Thậm chí, theo các nghiên cứu, những LLM thế mới nhất còn gặp "ảo giác" nhiều hơn một số mô hình cũ.

Cụ thể, trong báo cáo mới nhất, OpenAI đã phát hiện ra việc mô hình o3 đã "ảo giác" khi trả lời 33% câu hỏi trên PersonQA, tiêu chuẩn nội bộ công ty để đo lường độ chính xác kiến thức của mô hình về con người.

Để so sánh, con số này gấp đôi tỷ lệ "ảo giác" của các mô hình lập luận trước đó của OpenAI là o1 và o3-mini, với tỷ lệ lần lượt 16% và 14,8%. Trong khi đó, mô hình o4-mini thậm chí còn tệ hơn trên PersonQA khi gặp "ảo giác" tới 48% thời lượng bài kiểm tra.

Đáng lo ngại hơn, "cha đẻ ChatGPT" thực sự không biết tại sao điều này lại xảy ra. Cụ thể, trong báo cáo kỹ thuật về o3 và o4-mini, OpenAI viết rằng "cần nghiên cứu thêm để hiểu tại sao tình trạng "ảo giác" lại trở nên tồi tệ hơn" khi mở rộng quy mô các mô hình lập luận.

o3 và o4-mini hoạt động tốt hơn ở một số lĩnh vực, bao gồm các tác vụ liên quan đến lập trình và toán học. Tuy nhiên, do cần "đưa ra nhiều tuyên bố hơn là nói tổng quát", cả hai mô hình này đã gặp tình trạng cho ra kết quả gồm "nhiều tuyên bố chính xác hơn, nhưng đồng thời cũng xuất hiện nhiều tuyên bố không chính xác hơn".

"Điều đó sẽ không bao giờ biến mất"
Thay vì một bộ quy tắc nghiêm ngặt được xác định bởi các kỹ sư con người, các hệ thống LLM sử dụng xác suất toán học để đoán phản hồi tốt nhất. Vì vậy, chúng luôn mắc một số lỗi nhất định.

"Bất chấp những nỗ lực tốt nhất của chúng tôi, mô hình AI sẽ luôn bị ảo giác. Điều đó sẽ không bao giờ biến mất", Amr Awadallah, cựu giám đốc Google nói.


Theo IBM, ảo giác là hiện tượng mô hình ngôn ngữ lớn (LLM) - thường là chatbot hoặc công cụ thị giác máy tính - nhận mẫu dữ liệu không tồn tại hoặc không thể nhận dạng với con người, từ đó tạo kết quả vô nghĩa hoặc sai lệch. Ảnh: iStock.
Trong một bài báo chi tiết về các thử nghiệm, OpenAI cho biết hãng cần nghiên cứu thêm để hiểu nguyên nhân của những kết quả này.

Theo các chuyên gia, do những hệ thống AI học từ lượng dữ liệu lớn hơn nhiều so với khả năng con người có thể hiểu được, dẫn đến việc sẽ rất khó khăn trong việc xác định tại sao chúng lại hành xử theo những cách như vậy.

"Ảo giác vốn dĩ phổ biến hơn trong các mô hình suy luận, mặc dù chúng tôi đang tích cực làm việc để giảm tỷ lệ đã thấy ở o3 và o4-mini. Chúng tôi sẽ tiếp tục nghiên cứu về ảo giác trên tất cả mô hình để cải thiện độ chính xác và độ tin cậy", Gaby Raila, người phát ngôn của OpenAI nói.

Các thử nghiệm từ nhiều công ty độc lập và nhà nghiên cứu cho thấy tỷ lệ ảo giác cũng đang gia tăng đối với các mô hình suy luận từ những công ty như Google hay DeepSeek.

Từ cuối năm 2023, công ty Vectara của Awadallah đã theo dõi tần suất các chatbot đưa thông tin sai sự thật. Công ty yêu cầu các hệ thống này thực hiện một nhiệm vụ đơn giản dễ dàng xác minh là tóm tắt những bài báo cụ thể. Ngay cả khi đó, các chatbot vẫn kiên trì bịa đặt thông tin.

Cụ thể, nghiên cứu ban đầu của Vectara ước tính rằng trong giả thuyết này, các chatbot đã bịa đặt thông tin ít nhất 3% và đôi khi lên tới 27%.

Trong một năm rưỡi qua, các công ty như OpenAI và Google đã giảm các con số đó xuống khoảng 1 hoặc 2%. Các công ty khác, như startup Anthropic ở San Francisco, dao động quanh mức 4%.

Tuy nhiên, tỷ lệ ảo giác trong thử nghiệm này vẫn tiếp tục tăng lên đối với các hệ thống suy luận. Tần suất hệ thống suy luận R1 của DeepSeek gặp ảo giác tăng 14,3%, trong khi o3 của OpenAI tăng lên 6,8%.

Một vấn đề khác là các mô hình suy luận được thiết kế để dành thời gian "suy nghĩ" về các vấn đề phức tạp, trước khi đưa ra câu trả lời cuối cùng.


Một câu lệnh (prompt) ngăn AI bịa đặt thông tin được Apple chèn vào trong bản thử nghiệm đầu tiên macOS 15.1. Ảnh: Reddit/devanxd2000.
Mặc dù vậy, mặt trái là khi cố gắng giải quyết vấn đề từng bước, mô hình AI lại càng có nguy cơ gặp ảo giác ở mỗi bước. Quan trọng hơn, lỗi có thể tích lũy khi mô hình dành nhiều thời gian hơn để suy nghĩ.

Các bot mới nhất hiển thị từng bước cho người dùng, điều đó có nghĩa là người dùng cũng có thể thấy từng lỗi. Các nhà nghiên cứu cũng phát hiện ra rằng trong nhiều trường hợp, bước suy nghĩ được hiển thị bởi một chatbot thực tế là không liên quan đến câu trả lời cuối cùng mà nó đưa ra.

"Những gì hệ thống nói rằng đang suy luận không nhất thiết là những gì thực tế nó đang suy nghĩ", Aryo Pradipta Gema, một nhà nghiên cứu AI tại Đại học Edinburgh và là cộng tác viên tại Anthropic nói.

VietBF@ sưu tập
Dịch trang: EnglishEnglish DeutschDeutsch FrançaisFrançais EspañolEspañol ItalianoItaliano PortuguêsPortuguês
NorskNorsk NederlandsNederlands DanskDansk SuomiSuomi PolskiPolski ČeštinaČeština РусскийРусский
日本語日本語 한국어한국어 中文(简体)中文(简体) 中文(繁體)中文(繁體) MagyarMagyar TürkçeTürkçe
العربيةالعربية ไทยไทย LatinaLatina हिन्दीहिन्दी Bahasa IndonesiaBahasa Indonesia Bahasa MelayuBahasa Melayu
VIETBF Hybrid Community Content Hub

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Video Classic Master

iPad News Portal

VietBF iPad Music Portal

Tin nóng nhất 50h qua

Phim Bộ Online

iMusic Pro Max



pizza
R11 Tuyệt Thế Thiên Hạ
Release: 05-09-2025
Reputation: 237264


Profile:
Join Date: Sep 2014
Posts: 110,932
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	242.PNG
Views:	0
Size:	663.2 KB
ID:	2522556   Click image for larger version

Name:	241.PNG
Views:	0
Size:	129.8 KB
ID:	2522557   Click image for larger version

Name:	243.PNG
Views:	0
Size:	510.0 KB
ID:	2522558  

pizza_is_offline
Thanks: 7
Thanked 8,161 Times in 7,271 Posts
Mentioned: 6 Post(s)
Tagged: 0 Thread(s)
Quoted: 41 Post(s)
Rep Power: 133
pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10
pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10
Dịch trang: EnglishEnglish DeutschDeutsch FrançaisFrançais EspañolEspañol ItalianoItaliano PortuguêsPortuguês
NorskNorsk NederlandsNederlands DanskDansk SuomiSuomi PolskiPolski ČeštinaČeština РусскийРусский
日本語日本語 한국어한국어 中文(简体)中文(简体) 中文(繁體)中文(繁體) MagyarMagyar TürkçeTürkçe
العربيةالعربية ไทยไทย LatinaLatina हिन्दीहिन्दी Bahasa IndonesiaBahasa Indonesia Bahasa MelayuBahasa Melayu
Reply

User Tag List


HẬU DUỆ VNCH VIẾT NÊN LỊCH SỬ TẠI HOA KỲ: KHI KHIÊM NHƯỜNG LÀ SỨC MẠNH QUANG PHỤC QUÊ HƯƠNG Sức mạnh răn đe vô tiền khoáng hậu: Bộ ba "Pháo đài bay" Mỹ cùng lúc hội quân tại Trung Đông Những chuyện hài hước nhất hôm nay +112 videos
Chảo lửa Hormuz: Mỹ lên kế hoạch "đòn sấm sét" nếu thỏa thuận ngừng bắn sụp đổ Hiệu ứng cánh bướm từ Eo biển Hormuz: Khi châu Á "hắt hơi", nước Mỹ liệu có "sổ mũi"? Khi quyền lực không thể che lấp tội ác: Toàn cảnh vụ xét xử Rodrigo Duterte tại Tòa án Hình sự Quốc tế
Đồng tiền xương máu và canh bạc 400 nghìn đô: Đặc nhiệm Mỹ "sa lưới" vì đặt cược vào vụ bắt giữ Tổng thống Maduro Hoa Kỳ tước 400 quốc tịch Mỹ, liệu có Việt Cộng trong đó? Kỳ Tích Giữa Đời Thường: Người Phụ Nữ Chiến Thắng "Án Tử" Ung Thư Tụy Nhờ Vũ Khí mRNA Từng Cứu Thế Giới
Nội bộ Mỹ rạn nứt vì chiến tranh Iran: Joe Kent từ chức, phong trào MAGA chia đôi, Nhà Trắng phản pháo dữ dội Tehran xác nhận Ali Larijani tử trận: “cột trụ” sụp đổ Israel “chặt đầu rắn”: Ali Larijani và lực lượng Basij bị tuyên bố tiêu diệt – Iran rơi vào cú sốc
Mỹ – Iran bước vào thế “đánh rồi tính sau” Chuyện hài Hàn Cộng: Khi giấc mộng xóa bỏ Bắc Triều vẫn ám ảnh Washington Mỹ mà thua Iran thì toàn dân, toàn quân Việt Cộng chỉ có con đường chết đói bo bo
Trump gây sức ép toàn cầu mở lại eo Hormuz, chuyến thăm Trung Quốc có thể bị hoãn – NATO và đồng minh vẫn đứng ngoài Đức phản bác Trump: “Đây không phải là cuộc chiến của NATO” – Châu Âu chia rẽ trước khủng hoảng eo Hormuz Trump gây sức ép với Trung Quốc trước thềm thượng đỉnh Bắc Kinh: muốn mở eo Hormuz trước khi nói chuyện
5 vạn quân Mỹ áp sát Iran, bùng nổ đại chiến kinh hoàng tại Trung Đông, “Khi gió chiến tranh nổi lên, không ai biết cát sa mạc sẽ bay về đâu.” Iran xác nhận Giáo Chủ đã chết, 96 vạn quân Iran như rắn mất đầu Qatar và Emirates Airways, Dubai–Doha tê liệt, 1.800 chuyến bay bị hủy, hành khách mắc kẹt khắp nơi
Ông Trump xác nhận Giáo Chủ Iran đã chết, hàng loạt tướng tử vong, 30 vạn quân Iran đào ngũ tháo chạy khắp nơi, binh bại như núi đổ Iran ‘tắt sóng’ 99% sau không kích: internet gần như biến mất, dân Tehran đổ xô tích trữ, xếp hàng mua xăng Mỹ tổng tấn công Iran
Ghế Thủ Tướng “Đổi Gió”? Khi Lê Minh Hưng Không Còn Đi Trên Thảm Đỏ Và “Thắng Đen” Trỗi Dậy Bốn Thượng Tướng Bộ Quốc Phòng Nghỉ Công Tác Từ 1/3: “Hạ Cánh An Toàn” Và Một Vết Nhơ Ở Seoul? Fan MAGA một mình giữa phố Bolsa: Câu chuyện tự do ngôn luận và ‘độ nóng’ của chính trị cộng đồng”

 

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Video Classic Master Page

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Duo Series Movies Portal

Duo Music Portal

Phim Bộ

Tỷ Giá

Thời Tiết

Tin Nóng Nhất 50h

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 21:44.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2026
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2026 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.10780 seconds with 15 queries