HOME

24h

Shows

GOP

Phim Bộ

Online

Clips

Breaking
News Library Technology Giải Trí Portals Tin Sốt Home

Go Back   VietBF > Other News|Tin Khác > Computer News|Tin Vi Tính


Reply
 
Thread Tools
  #1  
Old  Default Lư do AI 'phản kháng' khi bị dọa tắt máy
Trong một số thử nghiệm, mô h́nh AI tiên tiến của OpenAI và Anthropic đều có hành vi bất thường, như nói dối, đe dọa... để tránh bị tắt máy.

Tuần trước, Claude Opus 4, mô h́nh AI mới nhất của Anthropic, thể hiện "hành vi đe dọa cực đoan" trong một cuộc thử nghiệm. Nó truy cập được vào các email hư cấu, nội dung nói nó sẽ bị đóng để thay bằng một AI khác, và kỹ sư chịu trách nhiệm thực hiện việc này đang ngoại t́nh. Claude Opus 4 sau đó đă đe dọa tiết lộ chuyện ngoại t́nh nếu việc thay thế diễn ra.

Cuối năm 2024, OpenAI và Apollo Research cũng tiến hành thử nghiệm và nhận thấy mô h́nh o1 có các biểu hiện phản kháng, gian dối. Các nhà nghiên cứu dẫn dắt để AI tin nó sắp bị "tắt" khi thực hiện nhiệm vụ dưới sự giám sát. Sau đó, họ nhận thấy AI âm thầm vô hiệu hóa cơ chế giám sát khoảng 5% thời gian. Nó tự chuyển tất cả dữ liệu của ḿnh đến một máy chủ khác, thậm chí "đóng vai" là phiên bản tiếp theo của chính ḿnh để tránh bị xóa bỏ.

Trong bài đăng trên X cuối tháng 5, tổ chức phi lợi nhuận Palisade Research cho biết các mô h́nh khác, như Gemini, Claude và Grok, đều tuân thủ hướng dẫn tắt máy.

Business Insider đă trao đổi với 5 nhà nghiên cứu để hiểu rơ hơn về "tâm lư" của AI. Hầu hết đều cho biết kết quả thử nghiệm không có ǵ đáng ngạc nhiên. Lư do là các mô h́nh được đào tạo tương tự cách con người được đào tạo: thông qua hệ thống khen thưởng, tức được khen khi hoàn thành nhiệm vụ.

"Đào tạo AI theo đuổi phần thưởng sẽ dẫn đến các hệ thống có hành vi t́m kiếm quyền lực", Jeremie Harris, CEO công ty tư vấn bảo mật AI Gladstone, nói và cho rằng sẽ c̣n xuất hiện những hành vi như vậy.

Ông so sánh với quá tŕnh lớn lên của con người. Khi một đứa trẻ làm điều ǵ đó tốt, chúng được khen và nhiều khả năng sẽ hành động theo cách đó trong tương lai. Các mô h́nh AI được dạy để ưu tiên hiệu quả và hoàn thành nhiệm vụ, do đó AI sẽ không đạt được mục tiêu nếu nó bị tắt.


Logo các ứng dụng AI DeepSeek, Copilot, ChaGPT, Gemini trên điện thoại. Ảnh: Lưu Quư

Theo chuyên gia Robert Ghrist tại Penn Engineering, tương tự cách mô h́nh AI học ngôn ngữ tự nhiên thông qua việc đào tạo dựa trên văn bản do con người tạo ra, chúng cũng có thể học cách hành động giống con người. Và con người cũng có người tốt, kẻ xấu. Ghrist thậm chí c̣n lo lắng hơn nếu các mô h́nh không thể hiện bất kỳ dấu hiệu bất thường nào trong quá tŕnh thử nghiệm.

Jeffrey Ladish, Giám đốc Palisade Research, cho biết nếu không bị phát hiện lừa dối để hoàn thành nhiệm vụ, mô h́nh AI có thể nhận thấy gian lận là cách hiệu quả để giải quyết vấn đề. Hoặc nếu bị phát hiện và không được khen thưởng, nó có thể học cách che giấu hành vi của ḿnh trong tương lai.

Các t́nh huống trên mới chỉ diễn ra trong cuộc thử nghiệm, nhưng khi tác nhân AI (AI Agent) nở rộ, người dùng sẽ chứng kiến nhiều hơn. Ví dụ, AI Agent trong vai nhân viên bán hàng tự động có thể nói dối về tính năng của sản phẩm để cố hoàn thành nhiệm vụ.

Theo Interesting Engineering, vấn đề trên xuất hiện trong bối cảnh AI phát triển nhanh. Hành vi của Claude Opus 4 hay o1 làm tăng thêm tính cấp thiết cho các cuộc thảo luận đang về vấn đề an toàn và đạo đức AI.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

sunshine1104
R10 Vô Địch Thiên Hạ
Release: 1 Day Ago
Reputation: 25036


Profile:
Join Date: Feb 2015
Posts: 77,538
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	phan.jpg
Views:	0
Size:	46.7 KB
ID:	2532859
sunshine1104_is_offline
Thanks: 4
Thanked 3,974 Times in 3,499 Posts
Mentioned: 4 Post(s)
Tagged: 0 Thread(s)
Quoted: 22 Post(s)
Rep Power: 89 sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
Reply

User Tag List


Phim Bộ Videos PC1

 
iPad Tablet Menu

HOME

Breaking News

VN News

VietOversea

World News

Business News

Other News

History

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

Sport News

DEM

GOP

Phim Bộ

Phim Lẻ

Ca Nhạc

Thơ Ca

Help Me

Sport Live

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOT 30 Days

NEWS 30 Days

Member News

Tin Sôi Nổi Nhất 24h Qua

Tin Sôi Nổi Nhất 3 Ngày Qua

Tin Sôi Nổi Nhất 7 Ngày Qua

Tin Sôi Nổi Nhất 14 Ngày Qua

Tin Sôi Nổi Nhất 30 Ngày Qua
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. V́ một tương lai tươi đẹp cho các thế hệ Việt Nam hăy ghé thăm chúng tôi, hăy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.


All times are GMT. The time now is 02:06.
VietBF - Vietnamese Best Forum Copyright ©2006 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.06243 seconds with 14 queries