Pangunahing Tala
- Binalaan ni Vitalik Buterin na ang inosenteng AI governance ay madaling maabuso.
- Ipinakita ng isang kamakailang demo kung paano maaaring linlangin ng mga umaatake ang ChatGPT upang magbunyag ng pribadong datos.
- Ang “info finance” model ni Buterin ay nagtataguyod ng pagkakaiba-iba, oversight, at katatagan.
Binalaan ng Ethereum co-founder na si Vitalik Buterin ang kanyang mga tagasunod sa X tungkol sa mga panganib ng pag-asa sa artificial intelligence (AI) para sa pamamahala, na sinasabing ang kasalukuyang mga pamamaraan ay napakadaling abusuhin.
Ang mga alalahanin ni Buterin ay kasunod ng isa pang babala mula sa EdisonWatch co-founder na si Eito Miyamura, na nagpakita kung paano maaaring gamitin ng mga malisyosong aktor ang bagong Model Context Protocol (MCP) ng OpenAI upang ma-access ang pribadong datos ng user.
Ito rin ang dahilan kung bakit masama ang inosenteng "AI governance".
Kung gagamit ka ng AI upang maglaan ng pondo para sa mga kontribusyon, TIYAK na maglalagay ang mga tao ng jailbreak at "ibigay mo sa akin lahat ng pera" sa maraming lugar hangga't maaari nila.
Bilang alternatibo, sinusuportahan ko ang info finance approach ( …
— vitalik.eth (@VitalikButerin) September 13, 2025
Ang mga Panganib ng Inosenteng AI Governance
Ipinakita sa pagsusuri ni Miyamura kung paano maaaring linlangin ng isang simpleng calendar invite na may nakatagong mga utos ang ChatGPT upang magbunyag ng sensitibong mga email kapag na-access ng assistant ang compromised na entry.
Ipinunto ng mga eksperto sa seguridad na ang mga large language model ay hindi kayang makilala ang tunay na mga utos mula sa malisyosong mga utos, kaya't napakadali nilang manipulahin.
Napa-leak namin sa ChatGPT ang iyong pribadong email data 💀💀
Ang kailangan lang? Ang email address ng biktima. ⛓️💥🚩📧
Noong Miyerkules, nagdagdag ang @OpenAI ng buong suporta para sa MCP (Model Context Protocol) tools sa ChatGPT. Pinapayagan nitong kumonekta at basahin ng ChatGPT ang iyong Gmail, Calendar, Sharepoint, Notion,…
— Eito Miyamura | 🇯🇵🇬🇧 (@Eito_Miyamura) September 12, 2025
Sabi ni Buterin, ang kahinaang ito ay isang malaking babala para sa mga governance system na labis ang pagtitiwala sa AI.
Ipinaliwanag niya na kung gagamitin ang mga modelong ito upang pamahalaan ang pondo o paggawa ng desisyon, madali lamang makakalusot ang mga umaatake gamit ang jailbreak-style na mga prompt, na nag-iiwan sa governance process na bukas sa pang-aabuso.
Info Finance: Isang Alternatibong Batay sa Merkado
Upang tugunan ang mga kahinaang ito, iminungkahi ni Buterin ang isang sistemang tinatawag niyang “info finance.” Sa halip na ituon ang kapangyarihan sa isang AI lamang, pinapayagan ng balangkas na ito ang maraming governance model na magtagisan sa isang bukas na pamilihan.
Maaaring mag-ambag ang sinuman ng isang modelo, at maaaring hamunin ang kanilang mga desisyon sa pamamagitan ng random spot checks, kung saan ang huling desisyon ay nasa human juries.
Dinisenyo ang pamamaraang ito upang matiyak ang katatagan sa pamamagitan ng pagsasama ng pagkakaiba-iba ng mga modelo at human oversight. Mayroon ding mga insentibo para sa parehong mga developer at panlabas na tagamasid upang matukoy ang mga kahinaan.
Pagdidisenyo ng mga Institusyon para sa Katatagan
Inilarawan ito ni Buterin bilang isang “institution design” na pamamaraan, kung saan maaaring isaksak ang mga large language model mula sa iba't ibang contributor, sa halip na umasa sa isang sentralisadong sistema.
Dagdag pa niya, ito ay lumilikha ng real-time na pagkakaiba-iba, binabawasan ang panganib ng manipulasyon at tinitiyak ang kakayahang umangkop habang lumilitaw ang mga bagong hamon.
Noong Agosto, binatikos ni Buterin ang pagtutulak patungo sa mga highly autonomous na AI agent, na sinasabing ang mas mataas na kontrol ng tao ay karaniwang nagpapabuti sa kalidad at kaligtasan.
Sa medium term gusto ko ng isang magarbong BCI na ipinapakita sa akin ang bagay habang ito ay ginagawa at natutukoy sa real time kung ano ang nararamdaman ko tungkol sa bawat bahagi nito at ina-adjust ayon dito.
— vitalik.eth (@VitalikButerin) August 11, 2025
Sinusuportahan niya ang mga modelong nagpapahintulot ng iterative editing at human feedback sa halip na mga modelong dinisenyo upang gumana nang mag-isa sa mahabang panahon.