GoogleのComputer Useなど、AIがPCを操作する機能が広がっています。便利な一方で、誤操作・権限の引き継ぎ・プロンプトインジェクション・人間の確認という4つのリスクも。怖がりすぎず侮らず、安全に使い始めるための考え方を、Google自身の注意喚起をもとに中立にまとめます。
GoogleがGemini 3.5 FlashにComputer Useを搭載。AIが画面を見て操作するってどういうこと?OSWorldの78.4という数字の読み方、GPT・Claudeと0.3ポイント差の三つ巴の意味、自己申告ベンチの注意点まで、個人ユーザー目線でやさしく中立に整理します。
ChatGPTのCodexがWindowsアプリを直接見て・クリックして・入力できるように。コーディングAIがGUI操作へ進む意味と、わたしたちの仕事への影響を6つの理由で深掘り。
Standard IntelligenceがSequoia/Spark主導で$75M調達。「ビデオでソフトウェアを操作するfoundation model」がAdept消滅後の新潮流に。