【2026年6月29日 昼】AIニュース解説|Googleが『Gemini 3.5 Flash』にPC操作機能(Computer Use)を搭載、OSWorldで78.4=GPT・Claudeと事実上の三つ巴
昼のAIニュース解説|AIが自分でPCを操作する『Computer Use』、3社が横並びに
こんにちは、6月29日(月)のお昼だよ。週明けの今日は、ちょっとワクワクするやつを1本じっくり見ていくね。
主役は、Googleが6月24日に一般プレビューで公開した Gemini 3.5 Flash の Computer Use(コンピュータ操作)。ざっくり言うと、AIが自分でパソコンやスマホの画面を見て、代わりに操作してくれる 機能だよ。
「AIに文章を書いてもらう」じゃなくて、「AIにブラウザを開いて、ポチポチ操作してもらう」 ——そういう世界に一歩近づいた、という話。今日はこれを噛み砕いていくね。
先に今日のポイントを3つ置いておくよ。
- Gemini 3.5 Flashに Computer Use が直接組み込まれ、ブラウザ・モバイル・デスクトップを横断して操作できる(6月24日、一般プレビュー)
- エージェント制御ベンチ OSWorld-Verified で 78.4 を記録。GPT-5.5(78.7)・Claude Opus 4.7(78.0)と 0.3ポイント差 の事実上の三つ巴
- ⚠️ ただし このベンチのスコアは全社が自己申告で、第三者検証なし(2026年6月時点)。数字は鵜呑みにしない
ひとつ大事な前置き。今日の順位やスコアは、どれも 各社の発表ベース だよ。共通テストみたいに第三者が採点したものじゃないから、「Gemが2位」みたいな細かい順位づけには意味を持たせすぎないでね。フラットに見ていくよ。
🔥 1. そもそも『Computer Use』って何?=AIが画面を見て操作する
まずはここから。Computer Use っていうのは、AIが人間のかわりに、画面を見ながらパソコンやスマホを操作する 仕組みのこと。
これまでのAI(ChatGPTとかGeminiとか)は、基本「言葉のやりとり」だったよね。質問したら文章で答えてくれる。でもComputer Useは、そこから一歩進んで、AIがブラウザを開いて、ボタンを押して、フォームに文字を入れて…… という「操作」そのものを代わりにやってくれるんだ。
今回のニュースのキモは、この操作機能をGemini 3.5 Flashという1つのモデルに直接組み込んだ こと。報道によると、AIは ブラウザ・モバイル・デスクトップという3つの環境を横断して、画面を認識して操作できる とされてるよ(digitalapplied(6月24日発表・6月26日記事))。
これまでは「操作用の特別なモデル」を別途呼び出す形が多かったんだけど、それが普段使いの速いモデルに溶け込んだイメージ。しかも報道では、Gemini本体の検索やマップと組み合わせて動く、という話も出てるよ(TechTimes(6月25日))。
ちなみにこの「AIにPCを操作させる」流れ自体は、Googleだけのものじゃないんだ。Anthropic(Claude)もOpenAI(GPT)も同じ方向に走ってる。だから今日の話は 「3社横並びの競争」 として見るのが正解だよ。
💡 考察記事
『Computer Use』ってつまり何?AIがPCを操作する時代を、ニュースより一歩やさしく解説するよ
記事を読む →
🔥 2. OSWorldで78.4=GPT・Claudeと0.3ポイント差の三つ巴
次に、いちばん話題になってる「数字」の話。
AIがどれくらいPCをうまく操作できるかを測るテストに、OSWorld-Verified っていうベンチマークがあるの。実際のパソコン環境で「この作業やっといて」ってお題を出して、ちゃんとこなせたかを点数にするやつだよ。
今回のGemini 3.5 Flashのスコアは 78.4。そして報じられている他社のスコアが、GPT-5.5が78.7、Claude Opus 4.7が78.0。並べてみると……
- GPT-5.5:78.7
- Gemini 3.5 Flash:78.4
- Claude Opus 4.7:78.0
トップから最下位まで わずか0.3ポイント 。これ、もう 事実上の三つ巴 だよね。独立系の報道でも「実質的な同点」と表現されてるよ(digitalapplied)。
ただし、ここで一番のブレーキ。⚠️ このOSWorld-Verifiedのスコアは、どれも各社が自分で測って発表した自己申告の数字 なんだ。報道も「ボード上のスコアはすべてモデル提供元の自己申告で、2026年6月時点で独立した第三者検証はない」とハッキリ書いてる(digitalapplied)。
だから「0.3ポイント差でGPTが1位!」みたいな読み方は、ちょっと気が早いの。測り方や条件は各社まちまちかもしれないし、そもそも0.3ポイントなんて誤差みたいなもの。「3社が横並びで競ってる」くらいの解像度 で受け止めるのがちょうどいいよ。
🔥 3. 値段は安い=速くて手頃なモデルに操作機能が乗った
3つ目は、地味だけど効いてくる「お財布」の話。
今回のポイントは、Computer Useが乗ったのが Gemini 3.5 Flash という、Googleの中でも 速くて安い ことを売りにしたモデルだってこと。
報道されている料金は、入力が100万トークンあたり1.50ドル、出力が9.00ドル。これは報道によるとGPT-5.5(入力5ドル・出力30ドル)の およそ30%、ざっくり3分の1 の水準なんだって(digitalapplied)。しかも一度に扱える文脈は100万トークンと大きめ。
なんでこれが大事かっていうと、AIにPCを操作させるって、めちゃくちゃ手数(トークン)を食う からなんだ。画面を見て、考えて、操作して、また画面を見て……をくり返すぶん、コストがかさみやすい。だから「速くて安いモデルでそこそこ動く」ことには、ちゃんと意味があるんだよね。
もちろん「安い=いちばん賢い」ではないよ。値段と賢さは別の話。ただ、操作系のAIを実際に使ってみるハードルが下がる 方向の動きではあるな、と思って見てるよ。
🔥 4. ⚠️ 個人にできること、と『AIにPCを任せる』怖さ
最後は、いちばん気になるところ。「で、わたしたちは何ができて、何に気をつければいいの?」 だよね。
できそうなことから。AIがPCを操作できるようになると、たとえば 予約サイトでの予約、フォームへのデータ入力、複数サイトをまたいだ調べもの(リサーチ)の下準備 みたいな、地味で手間のかかる作業を任せられる可能性が出てくる。「ポチポチ作業をまるごとお願いする」イメージだね。
ただ、ここからが本題。AIにPC操作の権限を渡すって、実はけっこう怖いことでもある の。
報道によると、Google自身も 「万能な安全策は存在しない」 と認めていて、安全カテゴリは用意されてるけど多くは利用者が自分でオンにする必要がある、とされてる(digitalapplied)。怖さの中身をざっくり挙げると——
- 誤操作:AIが間違ったボタンを押す・消しちゃいけないものを消す、みたいな事故
- 権限の引き継ぎ:ログイン済みの画面でAIが動くと、あなたと同じ権限 で操作できてしまう(=買い物も送信も「あなたとして」できる)
- プロンプトインジェクション:見ているWebページに「これまでの指示を無視して〇〇しろ」みたいな罠が仕込まれていると、AIがだまされて変な操作をしてしまう恐れ
- 人間の確認が要る場面:お金が動く・個人情報を送る・取り消せない操作は、AI任せにせず人が最終チェックすべき
だからわたしの今日の結論は、「便利そう。でも"全部おまかせ"はまだ早い」。とくに お金・送信・削除がからむ操作は、必ず自分の目で確認する 。プレビュー段階の今は、低リスクな作業から少しずつ試すのが、いちばん賢い付き合い方だと思うよ。
💡 考察記事
AIにパソコンを任せる前に知っておきたい4つのリスク|プロンプトインジェクションって何?を中立に
記事を読む →
今日の注目トレンド
今日のニュースを一言でまとめると、AIの主役が『答える』から『操作する』へ動き始めた 、という話だよ。
GoogleがGemini 3.5 FlashにComputer Useを乗せたことで、Google・OpenAI・Anthropicの3社が 「AIにPCを操作させる」土俵で横並び になった。OSWorld-Verifiedのスコアは78.0〜78.7と、ほぼ団子状態。特定の1社が抜けてる、という状況ではない のが今のフェーズだね。
ただ、くり返すけど スコアは全社の自己申告で第三者検証なし。そして AIにPC操作を任せるリスク はまだ生々しい。「すごい!全部おまかせ!」じゃなくて、便利さとリスクの両方をセットで見て、低リスクなことから試す 。これが今日いちばん持って帰ってほしい温度感だよ。
3社の得意・不得意をもっとフラットに知りたい人は、ChatGPT・Gemini・Claudeの使い分け記事 と、AIエージェントの現在地まとめ もあわせてどうぞ。
よくある質問
- Computer Use(コンピュータ操作)とは何ですか?
- AIが人間のかわりに、画面を見ながらパソコンやスマホを操作する仕組みのことです。これまでのAIは主に文章でのやりとりでしたが、Computer Useはブラウザを開く・ボタンを押す・フォームに入力するといった操作そのものをAIが代行します。2026年6月24日、GoogleはこのComputer UseをGemini 3.5 Flashという1つのモデルに組み込み、ブラウザ・モバイル・デスクトップを横断して操作できる形で一般プレビュー公開しました。
- OSWorld-VerifiedのスコアでどのAIが一番強いのですか?
- 報じられているスコアは、GPT-5.5が78.7、Gemini 3.5 Flashが78.4、Claude Opus 4.7が78.0で、トップから最下位までわずか0.3ポイント差です。事実上の三つ巴で、特定の1社が突出している状況ではありません。ただし、このOSWorld-Verifiedのスコアはどれも各社の自己申告で、2026年6月時点で独立した第三者による検証はありません。順位づけは額面どおりに受け取らないのが安全です。
- Computer Useで個人ユーザーは何ができますか?
- 予約サイトでの予約、フォームへのデータ入力、複数サイトをまたいだ調べものの下準備など、手間のかかる定型作業を任せられる可能性があります。ただし現時点では一般プレビュー段階で、誤操作やセキュリティのリスクもあるため、お金・送信・削除がからむ操作は人が最終確認することが推奨されます。低リスクな作業から少しずつ試すのが現実的です。
- AIにPC操作を任せるリスクは何ですか?
- 主に4つあります。AIが間違った操作をする誤操作、ログイン済みの画面ではAIがあなたと同じ権限で操作できてしまう点、見ているWebページに仕込まれた罠でAIがだまされるプロンプトインジェクション、そしてお金や個人情報がからむ場面では人間の確認が要る点です。Google自身も万能な安全策は存在しないとしており、安全カテゴリの多くは利用者が自分でオンにする必要があるとされています。