AI Today
ホーム > ニュース > 【2026年6月26日 朝】AIバズニュースまとめ|xAIがGrok Buildに自律実行モード『/goal』を追加、AIに『長時間タスク丸投げ』する自律エージェント時代へ

【2026年6月26日 朝】AIバズニュースまとめ|xAIがGrok Buildに自律実行モード『/goal』を追加、AIに『長時間タスク丸投げ』する自律エージェント時代へ

朝のAIバズニュース

おはよう、6月26日(金)の朝だよ。今日のテーマは、最近じわじわ来てる「AIに長時間タスクを丸投げする」っていう話。いわゆる 自律AIエージェント のことだよ。

これまでのAIって、基本「1回聞いたら1回答えてくれる」チャット型だったよね。でも今は「目標だけ渡しておけば、AIが自分で計画して、何十分も自律でやっといてくれる」みたいなモードが各社から出てきてるんだ。

先に大事な前置きをひとつ。各社の機能は名前も仕様もアップデートが速くて、ソースによって書いてあることが微妙に違うの。だから今日は 確認できた事実だけ を並べて、「どこが一番すごい」みたいな断定はしないね。比較はあくまで「確認できた範囲」での俯瞰だよ。

今日のポイントはこの3つ。

  • きっかけは、xAIがGrok Buildに自律実行モード「/goal」を追加(6月22日)
  • でもこれは1社の話じゃない。OpenAI Codex・Anthropic Claude Code・GitHub Copilot も自律エージェント機能を持ってる
  • 共通する構図は「目標を指示→AIが長時間自律で実行→人が監視・承認」という分担

「自律エージェントって普通のチャットAIと何が違うの?」「どんな仕事なら任せていいの?」を、考察記事でかみ砕いていくね。

🔥 1. xAI、Grok Buildに自律実行モード『/goal』を追加|計画→実行→検証まで長時間まかせられる

まず今日のきっかけになったニュース。xAI が、コーディングエージェント Grok Build に自律実行モード 「/goal」 を追加したよ(2026年6月22日。一次: x.ai/news、確認: Releasebot・xAI更新MarkTechPost・6月22日)。

何ができるのかというと、ユーザーが 1つの目標 を渡すだけでいいんだ。たとえば /goal 認証モジュールを新APIへ移行して みたいに書くと、AIが自分で進め方を計画して、チェックリストを作って、実行していく。

ポイントは「完了して検証できた、と判断するまで自律で続ける」ところ。報道によると、その検証は「自分が書いたコードをレビューする」「ウェブページを確認して動作をチェックする」「スクリプトを実行して結果を試す」といった形で行うとされてるよ(MarkTechPost)。

そして大事なのが、ほったらかしにはしない仕組み があること。長時間動くタスクを人が見張れるように、コマンドが用意されてるんだ。

  • /goal status:今どこまで進んでるか、ライブの進捗を見る
  • /goal pause:作業を止める(目標は保持したまま)
  • /goal resume:止めたところから再開する
  • /goal clear:その目標自体を破棄する

利用には SuperGrok または X Premium Plus のサブスクが必要とされてるよ(Releasebot)。なお、内部でどのモデルを使うかなどの細かい仕様は、ソースによって記述に差があったから、ここでは断定しないでおくね。

ソース: x.ai/news(一次)Releasebot・xAI更新MarkTechPost(6月22日)

💡 考察記事

自律AIエージェントって、普通のチャットAIと何が違うの?|『丸投げ』が成り立つ仕組みをかみ砕く

記事を読む →

🔥 2. これはxAIだけじゃない|OpenAI・Anthropic・GitHubも自律エージェントを持ってる

「xAIが自律モード出した」だけ見ると一社の話に見えちゃうけど、実は「目標を渡したら長時間まかせられる」エージェント機能は、主要各社がそれぞれの形で持ってるんだ。確認できた範囲で並べてみるね。

  • OpenAI(Codex):自然言語でタスクを伝えると、Codexがクラウドのサンドボックス環境を立ち上げ、GitHubリポジトリを複製して、複数ファイルにまたがってコードを書き、テストを回し、失敗したら直して、最後にプルリクエストを開くとされてる。2026年4月のアップデートで「複数エージェントの並列実行」やソフトウェア開発全体へのタスク委任が加わったと報じられてるよ(OpenAI・Introducing CodexOpenAI Developers・Codex Cloud
  • Anthropic(Claude Code):コードベースを読んで、行動の手順を計画して、実際の開発ツールで実行し、結果を評価して進めるエージェント型。原則として ファイル変更やコマンド実行の前に許可を求める 設計で、自律レベルはユーザーが調整できる。承認の手間を減らす「Auto Mode」や、クラウドで動く「Routines」も加わったと報じられてる(Anthropic・Claude CodeAnthropic・Auto Mode
  • GitHub(Copilot Coding Agent):IssueをCopilotに割り当てると、バックグラウンドで作業を計画し、コードを書き、テストを回して、ドラフトのプルリクエスト として提出する。ブランチ保護などの既存ルールはそのまま効いて、PRはCI/CDを動かす前に 人間の承認 が要る設計とされてるよ(GitHub Blog・新コーディングエージェントGitHub Docs・Coding Agent

並べてみると、各社で名前ややり方は違うけど、共通の構図 が見えてくるよね。「人が目標を渡す → AIが長時間まかせられて、計画・実行・検証まで自分で回す → でも最後(または要所)は人が確認・承認する」という分担。ここが、これまでの「1往復で終わるチャット」との大きな違いなんだ。

ここでも誇張は避けるね。各社の最新バージョン名や、価格、対応範囲、性能の細かい数字はソースごとに差があるし、研究プレビュー段階の機能もある。だから「どこが一番いい」みたいな断定はしないよ。今日言えるのは「自律エージェントは、もう一社の特別機能じゃなく、業界の共通テーマになってる」という構図のほうだね。

ソース: OpenAI・Introducing CodexAnthropic・Claude CodeGitHub Blog・新コーディングエージェント

💡 考察記事

AIに『長時間タスク丸投げ』、どこまで任せていいの?|任せていい仕事・ダメな仕事と、安全とコストの話

記事を読む →

🔥 3. キーワードは『監視と承認』|自律でも"ほったらかし"にしないUIが各社の共通点

3つ目は、今日いちばん見落とされがちなポイントの話。それは「自律=ほったらかし、ではない」ってこと。

自律エージェントって聞くと「AIが勝手に全部やっちゃう」イメージを持つ人が多いと思う。でも実際の各社のつくりを見ると、むしろ逆で、「人がちゃんと見張れる・止められる仕組み」がセットになってるんだ。

  • xAIの「/goal」には statuspauseresumeclear っていう監視・制御コマンドがある(Releasebot
  • GitHubのCopilotは、作業をドラフトのプルリクとして出して、マージやCI/CD前に人の承認 を挟む(GitHub Docs
  • Claude Codeは、原則 変更前に許可を求める 設計で、自律の度合いはユーザーが選べる(Anthropic

つまり今のトレンドは「AIに任せる範囲を広げつつ、要所では必ず人間が確認する」というバランス取りなんだよね。完全な無人運転じゃなくて、「長く走らせていいけど、ハンドルとブレーキは人が握ってる」イメージが近いと思う。

これって、わたしたちがこの手のツールを使ううえですごく大事なポイント。任せきりにして結果だけ受け取るんじゃなくて、「どこで自分が確認するか」を決めておくのが、自律エージェントを安全に使うコツになりそうなんだ。そのへんは考察記事で具体的に掘り下げるね。

ソース: Releasebot・xAI更新GitHub Docs・Coding AgentAnthropic・Claude Code

今日の注目トレンド

今日のテーマは「AIに長時間タスクを丸投げする自律エージェント、各社の違い」だったよ。

きっかけはxAIの「/goal」だったけど、いちばん伝えたかったのは「これは一社の話じゃない」ってこと。OpenAI Codex、Anthropic Claude Code、GitHub Copilot Coding Agent…と、主要各社が「目標を渡したら、計画・実行・検証まで長時間まかせられる」エージェント機能を、それぞれの形で持ってるんだ。

共通する構図は「人が目標を指示→AIが長時間自律で実行→人が監視・承認」という分担。そして各社とも、status/pause/resumeみたいな監視コマンドや、プルリク承認、変更前の許可みたいな「人が止められる仕組み」をちゃんとセットにしてる。自律=ほったらかし、ではないんだよね。

ただ、何度でも言うけど、各社の最新バージョン名・価格・対応範囲はソースによって差があるし、研究プレビュー段階の機能もあるの。だから「どこが最強」みたいな断定はしないでおくね。今は「各社が同じ方向(自律+人の監視)に走ってる入り口」くらいの温度感が正確だと思う。

「自律エージェントって普通のチャットAIと何が違うの?」を仕組みの面からかみ砕いた記事と、「どんな仕事なら任せていいの? 安全とコストはどう考える?」を実用の面から見た記事、2本用意したよ。どっちも確認できた事実だけで、中立に書いたから、よかったら読んでみて。今日もいい一日になりますように。

よくある質問

xAIの「/goal」って何ですか?
xAIが2026年6月22日に、コーディングエージェントGrok Buildへ追加した自律実行モードです。ユーザーが「/goal 認証モジュールを新APIへ移行して」のように1つの目標を渡すと、AIが進め方を計画し、チェックリストを作り、実行し、コードのレビュー・ウェブページの確認・スクリプト実行などで完了して検証できたと判断するまで長時間自律で進めます。途中は /goal status(進捗確認)、/goal pause(中断・目標は保持)、/goal resume(再開)、/goal clear(破棄)で監視・制御できます。利用にはSuperGrokまたはX Premium Plusのサブスクが必要とされています(一次: x.ai/news、確認: Releasebot、MarkTechPost・6月22日)。
自律エージェント機能を持っているのはxAIだけですか?
いいえ。主要各社がそれぞれの形で持っています。確認できた範囲では、OpenAIのCodexはタスクをクラウドのサンドボックスへ委任し、リポジトリを複製してコードを書き、テストを回してプルリクエストを開きます(2026年4月のアップデートで複数エージェントの並列実行も追加と報道)。AnthropicのClaude Codeはコードベースを読み、計画・実行・評価して進めるエージェント型で、原則として変更前に許可を求める設計です(承認疲れを減らすAuto Modeやクラウドで動くRoutinesも報じられています)。GitHubのCopilot Coding Agentは、Issueを割り当てるとバックグラウンドで計画・コード作成・テストを行い、ドラフトのプルリクエストとして提出し、CI/CD実行前に人間の承認を挟みます。各社の最新バージョン名や価格はソースにより差があるため、特定の企業が優位とは断定できません(出典: OpenAI、Anthropic、GitHub Blog)。
自律エージェントは人間の確認なしで全部やってしまうのですか?
いいえ。確認できた各社のつくりでは、自律=ほったらかしではなく、人が監視・制御できる仕組みがセットになっています。xAIの/goalにはstatus/pause/resume/clearという監視・制御コマンドがあり、GitHubのCopilot Coding Agentは作業をドラフトのプルリクエストとして出してマージやCI/CD前に人間の承認を挟み、Claude Codeは原則として変更前に許可を求める設計です。つまり今のトレンドは、AIに任せる範囲を広げつつ、要所では人間が確認・承認するというバランス設計です。安全に使うコツは、どこで自分が確認するかをあらかじめ決めておくことだと言えます(出典: Releasebot、GitHub Docs、Anthropic)。