AI Today
ホーム > 比較記事 > AIエージェントってどこまで実用化された?現在地を整理してみた

AIエージェントってどこまで実用化された?現在地を整理してみた

「AIエージェントって結局何ができるの?」「Computer UseとMCPって何が違うの?」――2026年5月、AIエージェントの世界は3月時点から完全に景色が変わっている。

5月22日、ロンドンで開催された Code with Claude で Anthropic は「Most software at Anthropic is now written by Claude」と公式に宣言。同じ週には Google が Vertex AI を廃止Gemini Enterprise Agent Platform に置き換えると発表、Camunda は ProcessOS という名の「Agentic Operating System」を投入した。

この記事では、2026年5月時点のAIエージェント業界マップを整理しながら、MCP(Model Context Protocol)の新機能 tunnels と sandboxes、エンタープライズ導入の現実、実装手順までを実践目線でまとめる。

2026年5月時点のAIエージェント業界マップ

まず全体像を押さえる。今のAIエージェント業界は、ざっくり以下の5レイヤーで動いている。

レイヤー主要プレイヤー(2026年5月)キーワード
プロトコル / 標準Anthropic MCP / Linux Foundation AAIFMCP tunnels・sandboxes、A2A
エージェントプラットフォームClaude(Anthropic)/Gemini Enterprise Agent Platform/OpenAI Operator/Microsoft Agent FrameworkManaged Agents、Computer Use
業務OS / ワークフローCamunda ProcessOS/Salesforce Agentforce/IBM watsonx OrchestrateAgentic OS、BPM
ガバナンス / 信頼NVIDIA Verified Agent Skills + Skillspector/EU AI Act(GPAI 8/2罰則開始)認証、監査、コンプライアンス
オープンソース / 開発系CrewAI、LangGraph、Auto-GPT 後継、Antigravity 2 CLIマルチエージェント、IaC ライク

3月までの記事だと「Claude Code・CrewAI・Auto-GPT・Grok」で全体像が描けたが、2026年5月の今はプロトコル層(MCP)と業務OS層(ProcessOS / Agentforce)が独立したレイヤーとして確立し、その上にプラットフォームが乗る構造になっている。

しかも、Salesforce の Agentforce は $1.4B ARR に到達したと報告されており、もはや「PoCの集合」ではなく 収益化されたAIエージェント経済として機能し始めている。

AIエージェントとは?chatbot からの進化

改めて定義を整理する。

  • チャットボット(〜2024):1往復で答える。会話履歴は短く、外部にも触れない。
  • アシスタント(2024〜2025):ツール呼び出しが可能。検索・コード生成・APIコールができる。
  • AIエージェント(2026〜)ゴールを渡すと、自分でタスクを分解し、ツールを連鎖実行し、結果を検証して再試行する。長期メモリと外部接続が前提。

2026年のAIエージェントが従来と決定的に違うのは、次の3点だ。

  1. MCPで外部サービスへの接続が標準化された
  2. Computer Use / Operatorでブラウザやアプリの実操作ができるようになった
  3. Managed Agentsでクラウド側にエージェントを置きっぱなしにできるようになった

筆者が3月時点で「業務を2時間短縮できる」と書いたが、5月時点では1日4〜6時間級の自動化が現実的な水準に上がっている。実装が成熟したからだ。

MCP(Model Context Protocol)完全解説

ここが今号の本丸。MCPを理解せずに2026年のAIエージェントは語れない。

MCPとは何か

MCPは Anthropic が2024年末に提案し、2026年5月時点で Linux Foundation の AAIF(Agentic AI Interoperability Foundation)配下に置かれた業界標準プロトコル。エージェントが外部システム(DB、Slack、Google Drive、社内API等)に「同じインターフェース」でアクセスするための共通言語だ。

5月時点の累積インストール数は約 9,700万。もはや「使う/使わない」ではなく「どう使うか」のフェーズに入っている。

MCPの5月新機能:tunnels と sandboxes

5月22日の Code with Claude London で Anthropic が公式発表した2つの新機能が、エンタープライズ導入の決定打になりつつある。

MCP tunnels: ローカル環境やオンプレ社内システムを、インターネット越しに外部のClaude/エージェントに安全に公開する仕組み。VPNを張らずに、社内のJira・Confluence・社内DBに対してエージェントから読み書きできる。 イメージとしては「ngrok の MCP 専用版」。アクセス権はトークン管理、監査ログが残る。

MCP sandboxes: エージェントが書いたコードやコマンドを、隔離されたコンテナ環境で実行する仕組み。ファイルシステムは tmpfs、ネットワークは限定 allow-list、CPU/メモリ上限あり。

「Claude が自律的にコードを書いて実行する」というユースケースは、これまでセキュリティチームから止められがちだったが、sandboxes でようやくコンプラ部門を説得できる構成が標準提供された。

MCP の使い方(3分概念図)

[Claude / Agent] ──MCP──▶ [MCP Server] ──▶ [Slack / Jira / 自社DB / GitHub]
                                  │
                                  └──tunnels──▶ [社内システム]
                                  └──sandbox──▶ [安全なコード実行]

つまり「LLMの賢さ × あらゆる外部システム × 安全な実行環境」を1つの規格で繋ぐのがMCPの役割だ。

day-one パートナーとして Google Gemini Spark も Canva・Instacart・OpenTable を MCP 接続済みで提供しており、もはや MCP は Anthropic 単独の規格ではない。

主要エージェントプラットフォーム比較(2026年5月時点)

筆者の検証も含めて、現時点の主要プレイヤーを表で並べる。

プラットフォーム提供元強み弱み月額目安
Claude(Claude Code / Computer Use / Managed Agents)Anthropicコーディング・MCP標準・社内自動化GUI 弱め、上位プランは高いPro $20〜 / Max $100〜200
Gemini Enterprise Agent PlatformGoogleWorkspace 連携、Spark の MCP day-one、$100 Ultra プラン旧 Vertex 互換の周辺ドキュメントが過渡期Ultra $100〜 / Enterprise 要相談
OpenAI OperatorOpenAIブラウザ実操作、ChatGPT Pro と連動エンタープライズ向け制御は発展途上ChatGPT Pro $20〜
Microsoft Agent Framework / Agent 365MicrosoftM365 統合、Copilot Cowork 既定化エージェント単体のロックインが強いE5 / Agent 365 ライセンス
Camunda ProcessOSCamunda業務プロセスにAI が記述する「Agentic OS」既存BPM 知識が前提エンタープライズ
Salesforce AgentforceSalesforceCRM 統合・$1.4B ARR の実績Salesforce エコシステム前提Agentforce ライセンス
NVIDIA Verified Agent Skills + SkillspectorNVIDIAチップメーカーが「信頼」を標準化、認証付きスキル提供範囲が NVIDIA Inference Microservices 中心個別契約

ポイントは、「LLMの優秀さ」よりも「業務との接続点」で勝負が決まり始めたことだ。Claude が中央処理、Gemini が顧客接点、Microsoft が PC、Camunda が業務プロセス、Salesforce が顧客データ、NVIDIA が認証――というように、それぞれの強みが棲み分けている。

旧世代エージェント:Claude Code / CrewAI / Auto-GPT / Grok の現在地

3月時点で取り上げた4ツールも、5月時点では位置づけが変化している。

Claude Code(2026年5月最新)

Anthropic の主力。Computer Use・Managed Agents・MCP tunnels/sandboxes を全部このCLIから叩ける。 詳しい使い方はClaude Code使い方ガイド2026にまとめた。 5月22日に Anthropic が「社内ソフトウェアの大半は Claude が書いている」と公式宣言したことで、Claude Code は「単なる便利ツール」から「AI企業の本番ワークフロー」に格上げされた。

CrewAI / LangGraph

オープンソース系は引き続き活発。CrewAI はFortune 500の60%以上が採用しているとの公式数字を維持しつつ、5月にかけて MCP クライアント機能が標準化された。

Auto-GPT 後継

「自律ループ」系は ProcessOS や Managed Agents に吸収されつつある。プロダクション用途では Auto-GPT 単体より、Managed Agents + MCP + sandboxes の組み合わせが現実解になった。

Grok

リアルタイム情報収集の強さは健在。マルチエージェントと200万トークン窓は2026年でも依然優位。ただし業務自動化の中心軸ではなくなり、インテリジェンス収集レイヤーとしての立ち位置が明確になっている。

エンタープライズ導入の実態:HCLTech「43%失敗」の壁

ここで現実に水を浴びる。HCLTech が467社を対象に実施した2026年の調査では、エンタープライズAIプロジェクトの43%が失敗すると予測されている。

失敗パターンの主因:

  • 「使い道が無い」のに導入:CEO の号令でPoCだけ走らせて止まる
  • データ品質:エージェントに渡すデータが汚く、誤答を繰り返す
  • 権限とガバナンス:誰がどのMCPサーバーに接続できるか整理されていない
  • 評価指標の欠如:エージェントの「成功」が定義されていない

成功している企業に共通するのは、以下の4点だ。

  1. 業務プロセスから逆算する(Camunda ProcessOS が刺さる理由)
  2. MCP sandboxes など実行環境を標準化
  3. NVIDIA Verified Skills のような認証付きコンポーネントを採用
  4. EU AI Act など規制対応を初期から織り込む

逆に言えば、「ChatGPT を社内に入れた」だけで止まっている企業の43%は、2026年中に投資回収できず撤退するということだ。

業種別ユースケース(2026年5月最新)

筆者が実際に観測している、業種別の有効パターンを整理する。

コーディング・開発

カスタマーサポート

  • Salesforce Agentforce Operations:バックオフィス完結型、$1.4B ARR の中核
  • Gemini Enterprise Agent Platform:Workspace のメール・チャットを横断
  • 関連:ChatGPT vs Gemini vs Claude徹底比較

営業 / マーケティング

データ分析・経理

ノーコード自動化 / 個人開発

実装手順:MCPでエージェントを社内につなぐ

ここでは「Claude Code を中心に、社内システムを MCP で繋ぐ」前提で、最短ルートを示す。

ステップ1:Claude Code をインストール

npm install -g @anthropic-ai/claude-code
claude

詳しいインストール手順・主要コマンドはClaude Code使い方ガイド2026を参照。

ステップ2:MCPサーバーを選ぶ/立てる

代表的なオプション:

  • 公式 reference:filesystem、git、postgres など
  • Slack / Notion / Google Drive:公式または準公式のMCPサーバーあり
  • 自社API:自前で MCP server を実装(TypeScript SDK 推奨)

設定ファイル例(~/.claude/mcp.json):

{
  "mcpServers": {
    "company-jira": {
      "command": "node",
      "args": ["/path/to/jira-mcp-server.js"],
      "env": { "JIRA_TOKEN": "<your-token>" }
    }
  }
}

ステップ3:tunnels で社内システムに繋ぐ

オンプレや社内NWのリソースを公開する場合:

claude mcp tunnel start --target jira.internal --port 8080

トークンが発行され、外部のClaude/Managed Agents から安全にアクセスできるようになる。

ステップ4:sandbox 内で実行する

エージェントがコードを書いて動かす系の処理は、必ず sandbox を経由させる:

claude run --sandbox "fix all failing tests in src/"

ネットワークは allow-list 制、ファイル書き込みは作業ディレクトリ限定。コンプラ部門に出せる構成になる。

ステップ5:Managed Agents でクラウドに常駐させる

ローカルPCを開きっぱなしにする必要がある作業は、Anthropic Managed Agents に移行する。 たとえば「毎朝メール要約 + Jira 起票」を Managed Agents に登録すれば、ローカル不要で動き続ける。

ROI・コスト試算(2026年5月版)

筆者が知る範囲で、典型的なエンタープライズ導入のコスト感を整理する。

規模月額コスト目安主構成期待 ROI
個人開発者$20〜100Claude Pro + 既存 MCP サーバー1日 1〜2時間短縮
スタートアップ(10〜30人)$500〜3,000Claude Max + Managed Agents 数本エンジニア1人分相当
中堅企業(300人)$5,000〜30,000Claude Enterprise + Camunda ProcessOS + Agentforce部署単位の業務30〜50%自動化
大企業(数千人)$100,000〜上記 + NVIDIA Verified Skills + 自社MCPゲートウェイ投資判断は AI Act 罰則対策含む

注意点は、「LLMトークン代」より「業務プロセス整備の人件費」が大きいことだ。HCLTech 43%失敗パターンは、ここをケチった結果でもある。

規制とセキュリティ:EU AI Act・MCPセキュリティ

EU AI Act:GPAI 罰則は 2026年8月2日から

汎用AI(General Purpose AI = GPAI)の罰則条項は 2026年8月2日に発効する。罰則上限は全世界年商の7%。日本企業でも、EU向けにサービスを提供している場合は対象になり得る。

実務的に効くのは:

  • モデルカード/システムカードの整備
  • トレーニングデータの透明性
  • 重大インシデントの報告義務

詳しくはEU AI Act GPAI罰則カウントダウンを参照。

MCPセキュリティ:サプライチェーン問題

MCPサーバーが普及した副作用として、悪意あるMCPサーバーがエージェントを乗っ取るサプライチェーン攻撃が観測され始めている。Anthropic は自社で MCP sandboxes を提供する一方、Project Glasswing(脆弱性検出)でMCPまわりの脆弱性を継続スキャンしている。 詳細:Anthropic Project Glasswing×サイバー連合Anthropic MCP脆弱性とサプライチェーン

NVIDIA Verified Agent Skills

NVIDIA は5月に Verified Agent Skills + Skillspector を発表。チップメーカーが「どのエージェントスキルなら信頼できるか」を認証する形に踏み込んだ。エンタープライズ採用ではここを通っているかが今後の選定基準になる。 詳細:NVIDIA Verified Agent Skills + Skillspector

実体験:5月の業務自動化ルーチン

筆者が5月時点で実際に回しているルーチンの一例(個人開発レベル):

タスク構成短縮時間
朝のニュース要約+Slack投稿Claude Managed Agent + MCP(Slack)30分/日
GitHub PR の初動レビューClaude Code + sandbox 実行40分/日
競合リサーチ+スプレッドシート転記Grok + Claude Code + Google Drive MCP60分/日
週次レポート生成Managed Agent + Notion MCP60分/週
経費仕訳の下書きClaude + クラウド会計 MCP30分/週

合計でだいたい平日 約2時間/日 + 週次 1.5時間が自動化されている。3月時点より純増しているのは、MCP で繋がる先が増えたのと Managed Agents で「PCを開きっぱなしにしなくていい」ようになったのが大きい。

関連考察記事(2026年5月分)

直近の業界動向を深掘りした考察も合わせてどうぞ。

よくある質問(FAQ)

Q. MCP(Model Context Protocol)って結局なんですか?

A. AIエージェントが外部システム(Slack、Jira、社内DB、Google Drive など)に「同じインターフェース」でアクセスするための業界標準プロトコルです。2026年5月時点で累積9,700万インストール、Linux Foundation 配下に置かれた事実上の標準です。Claude だけでなく Gemini Spark も day-one で対応しています。

Q. MCP tunnels と sandboxes は何が違うのですか?

A. tunnels は「外と中をつなぐ通路」、sandboxes は「エージェントが暴れても安全な部屋」です。tunnels は社内システムを安全に外部エージェントへ公開する仕組み、sandboxes はエージェントが書いたコードやコマンドを隔離環境で実行する仕組みです。両方とも5月の Code with Claude London で発表されました。

Q. Computer Use と Operator はどう違いますか?

A. どちらも「ブラウザやPCを実操作するAI」ですが、Computer Use は Anthropic / Claude 系、Operator は OpenAI / ChatGPT 系です。実装思想はほぼ同じで、画面を見てマウス・キーボードを操作します。エンタープライズ用途では、MCP・Managed Agents との統合が深い Claude 側が一歩リードしている印象です。

Q. AIエージェント導入は本当に元が取れますか?

A. 規模によります。個人開発者なら月$20〜で1日1〜2時間短縮はほぼ確実に達成できます。一方、エンタープライズではHCLTech 調査で43%が失敗すると予測されており、業務プロセス整備とガバナンスを軽視すると投資回収できません。成功条件は「業務プロセスから逆算」「MCP・sandboxes など実行環境の標準化」「規制対応の早期織り込み」の3点です。

Q. プログラミング知識は必要ですか?

A. 個人で MCP を立てる場合は最低限の Node.js / Python の知識が必要です。ただし「すでに用意された MCP サーバーを使う」「ノーコードの n8n や Notion AI を使う」だけなら、プログラミング不要で始められます。Claude Code 自体はCLIですが、自然言語で指示できます。

Q. セキュリティ的に大丈夫ですか?機密情報を扱えますか?

A. 2026年5月時点では、MCP sandboxes + Managed Agents の組み合わせがエンタープライズの最低ラインです。加えて、悪意あるMCPサーバーによるサプライチェーン攻撃も観測されているため、信頼できるソースのMCPサーバーのみ使用、社内向けは自前実装が推奨されます。EU向け事業は2026年8月2日のAI Act GPAI罰則開始も要対応です。

Q. どのプラットフォームから始めるべきですか?

A. 用途別に分かれます。コーディング・社内自動化なら Claude Code + MCPWorkspace 中心なら Gemini EnterpriseCRM 周りなら Salesforce Agentforce業務プロセスから入るなら Camunda ProcessOSまず無料で試したいなら Grok。最初の1台目で迷ったら、Claude Pro ($20/月) でMCPに触れるのが2026年の王道です。

Q. 「AIエージェントブームはバブルでは?」という意見をどう見ますか?

A. 部分的には正しいです。HCLTech 43%失敗予測、PoC 死亡パターンは現実に存在します。一方で、Salesforce Agentforce $1.4B ARR、Anthropic Managed Agents 拡張、Camunda ProcessOS のように実利益を出している領域は確実に増えています。「全部バブル」ではなく「業務プロセスに刺さった所だけ収益化」という現状認識が正確です。

Q. 個人で始める一番安いコース教えてください

A. Grok 無料 → Claude Pro $20/月 → MCP サーバー2〜3個を自分のPCで起動、というルートが最安です。月$20で MCP tunnels と sandboxes の基礎機能まで触れます。本記事の「実装手順」セクションが具体的な手順になります。


あわせて読みたい

よくある質問

MCP(Model Context Protocol)って結局なんですか?
AIエージェントが外部システムに同じインターフェースでアクセスするための業界標準プロトコル。2026年5月時点で累積9,700万インストール、Linux Foundation 配下。Claude だけでなく Gemini Spark も day-one で対応している。
MCP tunnels と sandboxes は何が違うのですか?
tunnels は社内システムを安全に外部エージェントへ公開する通路、sandboxes はエージェントが書いたコードを隔離環境で実行する部屋。両方とも2026年5月22日の Code with Claude London で発表された。
Computer Use と OpenAI Operator はどう違いますか?
どちらもブラウザやPCを実操作するAIで、Computer Use は Anthropic / Claude 系、Operator は OpenAI / ChatGPT 系。実装思想はほぼ同じ。エンタープライズ用途では MCP と統合が深い Claude 側が一歩リードしている印象。
AIエージェント導入は本当に元が取れますか?
個人なら月20ドルで1日1〜2時間短縮はほぼ確実。一方エンタープライズでは HCLTech 調査で43%が失敗する予測。業務プロセス整備とガバナンスを軽視すると回収できない。
プログラミング知識は必要ですか?
自前で MCP を立てるなら Node.js / Python の基礎が要る。既存 MCP サーバーや n8n・Notion AI を使うだけならプログラミング不要。Claude Code は CLI だが自然言語で指示できる。
セキュリティ的に大丈夫ですか?
MCP sandboxes + Managed Agents の組み合わせがエンタープライズの最低ライン。悪意ある MCP サーバーによるサプライチェーン攻撃も観測されており、信頼できるソースのみ使用、社内向けは自前実装が推奨される。EU AI Act GPAI 罰則は2026年8月2日開始。
どのプラットフォームから始めるべきですか?
コーディング・社内自動化なら Claude Code + MCP、Workspace中心なら Gemini Enterprise、CRM周りなら Salesforce Agentforce、業務プロセスから入るなら Camunda ProcessOS。最初の1台目で迷ったら Claude Pro 月20ドルで MCP に触れるのが2026年の王道。
AIエージェントブームはバブルでは?
部分的には正しい。HCLTech 43% 失敗予測、PoC 死亡パターンは現実に存在する。一方で Salesforce Agentforce 1.4B ドル ARR、Anthropic Managed Agents 拡張など実利益を出している領域も確実に増えており、業務プロセスに刺さった所だけ収益化が現状認識として正確。
個人で始める一番安いコースを教えてください
Grok 無料 → Claude Pro 月20ドル → MCP サーバー2〜3個を自PCで起動、が最安ルート。月20ドルで MCP tunnels と sandboxes の基礎機能まで触れる。

この記事は随時更新しています。最新情報は各サービスの公式サイトでご確認ください。