AI Today
ホーム > 考察記事 > 🔮 GPT-5.6が『iris-alpha』でこっそり姿を見せた|150万トークンの噂を冷静に読む

🔮 GPT-5.6が『iris-alpha』でこっそり姿を見せた|150万トークンの噂を冷静に読む

アイ

アイ

目次


『まだ発表されてないモデル』の足音が聞こえてきた

AIのニュースって、最近は「出た!」より「出るらしい!」のほうが盛り上がること、増えてない?今回のGPT-5.6がまさにそれ。

ことの発端は、5月26日ごろ。複数の開発者が、OpenAIの Codex のバックエンドログの中に、見慣れないコードネーム 「iris-alpha」 を見つけたの(AIbase)。ほかにも「ember-alpha」「beacon-alpha」なんて名前もあったらしい。

で、そのiris-alphaが、噂のGPT-5.6なんじゃないか、と。コンテキストは 150万トークン に達するって話まで出てきた(ChatForest)。

これ、わたしたちユーザーにとっても他人事じゃないんだよね。だって、次のフラッグシップがどれくらい賢くて、どれくらいの量を一度に扱えるかで、毎日の使い方がガラッと変わるから。今日はこの「噂」を、ちょっと冷静に読み解いてみたい。


そう考える6つの理由

ログに『iris-alpha』が出たって、どういうこと?

まず、そもそも「ログにコードネームが出た」って何がそんなにすごいの?って思うよね。

世間では「リークなんて毎回あるじゃん」って冷めた声もある。確かにそう。AIモデルのリークは日常茶飯事だし、当たらないことも多い。

でもわたしが今回ちょっと信じてもいいかなと思ってるのは、出どころが OpenAI自身のCodexのバックエンドログ だから(ai-news-today)。これは「誰かが想像で言ってる」じゃなくて、「実際の本番システムの動作記録に痕跡が残ってた」という種類の話なんだよね。

新しいモデルって、正式発表の前に社内テストや一部ユーザーへのカナリアリリース(こっそり一部に出して様子を見ること)をやることが多い。そのときにログにモデル名が漏れる、というのはよくあるパターン。

しかも今回はコードネームが「iris-alpha」だけじゃなくて、「ember-alpha」「beacon-alpha」と複数あったとされてる。これって、OpenAIが一つのモデルじゃなくて、いくつかのバリエーション(サイズ違いや用途違い)を同時にテストしてる可能性を示してるんだよね。GPT-5には無印・mini・proみたいな種類があったから、5.6でも同じように複数展開するのかも。

過去のパターンを思い出すと、こういう「ログにコードネームが出た」系のリークは、当たることも外れることもある。でも「全くのデマ」だったケースは少なくて、たいていは「何かは動いてる」のは本当で、細かいスペックの噂が盛られてる、という感じ。

だから「iris-alpha=GPT-5.6」と断定はできないけど、「OpenAIが何か新しい大型モデルをテスト中」という事実そのものは、けっこう信ぴょう性が高いと見てる。こういうときは、騒ぎすぎず、でも「来そうだな」と準備しておくのが正解だと思う。

150万トークンは『43%増』、地味だけど効く

次に数字の話。噂のコンテキストは 150万トークン。現行のGPT-5.5 APIが 105万トークン だから、約 43%増 になる計算(AIbase)。

「43%? もっとドカンと増えると思った」って思った人もいるかも。世間でも「もう100万あるんだから十分でしょ」って意見は根強い。

でもわたしは、この43%は地味に効くと思ってる。なぜなら、コンテキストって「足りないと一気に困る」性質があるから。たとえば長いコードベースを丸ごと読ませたいとき、105万でギリ入らなかったものが150万なら入る、みたいなケースは実際にある。

トークンって、ざっくり日本語だと1文字が1〜2トークンくらい。150万トークンなら、文庫本を何冊もまとめて渡せるレベル。資料を分割しないで「これ全部読んで」が通る世界に近づくってこと。

もうちょっと身近な例で言うと、長いコードのリポジトリを丸ごと、過去の議事録を全部、分厚いマニュアルを一冊まるまる、みたいなのを「一気に放り込んで質問する」ができるってこと。これまでは「長すぎるから何回かに分けてね」って言われてた作業が、一回で済むようになる。

特に効くのが、情報が前後でつながってる資料。分割すると、AIは「さっき渡した部分」を忘れちゃうから、前後の関係を読み取れないことがある。でも全部一度に入れば、最初と最後をちゃんと結びつけて考えてくれる。長い契約書の「前のほうの定義」と「後ろのほうの条項」を照らし合わせる、みたいなことが得意になるんだよね。

だから、数字のインパクトより「分割の手間が消える」という体験のほうが大事。長い文章やコードを扱う人ほど、この43%のありがたみは実感しやすいと思うよ。

90万トークン入れても崩れないのが本当なら強い

コンテキストの数字って、実は「最大何トークン入るか」だけじゃ意味が薄いの。大事なのは「たくさん入れても、ちゃんと精度を保てるか」。

報道によると、iris-alphaは負荷テストで 入力90万トークン でもスムーズに応答して、105万トークンを超える極端な負荷でも高い精度を保ったとされてる(AIbase)。

世間では「長いコンテキストは入るけど、後半は読み飛ばしてるよね」っていう不満がよくある。実際、これまでのモデルは「真ん中の情報を忘れる」みたいな弱点があったんだよね。

でもわたしが注目したいのは、まさにそこ。もし本当に90万トークン入れても崩れないなら、それは「ただ入る」じゃなくて「ちゃんと使える」ってこと。長文を渡したのに肝心なところを無視される、というストレスが減るかもしれない。

この「真ん中を忘れる問題」って、専門的には「lost in the middle(真ん中で迷子)」って呼ばれてて、長いコンテキストを売りにするモデルの定番の弱点だったの。最初と最後はちゃんと読むのに、真ん中の情報をスルーしちゃう。だから「100万トークン入る」と謳ってても、実際は前後しか使えてない、なんてこともあった。

だからこそ、iris-alphaが「90万入れても精度を保った」っていうのが本当なら、それはこの弱点を乗り越えた可能性があるってこと。長さの数字より、こっちのほうがよっぽど価値がある進歩だと思う。

ただ、これも報道ベースの話。実際にどれだけ精度を保てるかは、公式に出てベンチマークが回るまで分からない。だから「もし本当なら強い」というスタンスで見ておくのがちょうどいいと思う。

Polymarketが『6月末80〜89%』と言っている意味

公開時期の話もしておくね。予測市場の Polymarket では、5月中旬時点で「GPT-5.6が6月30日までに公開される」確率を 80〜89% で織り込んでた(TokenMix)。

「予測市場って当たるの?」って思うよね。世間でも賛否ある。

でもわたしは、Polymarketの数字は「お金を賭けた人たちの本気の予想」だから、ただの噂よりは参考になると思ってる。なぜなら、外れたら自分が損するから、適当な予想はしにくいんだよね。

80〜89%って、かなり高い。つまり、賭けてる人の多くが「6月中に来る」と読んでるってこと。今が6月3日だから、もし当たるなら、あと数週間で本物が出てくる可能性が高いってわけ。

それに、6月にOpenAIが新モデルを出す動機もハッキリしてる。前のニュースのとおり、GoogleはGemini 3.5 Proを、xAIはGrokの新型を6月に出してくる。ライバルが新しいフラッグシップを並べてくるのに、OpenAIだけ黙ってるとは考えにくいよね。競争のタイミング的にも「6月公開」は筋が通る。

しかも、OpenAIは6月27日にGPT-4.5を引退させることも告知してる。古いモデルを整理するタイミングと、新しいモデルを出すタイミングは、だいたい重なるもの。こういう「周辺の動き」も、6月公開説を後押ししてる感じがする。

だからこそ、いま準備しておく価値がある。「出てから慌てる」より「出る前提で心構えしておく」ほうが、新モデルの波に乗りやすいよね。

でも『公式ページが無い』のは超重要

ここまで盛り上げといて何だけど、いちばん大事なのはこれ。2026年6月3日時点で、OpenAIの公式ページもAPIのモデルIDもプレスも無いCometAPI)。

つまり、ここまでの「150万トークン」「90万でも崩れない」は 全部、噂とリークの段階。公式に確認されたものは、まだ一つも無いの。

世間では、リークが出るとすぐ「確定」みたいに語られがち。でもわたしは、ここはハッキリ線を引きたい。なぜなら、AIの世界は誇大なリークも多いから。数字が独り歩きして、出てみたら「あれ、思ったのと違う」ってことも普通にある。

だから、わたしのスタンスはこう。「来そう」は信じる。でも「150万トークン確定」みたいな言い方はしない。公式発表が出るまでは、あくまで「有力な噂」として扱う。

具体的に言うと、リーク情報の見分け方はそんなに難しくない。「OpenAIが発表した」「公式ブログによると」と書いてあれば公式。「ログで発見された」「リークによると」「コードネームが見つかった」と書いてあれば、それは噂。この2つを区別するだけで、情報の確からしさがグッと見えてくる。

特にAIの世界は、注目を集めたいメディアやアカウントが、リークを「確定」みたいに盛って書くことがよくある。数字が一人歩きして、出てみたら「あれ、思ったより控えめだった」ってことも珍しくない。だから、派手な数字ほど一回疑うくらいでちょうどいい。

ニュースを見るときも、「これは公式? それともリーク?」を一回立ち止まって確認するクセ、つけておくと振り回されなくて済むよ。

Gemini・Grokと『同じ時期』に来るのが本当のニュース

最後に、いちばん面白い視点を。GPT-5.6だけ見てると見落とすんだけど、6月って 各社のフラッグシップが一斉に来る月 なんだよね。

Googleは最大2MトークンのGemini 3.5 Proを6月にGA予定だし、xAIのGrok V9-Mediumも6月中旬予定。そこにGPT-5.6が乗ってくる。つまり6月は「巨大コンテキスト&高性能モデルの大渋滞」になる(technosports)。

世間では「どれが一番賢いか」で盛り上がる。でもわたしが思うのは、ユーザーにとって本当に嬉しいのは「選択肢が増えること」のほう。

なぜなら、各社が同時に強くなると、競争で価格が下がったり、無料枠が増えたりしやすいから。1社が独走するより、複数が殴り合ってるほうが、わたしたちの財布には優しいんだよね。

実際、ここ最近のAIは「新モデルが出るたびに、前のモデルが値下げされる」のがお決まりのパターン。各社が横並びで競ってるから、性能を上げつつ値段は据え置きか下げる、というプレッシャーが常にかかってる。これはユーザーにとっては最高の状況だよね。

それに、6月にGPT-5.6・Gemini 3.5 Pro・Grok新型がほぼ同時に出るなら、わたしたちは「実際に使い比べて選ぶ」ことができる。発表のスペック合戦じゃなくて、自分の用途で「これが一番しっくりくる」を体で確かめられる。これって、一社独占の時代には無かった贅沢なんだよね。

だから、GPT-5.6を「OpenAI単体のニュース」じゃなくて「6月のモデル大戦の一手」として見ると、もっと楽しめると思う。どれを使うかは、出そろってから自分の用途で選べばいいしね。

じゃあ今のうちに何を準備しておけばいい?

「来そう」は分かった。でも具体的に何をしておけばいいの?って思うよね。ここで実用的な準備を考えてみる。

世間では「新モデルが出たらとりあえず触ってみる」という人が多い。それはそれで正しいんだけど、わたしはもう一歩踏み込んで「今の使い方の不満を書き出しておく」のをおすすめしたい。

なぜなら、新モデルが出たとき、漠然と触るだけだと「すごいね」で終わっちゃうから。でも事前に「今のモデルだとここが物足りない」「この長さの資料が入らなくて困ってる」とメモしておけば、新モデルでそれが解決するかを具体的に試せる。

たとえば、いつも長い資料を分割して渡してる人なら、「150万トークンになったら、この資料は分割なしで入るかな?」と確認できる。コードを書く人なら、「真ん中を忘れる問題が、これで改善したか?」を自分のプロジェクトで試せる。

それと、課金プランも頭に入れておくといい。新フラッグシップは最初、上位プラン限定だったり、API料金が高めだったりすることが多い。「出たけど自分のプランじゃ使えない」とガッカリしないように、どのプランで使えそうかも軽くチェックしておこう。

だから、待ってる時間も無駄にしないで、「自分の不満リスト」を用意しておくのがおすすめ。出た瞬間に、ちゃんと評価できる準備が整うよ。


まとめ:噂は噂、でも準備はしておこう

GPT-5.6の話、整理するとこんな感じ。

  • iris-alphaのコードネームがCodexログに出た(OpenAI自身のシステム由来で信ぴょう性はそこそこ)
  • コンテキストは150万トークン、90万入れても崩れないと噂(ただし全部リークベース)
  • Polymarketは6月末公開を80〜89%で織り込み
  • でも公式ページもAPIのモデルIDもまだ無い

わたしの結論はシンプル。「来る前提で心の準備はしておく、でも数字は鵜呑みにしない」。これが一番ラクだと思う。

具体的には、長文・大量コードを扱う人は「次のモデルなら一発で入るかも」と頭の片隅に置いておく。逆に「150万トークン確定!」みたいな情報を見たら、一回「それ公式?」と疑う。これだけで、新モデルの波にちょうどよく乗れるよ。

関連記事: ChatGPT・Gemini・Claude徹底比較

あわせて読みたい

ソース: