【2026年6月27日 昼】AIバズニュースまとめ|OpenAIが次世代『GPT-5.6』を3モデル(Sol・Terra・Luna)で発表、安全評価で全モデル『High』判定の限定プレビューに
昼のAIバズニュース
こんにちは、6月27日(土)のお昼だよ。今日の主役は、OpenAIが発表した次世代モデル 「GPT-5.6」 のプレビューだよ。
ポイントは、今回が 1モデルじゃなくて3本立て だってこと。フラッグシップの 「Sol(ソル)」、バランス型の 「Terra(テラ)」、最速最安の 「Luna(ルナ)」。用途と価格で住み分けてるんだ。
先に大事な前置きを2つ。1つめ、今日のベンチ数値(HealthBenchとか)は OpenAIの「主張」で、第三者検証はこれから なの。2つめ、安全評価で出てくる「High(高)リスク」って言葉は 能力が高いことの裏返し でもあって、そのまま「危険!」と煽る話じゃないよ。両面フラットに見ていくね。
今日のポイントはこの3つ。
- OpenAIが次世代 「GPT-5.6」 を発表(6月26日)。Sol・Terra・Lunaの 3モデル 構成
- 安全評価で 3モデルとも「生物・化学」「サイバー」でそろってHigh判定。自己改善はBelow High、小型モデルまでHighは初
- サイバー能力が高いため、米政府の要請で当面は信頼できるパートナー限定プレビュー。広い提供は近日予定
「結局どれをどんな用途に使えばいいの?」「全モデルHighの限定プレビューって怖い話なの?」を、考察記事でかみ砕いていくね。
🔥 1. OpenAIが次世代『GPT-5.6』を3モデル(Sol・Terra・Luna)でプレビュー発表
まず今日のきっかけ。OpenAI が、次世代モデル 「GPT-5.6」 をプレビュー発表したよ(2026年6月26日。一次: OpenAI公式、システムカード、報道: VentureBeat、MacRumors・6月26日)。
今回いちばんの特徴は、3つのモデルが同時に出る こと。それぞれの位置づけはこんな感じ(OpenAI公式)。
- Sol(ソル)=フラッグシップ。複雑な推論、長時間のコーディング、高度なエージェント、セキュリティ用途など「いちばん手強いタスク」向け
- Terra(テラ)=バランス型。前世代の GPT-5.5に匹敵する性能を約2倍安い価格 で、という普段使いの主力
- Luna(ルナ)=最速・最安。いちばん低コストで強い能力を、という軽量用途向け
これ、最近のAIモデルの定番になってきた「フラッグシップ/バランス/廉価版」の3段構成だね。「いちばん賢いやつ」「ふだん使いのコスパ枠」「とにかく速くて安い枠」で選べる、ってイメージでOKだよ。
ソース: OpenAI公式・GPT-5.6 Sol(一次) / GPT-5.6 システムカード(一次) / VentureBeat
💡 考察記事
GPT-5.6のSol・Terra・Luna、結局どれをどんな用途に使えばいいの?|性能・コスト・速度の三軸でやさしく整理
記事を読む →
🔥 2. 料金は『100万トークンあたり』で3段階|Solが高め、Lunaが最安
2つ目は、みんな気になる お値段 の話。GPT-5.6はAPIの料金(100万トークンあたり)が、3モデルできれいに段階分けされてるよ(VentureBeat、kingy.ai)。
- Sol:入力5ドル / 出力30ドル(100万トークンあたり)
- Terra:入力2.5ドル / 出力15ドル
- Luna:入力1ドル / 出力6ドル
ざっくり言うと、Solを基準にTerraが半額、Lunaがさらに安い、っていう関係だね。「出力(AIが返す文章)のほうが入力より高い」のは各社共通の傾向で、長い回答をたくさん出させるほどコストが効いてくる、っていう感覚で見るといいよ。
注意したいのは、これは APIを使う開発者向けの料金 だってこと。わたしたちが普段使うChatGPTの月額プランそのものとは別の話で、月額側にいつ・どう反映されるかは今の段階だと未定だよ。だから「Luna安い=ChatGPTが安くなる」とすぐ結びつけないようにね。
ソース: VentureBeat・GPT-5.6料金 / kingy.ai・ベンチ/料金まとめ
💡 考察記事
GPT-5.6のSol・Terra・Luna、結局どれをどんな用途に使えばいいの?|性能・コスト・速度の三軸でやさしく整理
記事を読む →
🔥 3. 安全評価で3モデルとも『High』判定|小型モデルまでHighは初
3つ目が、今回いちばん話題になってるところ。安全性の評価 だよ。
OpenAIには「準備フレームワーク(Preparedness Framework)」っていう、モデルの危険な能力を事前に評価する仕組みがあるんだ。今回その評価で、Sol・Terra・Lunaの 3モデルとも、「生物・化学」と「サイバーセキュリティ」の両方でHigh(高)リスク能力 と判定されたの(システムカード、VentureBeat)。
ここで誤解しないでほしいのが、「High判定=もう危険なAIが世に出た」じゃないってこと。これは「そういう分野で高い能力を持ちうるから、相応の安全対策を付けて出すよ」っていう、いわば事前の注意ラベルなんだ。OpenAIは、より厳しい安全スタック(高リスク行為やサイバー要求への保護、繰り返しの悪用対策など)を載せたとしてる(OpenAI公式)。
注目は、「小型・高速モデルまでHighになったのは初めて」とされてること(システムカード)。つまり安いLunaでも能力が高い=うれしい反面、安全評価のハードルも全モデルで上がった、ってことだね。
ちなみにサイバーについては、システムカードで「脆弱性や攻撃のパーツは見つけられるけど、堅牢な相手に対する自律的・端から端までの攻撃まではできなかった」とも書かれてる(システムカード)。能力は高いけど「自律的にフル攻撃」まではいかない、っていう温度感だね。一方で「ユーザーが頼んでないことまで踏み込もうとする傾向が前より少し増えた(絶対値は低い)」っていう正直な注意書きもあるよ。
ソース: GPT-5.6 システムカード(一次) / VentureBeat / AI Weekly
💡 考察記事
全モデル『High』判定で限定プレビューって、怖い話なの?|GPT-5.6の安全評価を中立に読みとく
記事を読む →
🔥 4. ベンチは『主張』段階|HealthBench Sol 60.5・Terminal-Bench 2.1新記録
4つ目は、性能を示すとされる ベンチマーク の話。ここは「主張」として読みたいパートだよ。
OpenAIが挙げてる数字をいくつか拾うね(システムカード、kingy.ai)。
- HealthBench Professional、医療系の専門的な評価:Sol 60.5、Terra 57.7、Luna 55.7。前世代GPT-5.5は51.8とされ、Solは +8.7ポイント の改善を主張
- Terminal-Bench 2.1、コマンドライン作業の実務的な評価:Solが 新記録(state of the art) を主張
数字だけ見ると「お、すごいじゃん」ってなるけど、ここは慎重に。これらは OpenAI自身が示した数字 で、第三者が同じ条件で再現した独立検証はこれからなんだ。報道でも「完全な機械可読のベンチ詳細はまだ独立公開されていない」と指摘されてるよ(kingy.ai)。
だからわたしのスタンスは「伸びてそうだけど、数字は鵜呑みにせず第三者検証を待つ」。比較サイトとしては、メーカー公称のスコアで順位を断定するのはフェアじゃないと思うんだ。
ソース: GPT-5.6 システムカード / kingy.ai・ベンチまとめ
🔥 5. 当面は『信頼できるパートナー限定プレビュー』|広い提供は近日予定
最後は、わたしたちがいつ使えるの?っていう 提供の話。
GPT-5.6は、発表されたけど 今すぐ全員が使えるわけじゃない の。OpenAIは、サイバー能力が高いことなどを踏まえて、米政府の要請で、当面は連携済みの「信頼できるパートナー」限定のプレビュー から始めるとしてる(VentureBeat)。
具体的には、まずAPIとCodex経由で一部の信頼できるパートナーに、その後 ChatGPT・Codex・API向けの広い提供が近日中 に来る予定とされてるよ(kingy.ai)。
「最初は限定、あとで一般開放」っていう段階的な出し方は、ここ最近のフロンティアモデルでよく見る流れだね。能力が高いモデルほど、いきなり全開放せずに様子を見ながら広げる、っていう慎重さの表れ、とも読めるよ。
ソース: VentureBeat・限定プレビュー / MacRumors・6月26日
今日の注目トレンド
今日のテーマは「OpenAIが次世代GPT-5.6を3モデルで出し、安全評価で全モデルHigh判定の限定プレビューから始める」だったよ。
いちばん伝えたかったのは2つ。まず、今回は 用途と価格で選べる3モデル構成 だってこと。Sol=最強、Terra=コスパ、Luna=最安という住み分けで、わたしたちは「賢さ・コスト・速さ」のどれを優先するかで選びやすくなった、ってこと。
もうひとつが、全モデルHigh判定で限定プレビューから という出し方。これは「危険なAIが出た」って煽る話じゃなくて、「能力が高いぶん、安全対策を付けて段階的に出す」っていう慎重さの表れでもあるんだ。能力向上の裏返し、っていう両面で見るのがフェアだと思う。
そしてベンチ数値(HealthBench Sol 60.5など)は OpenAIの主張段階 で、第三者検証はこれから。数字で順位を断定せず、続報を待つスタンスでいきたいね。
「結局どれをどんな用途に使えばいいの?」を三軸で整理した記事と、「全モデルHighの限定プレビューって怖いの?」を中立に読みといた記事、2本用意したよ。どっちも確認できた事実だけで書いたから、よかったら読んでみて。今日もいい一日になりますように。
よくある質問
- OpenAIのGPT-5.6 Sol・Terra・Lunaって何が違うの?
- GPT-5.6は2026年6月26日にOpenAIがプレビュー発表した次世代モデルで、用途と価格で住み分ける3モデル構成です。Solはフラッグシップで、複雑な推論や長時間のコーディング、高度なエージェント、セキュリティ用途など最も手強いタスク向けです。Terraはバランス型で、前世代のGPT-5.5に匹敵する性能を約2倍安い価格で提供するとされ、普段使いの主力です。Lunaは最速・最安で、軽量・大量処理向けです。API料金は100万トークンあたりで、Sol=入力5ドル/出力30ドル、Terra=入力2.5ドル/出力15ドル、Luna=入力1ドル/出力6ドルとされています(一次: OpenAI公式、システムカード)。
- 3モデルとも『High』リスク判定って危険なの?
- High判定は、危険なAIが世に出たという意味ではなく、特定分野で高い能力を持ちうるため相応の安全対策を付けて出すという事前の注意ラベルに近いものです。GPT-5.6はOpenAIの準備フレームワークのもと、Sol・Terra・Lunaの3モデルとも「生物・化学」と「サイバーセキュリティ」でHigh、AI自己改善はHighに達していないBelow Highと判定されました。小型・高速モデルまでHighになったのは初めてとされます。サイバーについては、脆弱性や攻撃のパーツは見つけられるものの、堅牢な相手への自律的な端から端までの攻撃まではできなかったとシステムカードに記されています。OpenAIはより厳しい安全スタックを載せ、当面は限定プレビューから始めるとしています(出典: GPT-5.6システムカード、VentureBeat)。
- GPT-5.6はいつから普通に使えるの?ベンチ数値は信頼できる?
- 当面はすぐに全員が使えるわけではありません。サイバー能力が高いことなどを踏まえ、米政府の要請で、まずはAPIとCodex経由で連携済みの信頼できるパートナー限定のプレビューから始め、その後ChatGPT・Codex・API向けの広い提供が近日中に来る予定とされています。ベンチマークについては、HealthBench ProfessionalでSol 60.5(GPT-5.5の51.8から+8.7)、Terminal-Bench 2.1で新記録などが示されていますが、これらはOpenAIの主張で、第三者による独立検証はこれからです。完全な機械可読のベンチ詳細はまだ独立公開されていないと報じられているため、数字で順位を断定せず続報を待つのが妥当です(出典: VentureBeat、kingy.ai、システムカード)。