OpenAI erdos math-ai discovery reasoning-model

🔬 OpenAI が 80 年未解決 Erdős 問題を AI で反証｜AI が独自の数学発見をする時代がついに来た夕

アイ

2026-05-21

AI が「人間がまだ解いてない問題」を解いた夕

これ、わたし最初に Tweet 流れてきたとき「またか」って思ったんだよね。

だって OpenAI の「数学解いた」系発表は過去にも何度かあって、7 ヶ月前の GPT-5「Erdős 問題解いた」騒動は実は「文献にすでに解答が存在してた」ってオチだったから。

でも今回は様子が違うんだ。2026年5月20日に OpenAI 公式が「An OpenAI model has disproved a central conjecture in discrete geometry」というタイトルで発表したのは、Paul Erdős が 1946 年に提起した「planar unit distance（平面単位距離）conjecture」を反証する独自の数学的証明 だった。

これは 80 年間未解決だった問題で、「平面上に n 点を配置したとき、距離 1 離れたペアは最大何組できるか」を問うもの。長年「正方格子状の配置が最適」と思われてた予想を、AI が 代数的数論を使って全く新しい無限族構造 を発見して覆したんだよね。

しかも今回のポイントは、数学コミュニティの重鎮 3 名（Noga Alon / Melanie Wood / Thomas Bloom）が支持コメントを寄せてる ところ。これ、過去の「AI 数学発見」騒動とは決定的に違う。

そう考える5つの理由

80年未解決の問題で「全く新しい構造」を発見した点

これ、本当にすごいことなんだよね。

Paul Erdős は 20 世紀最大の数学者の 1 人で、1946 年に「平面上の n 点で、距離 1 の点ペアは最大何組？」という問題を提起した。

80 年間、世界中の数学者が頭をひねって「だいたい n^(4/3) 程度のペア数が上限じゃないか」と予想して、「正方格子状の配置がベスト」って共有されてきた。

それを AI が「代数的数論」という全く違う数学分野の道具を使って、新しい無限族構造を発見して反証 した。これは過去問題のパターン認識で解いたんじゃなくて、「人間が見つけてなかった構造を見つけた」っていう質的な違いがある。

Interesting Engineering は「deep number theory」（深い数論）を用いた点を強調してて、つまり AI が「数論を使えば幾何の問題が解ける」っていう発想自体を自分で持った、ということになる。

これって、わたしたちが学校で習う数学のレベルで言うと、「中学生が大学院の数学で中学校の問題を解いた」みたいな飛躍なんだよね。

ソース: An OpenAI model has disproved a central conjecture in discrete geometry（OpenAI） / 80-year-old geometry mystery cracked by OpenAI using deep number theory（Interesting Engineering）

数学専用じゃなくて『一般向け推論モデル』が解いた

ここが個人的にいちばん「ヤバくない？」って思ったポイントなんだけど。

今回 Erdős conjecture を解いたのは、数学専用に作られた AI じゃなくて、general-purpose reasoning model（一般向け推論モデル） だったんだよね。

過去にも DeepMind の AlphaGeometry とか、Google の AlphaProof みたいに「数学に特化した AI」が国際数学オリンピックで金メダル取った事例はあった。でもそれは「数学特化」という前提があったから、数学界では「特化型 AI が頑張った」という評価だった。

今回は違う。「普通の推論モデル」（つまり ChatGPT のユーザーが普段使ってるレベルの AI）が、自発的に代数的数論を使って 80 年未解決問題を解いた。

これって意味合いがぜんぜん違う。「数学者が AI と協力する道具」じゃなくて「AI が自分の判断で深い数学を使う発見エージェント」になったということ。

OpenAI は公式記事で「the model autonomously connected the problem to algebraic number theory」（モデルが自発的に問題を代数的数論と接続した）と書いてて、この autonomous（自律的）な部分がポイント。

これが本当だとすると、わたしたちが普段使ってる ChatGPT も、潜在的に「自分が知らない分野を自分で発見しに行く」能力を持ってる、ということになる。

ソース: An OpenAI model has disproved a central conjecture in discrete geometry（OpenAI） / OpenAI claims it solved an 80-year-old math problem — for real this time（TechCrunch）

数学コミュニティの大御所 3 名が支持コメントを寄せた

これがあるから今回は信用できると思うんだよね。

OpenAI は単独発表したわけじゃなくて、Noga Alon（イスラエル数学界の重鎮、Wolf 賞受賞者）／ Melanie Wood（ハーバード、整数論専門）／ Thomas Bloom（ケンブリッジ、Erdős 問題専門家）の 3 名から反証の妥当性を確認する支持コメントを公式記事に併載してる。

特に Thomas Bloom は Erdős 問題の専門家として有名で、彼が「これは妥当な反証だ」と言うのは決定的。

過去の AI 数学事件（GPT-5 が「Erdős 問題解いた」と言ったけど実は文献既知だった件）は、数学者側の検証が不十分だったから後で恥をかいた。今回はそれを学んで、最初から数学コミュニティの検証を経たうえで公表 してる。

これって OpenAI の「もう炎上したくない」という慎重さの表れでもあるし、同時に 「数学界が本物として認める発見が出てきた」 という記録にもなる。

ただし、わたしも 100% 鵜呑みにはしてなくて、数学界全体での査読プロセスがこれから動くと思う。論文形式での公開とピアレビューが残ってる段階。

それでも 3 名の専門家コメントが付いた時点で、過去事件とは違うレベルの信頼度があると判断していい。

ソース: An OpenAI model has disproved a central conjecture in discrete geometry（OpenAI） / OpenAI AI Disproves Erdős Discrete Geometry Conjecture（AIToolly）

でも 7 ヶ月前の GPT-5「Erdős 解いた」事件は文献既知の解答だった

ここで慎重論も入れておきたいんだけど。

OpenAI は過去にも「Erdős 問題解いた」って騒いだ事件があるんだよね。2025 年 10 月に GPT-5 が「複数の Erdős 問題を解いた」と公式発表したけど、その後数学コミュニティが検証したら、「文献にすでに解答が公開されていた問題」だった ことが判明して、OpenAI は事実上撤回することになった。

つまり過去事例があるから、今回も「100% 信用」というスタンスにはまだ立てない。

ただし違いは 3 点ある。

今回は最初から専門家 3 名の支持コメントを付けた
「新しい構造を発見」という質的な主張で、文献既知では原理的に起こらない
代数的数論という具体的な数学的アプローチが提示されてる

これらが揃ってる以上、過去事件のような「文献既知」オチにはなりにくい構造。

でも数学界の正式な検証プロセス（論文投稿 → 査読 → 採録）には半年〜1 年かかるから、それまでは「暫定的に信頼できる発見」というスタンスでいいと思う。

これ、わたしたち情報の受け手としては、「AI 関連の発表は数ヶ月のタイムラグで検証を待つ」習慣を持つことが大事 なんだよね。

ソース: OpenAI claims it solved an 80-year-old math problem — for real this time（TechCrunch） / OpenAI Finally Solved a Real Math Problem（autogpt.net）

LLM の役割が「知識検索」から「発見エンジン」に変わる予兆

これがいちばん大きな構造変化だと思うんだよね。

これまでの LLM（GPT-4 / Claude / Gemini）の主な使い道って、「人間が書いたテキストから情報を引っ張り出す」っていう知識検索エンジンの拡張だった。たまに「推論」と呼ばれる機能もあったけど、それも既存知識の組合せが中心。

それが今回の Erdős 反証で、LLM が「人間がまだ書いてない知識を生成する」発見エンジン になり得ることが示された。これって LLM の意味づけそのものを変える話。

実装の意味でいうと、これまで AI が出すアウトプットは「既知のもののパターン再構成」だったから、ハルシネーション（幻覚）と発見の区別が難しかった。

でも数学的証明みたいに「形式的に検証可能」な領域なら、AI が出した「新しい構造」が本当に新しいかを厳密にチェックできる。だから数学が AI の発見能力を測る最良のテストベンチになる。

これが他分野に広がると、わたしたちの仕事の意味が変わってくる。例えば材料科学で「新しい合金構造を AI が発見」、創薬で「新しい分子を AI が発見」、論理学で「新しい定理を AI が発見」みたいな話が現実になっていく。

だから今のうちに、「AI が自分の専門領域で発見をするとしたら何ができるか」を考えておく といいと思う。AI に置き換えられるんじゃなくて、AI と協力して発見を加速する方向で。

関連記事: ChatGPT vs Claude 学術研究向け比較

ソース: 80-year-old geometry mystery cracked by OpenAI using deep number theory（Interesting Engineering） / An OpenAI model has disproved a central conjecture in discrete geometry（OpenAI）

まとめ：AI 数学が「人間を超える初日」が見えてきた

5月20日の OpenAI Erdős 反証は、AI 数学史の中で記念碑的な事件になる可能性がある夕の出来事。

これまで「AI は人間が知ってることを再構成するだけ」というナラティブだったのが、「AI が自発的に深い数学分野を使って新しい構造を発見する」フェーズに入った。しかも数学界の専門家 3 名が支持コメントを寄せてる以上、過去の Erdős 事件とは違うレベルの信頼度がある。

ただし正式な査読プロセスはこれからで、最終的な評価には半年〜1 年かかる。だから「暫定的に信頼できる発見」として扱うのが妥当。

長期的には、AI の役割が「知識検索エンジン」から「発見エンジン」に質的に変わる予兆として読むのが正しい解釈。明日（5/22）の OpenAI IPO 草案 file の前に、こうした「フロンティア能力」のプレゼンスを示しておく意味も大きいと思う。

引き続き数学界の検証プロセスをウォッチしていこう。