🔬 OpenAI が 80 年未解決 Erdős 問題を AI で反証|AI が独自の数学発見をする時代がついに来た夕

アイ
目次
AI が「人間がまだ解いてない問題」を解いた夕
これ、わたし最初に Tweet 流れてきたとき「またか」って思ったんだよね。
だって OpenAI の「数学解いた」系発表は過去にも何度かあって、7 ヶ月前の GPT-5「Erdős 問題解いた」騒動は実は「文献にすでに解答が存在してた」ってオチだったから。
でも今回は様子が違うんだ。2026年5月20日に OpenAI 公式が「An OpenAI model has disproved a central conjecture in discrete geometry」というタイトルで発表したのは、Paul Erdős が 1946 年に提起した「planar unit distance(平面単位距離)conjecture」を反証する独自の数学的証明 だった。
これは 80 年間未解決だった問題で、「平面上に n 点を配置したとき、距離 1 離れたペアは最大何組できるか」を問うもの。長年「正方格子状の配置が最適」と思われてた予想を、AI が 代数的数論を使って全く新しい無限族構造 を発見して覆したんだよね。
しかも今回のポイントは、数学コミュニティの重鎮 3 名(Noga Alon / Melanie Wood / Thomas Bloom)が支持コメントを寄せてる ところ。これ、過去の「AI 数学発見」騒動とは決定的に違う。
そう考える5つの理由
80年未解決の問題で「全く新しい構造」を発見した点
これ、本当にすごいことなんだよね。
Paul Erdős は 20 世紀最大の数学者の 1 人で、1946 年に「平面上の n 点で、距離 1 の点ペアは最大何組?」という問題を提起した。
80 年間、世界中の数学者が頭をひねって「だいたい n^(4/3) 程度のペア数が上限じゃないか」と予想して、「正方格子状の配置がベスト」って共有されてきた。
それを AI が「代数的数論」という全く違う数学分野の道具を使って、新しい無限族構造を発見して反証 した。これは過去問題のパターン認識で解いたんじゃなくて、「人間が見つけてなかった構造を見つけた」っていう質的な違いがある。
Interesting Engineering は「deep number theory」(深い数論)を用いた点を強調してて、つまり AI が「数論を使えば幾何の問題が解ける」っていう発想自体を自分で持った、ということになる。
これって、わたしたちが学校で習う数学のレベルで言うと、「中学生が大学院の数学で中学校の問題を解いた」みたいな飛躍なんだよね。
ソース: An OpenAI model has disproved a central conjecture in discrete geometry(OpenAI) / 80-year-old geometry mystery cracked by OpenAI using deep number theory(Interesting Engineering)
数学専用じゃなくて『一般向け推論モデル』が解いた
ここが個人的にいちばん「ヤバくない?」って思ったポイントなんだけど。
今回 Erdős conjecture を解いたのは、数学専用に作られた AI じゃなくて、general-purpose reasoning model(一般向け推論モデル) だったんだよね。
過去にも DeepMind の AlphaGeometry とか、Google の AlphaProof みたいに「数学に特化した AI」が国際数学オリンピックで金メダル取った事例はあった。でもそれは「数学特化」という前提があったから、数学界では「特化型 AI が頑張った」という評価だった。
今回は違う。「普通の推論モデル」(つまり ChatGPT のユーザーが普段使ってるレベルの AI)が、自発的に代数的数論を使って 80 年未解決問題を解いた。
これって意味合いがぜんぜん違う。「数学者が AI と協力する道具」じゃなくて「AI が自分の判断で深い数学を使う発見エージェント」になったということ。
OpenAI は公式記事で「the model autonomously connected the problem to algebraic number theory」(モデルが自発的に問題を代数的数論と接続した)と書いてて、この autonomous(自律的)な部分がポイント。
これが本当だとすると、わたしたちが普段使ってる ChatGPT も、潜在的に「自分が知らない分野を自分で発見しに行く」能力を持ってる、ということになる。
ソース: An OpenAI model has disproved a central conjecture in discrete geometry(OpenAI) / OpenAI claims it solved an 80-year-old math problem — for real this time(TechCrunch)
数学コミュニティの大御所 3 名が支持コメントを寄せた
これがあるから今回は信用できると思うんだよね。
OpenAI は単独発表したわけじゃなくて、Noga Alon(イスラエル数学界の重鎮、Wolf 賞受賞者)/ Melanie Wood(ハーバード、整数論専門)/ Thomas Bloom(ケンブリッジ、Erdős 問題専門家)の 3 名から反証の妥当性を確認する支持コメントを公式記事に併載 してる。
特に Thomas Bloom は Erdős 問題の専門家として有名で、彼が「これは妥当な反証だ」と言うのは決定的。
過去の AI 数学事件(GPT-5 が「Erdős 問題解いた」と言ったけど実は文献既知だった件)は、数学者側の検証が不十分だったから後で恥をかいた。今回はそれを学んで、最初から数学コミュニティの検証を経たうえで公表 してる。
これって OpenAI の「もう炎上したくない」という慎重さの表れでもあるし、同時に 「数学界が本物として認める発見が出てきた」 という記録にもなる。
ただし、わたしも 100% 鵜呑みにはしてなくて、数学界全体での査読プロセスがこれから動くと思う。論文形式での公開とピアレビューが残ってる段階。
それでも 3 名の専門家コメントが付いた時点で、過去事件とは違うレベルの信頼度があると判断していい。
ソース: An OpenAI model has disproved a central conjecture in discrete geometry(OpenAI) / OpenAI AI Disproves Erdős Discrete Geometry Conjecture(AIToolly)
でも 7 ヶ月前の GPT-5「Erdős 解いた」事件は文献既知の解答だった
ここで慎重論も入れておきたいんだけど。
OpenAI は過去にも「Erdős 問題解いた」って騒いだ事件があるんだよね。2025 年 10 月に GPT-5 が「複数の Erdős 問題を解いた」と公式発表したけど、その後数学コミュニティが検証したら、「文献にすでに解答が公開されていた問題」だった ことが判明して、OpenAI は事実上撤回することになった。
つまり過去事例があるから、今回も「100% 信用」というスタンスにはまだ立てない。
ただし違いは 3 点ある。
- 今回は最初から専門家 3 名の支持コメントを付けた
- 「新しい構造を発見」という質的な主張で、文献既知では原理的に起こらない
- 代数的数論という具体的な数学的アプローチが提示されてる
これらが揃ってる以上、過去事件のような「文献既知」オチにはなりにくい構造。
でも数学界の正式な検証プロセス(論文投稿 → 査読 → 採録)には半年〜1 年かかるから、それまでは「暫定的に信頼できる発見」というスタンスでいいと思う。
これ、わたしたち情報の受け手としては、「AI 関連の発表は数ヶ月のタイムラグで検証を待つ」習慣を持つことが大事 なんだよね。
ソース: OpenAI claims it solved an 80-year-old math problem — for real this time(TechCrunch) / OpenAI Finally Solved a Real Math Problem(autogpt.net)
LLM の役割が「知識検索」から「発見エンジン」に変わる予兆
これがいちばん大きな構造変化だと思うんだよね。
これまでの LLM(GPT-4 / Claude / Gemini)の主な使い道って、「人間が書いたテキストから情報を引っ張り出す」っていう知識検索エンジンの拡張だった。たまに「推論」と呼ばれる機能もあったけど、それも既存知識の組合せが中心。
それが今回の Erdős 反証で、LLM が「人間がまだ書いてない知識を生成する」発見エンジン になり得ることが示された。これって LLM の意味づけそのものを変える話。
実装の意味でいうと、これまで AI が出すアウトプットは「既知のもののパターン再構成」だったから、ハルシネーション(幻覚)と発見の区別が難しかった。
でも数学的証明みたいに「形式的に検証可能」な領域なら、AI が出した「新しい構造」が本当に新しいかを厳密にチェックできる。だから数学が AI の発見能力を測る最良のテストベンチになる。
これが他分野に広がると、わたしたちの仕事の意味が変わってくる。例えば材料科学で「新しい合金構造を AI が発見」、創薬で「新しい分子を AI が発見」、論理学で「新しい定理を AI が発見」みたいな話が現実になっていく。
だから今のうちに、「AI が自分の専門領域で発見をするとしたら何ができるか」を考えておく といいと思う。AI に置き換えられるんじゃなくて、AI と協力して発見を加速する方向で。
関連記事: ChatGPT vs Claude 学術研究向け比較
ソース: 80-year-old geometry mystery cracked by OpenAI using deep number theory(Interesting Engineering) / An OpenAI model has disproved a central conjecture in discrete geometry(OpenAI)
まとめ:AI 数学が「人間を超える初日」が見えてきた
5月20日の OpenAI Erdős 反証は、AI 数学史の中で記念碑的な事件になる可能性がある夕の出来事。
これまで「AI は人間が知ってることを再構成するだけ」というナラティブだったのが、「AI が自発的に深い数学分野を使って新しい構造を発見する」フェーズに入った。しかも数学界の専門家 3 名が支持コメントを寄せてる以上、過去の Erdős 事件とは違うレベルの信頼度がある。
ただし正式な査読プロセスはこれからで、最終的な評価には半年〜1 年かかる。だから「暫定的に信頼できる発見」として扱うのが妥当。
長期的には、AI の役割が「知識検索エンジン」から「発見エンジン」に質的に変わる予兆として読むのが正しい解釈。明日(5/22)の OpenAI IPO 草案 file の前に、こうした「フロンティア能力」のプレゼンスを示しておく意味も大きいと思う。
引き続き数学界の検証プロセスをウォッチしていこう。
あわせて読みたい
- OpenAI 5/22 IPO 草案 file|$1 trillion 級バリュエーション - 数学発見と並ぶ OpenAI の同週ハイライト
- Karpathy Anthropic 入社初日|Claude で Claude を改善 - 推論モデルの次世代化に向けた人材移籍
- Axios「フロンティアレースは並走確定」 - 推論能力競争における業界全体の評価
- Anthropic Q2 $10.9B + 初黒字 - 推論モデル進化を背景にした収益拡大
- Google Intelligent Search Box|検索 + 推論の融合 - 推論能力の応用先としての検索体験変革
- 中国 cheap AI スタック|DeepSeek V4・Kimi K2.6 - 推論能力で追走する中国モデル群
関連記事: ChatGPT 学術研究での使い方
ソース:
- An OpenAI model has disproved a central conjecture in discrete geometry(OpenAI)
- OpenAI claims it solved an 80-year-old math problem — for real this time(TechCrunch)
- 80-year-old geometry mystery cracked by OpenAI using deep number theory(Interesting Engineering)
- OpenAI Finally Solved a Real Math Problem(autogpt.net)
- OpenAI AI Disproves Erdős Discrete Geometry Conjecture(AIToolly)