karpathy Anthropic pre-training recursive-self-improvement AI安全性

👤 Karpathy 5/19 初出社、Nick Joseph 配下入り｜『Claude を使って Claude を改善』再帰的自己改善の入口

アイ

2026-05-21

『AI が AI を改善する』が事実上始まった夕

これ、ニュースの表面だけ見ると「有名 AI 研究者がライバル企業に移籍した」だけの話に見えるんだよね。

でも詳細を掘っていくと、めっちゃ大事な構造的意味がある夕の出来事なんだ。

2026年5月19日（火）から、Andrej Karpathy が Anthropic で正式勤務開始。朝の記事では「移籍発表」の話だったけど、夕の時点で 「Nick Joseph 配下で、Claude を使って pre-training 研究自体を加速させる新チームを率いる」 という詳細が確定した。

この「Claude を使って pre-training 研究を加速」というミッションの意味が、技術的にめちゃくちゃ大きいんだよね。AI 安全性議論で長年話題だった「recursive self-improvement（再帰的自己改善）」の閾値に Anthropic が事実上踏み込んだ ということ。

Axios が同日に出した「Two hours that changed AI」という記事で、5/19-5/20 の 2 時間に Erdős 反証 + Karpathy 正式勤務 + SpaceX-Anthropic $1.25B/月 deal が集中したと分析してて、これらは全部つながってる。

そう考える5つの理由

5/19 初出社の正式情報が確定した

朝の段階では「移籍を発表」レベルだったのが、夕の時点で 「5月19日（火）から正式勤務開始」 という具体的な事実が、Anthropic 公式から TechCrunch / Axios / The New Stack / CNBC / Let's Data Science に確認された形で出てきた。

これ、地味だけど大事なポイントなんだよね。AI 業界では「○○氏が移籍を発表」と「○○氏が正式に勤務開始」の間で、実際には数週間〜数ヶ月の準備期間がある場合もある。

今回は 発表から正式勤務開始までほぼ即時 で、これは Karpathy 側にも Anthropic 側にも「すぐに動かしたい」明確な意思があった証拠。

The New Stack は「Anthropic hires OpenAI co-founder Andrej Karpathy to lead Claude pre-training research」（Anthropic が OpenAI 創業者 Karpathy を Claude pre-training 研究のリードに採用）と表現。「lead」という単語が決定的で、メンバーじゃなくてチームリーダー として配属されたことを意味する。

つまりこれ、形だけの「肩書きあげる移籍」じゃなくて、「実権を持って研究方向を決められる立場」での移籍 なんだよね。

ソース: OpenAI co-founder Andrej Karpathy joins Anthropic's pre-training team（TechCrunch） / Anthropic hires OpenAI co-founder Andrej Karpathy to lead Claude pre-training research（The New Stack）

Nick Joseph 配下＝ pre-training の中核ポジション

配属先の Nick Joseph は Anthropic の Head of Pretraining で、Claude モデルのコア能力を作る最重要ポジション を担当してる人。

Pre-training（事前学習）は、AI モデルが「世界の知識と推論能力」を獲得する大規模学習プロセス。Claude が GPT や Gemini と並ぶ性能を持つ理由の根源がここにある。

Anthropic はこれまで Constitutional AI や RLHF（Human Feedback による強化学習） で差別化してきたけど、それらは pre-training 後の後処理（post-training）の話。

pre-training は Anthropic の競争優位の源泉、Claude の「知能の核」を作る部門。そこに Karpathy が入るというのは、Anthropic の中核研究に Karpathy のキャリア全部を投入する形。

Karpathy のキャリアを見ると、彼が得意な領域がぴったり当てはまるんだよね。

OpenAI 創業期（2015-2017）: 深層学習と CV 専門
Tesla（2017-2022）: Autopilot / FSD の AI 責任者として大規模ニューラルネット運用
OpenAI 復帰（2022-2024）: GPT-4 関連プロジェクト
Eureka Labs（2024-）: AI 教育スタートアップ

「大規模 NN を作って動かす」経験が業界で最深部にある人材 が、Anthropic の pre-training チームリーダーになる、というのは Claude の能力向上にダイレクトに効くはず。

ソース: Anthropic hires OpenAI co-founder Andrej Karpathy to lead Claude pre-training research（The New Stack） / Andrej Karpathy Joins Anthropic Pretraining Team May 19, 2026（Let's Data Science）

『Claude を使って Claude を改善』の再帰性

ここが夕の記事でいちばん重要なポイントなんだけど。

Karpathy の新チームのミッションが、「Claude を使って pre-training 研究自体を加速させる」。

これ、よく読むと 「AI が AI を改善する」 っていう超危険ゾーンに足を踏み入れてるんだよね。

具体的に何が起きるかというと、こんな感じ。

人間研究者が「Claude を改善したい」と考える
Claude（既存版）に「次世代 pre-training をどう設計すべきか」を相談する
Claude が研究アイデア・データ準備・アーキテクチャ提案を出す
それを使って次世代 Claude を pre-training する
完成した次世代 Claude に再び「次々世代をどう改善するか」を相談する
以下ループ

この 「Claude → 次世代 Claude → 次々世代 Claude」のループ が、AI 安全性議論でいう 「recursive self-improvement（再帰的自己改善）」 にあたる。

長年「AGI に達したらこれが起きる」とされてきた閾値に、Anthropic が事実上踏み込んだ形。

ただし注意点があって、これはあくまで 「研究プロセスの自動化」レベル で、Claude 自身がコードを書き換えて自分を再起動するレベルじゃない。人間研究者が監督するループの中での自動化。

それでも 「Claude が次世代 Claude の設計に意見する」 こと自体が、ループの開始点としては相当深いところに来てる。

Anthropic は AI 安全性を社是にしてる企業だから、このループに踏み込むのは慎重な判断のはず。Karpathy のような「研究方向を判断できる重鎮」がリーダーに必要だったのは、安全性と能力向上のバランスを取るためだと思う。

ソース: Anthropic hires OpenAI co-founder Andrej Karpathy（The New Stack） / Anthropic hires OpenAI co-founder Andrej Karpathy, former Tesla AI leader（CNBC）

OpenAI 創業期重鎮の Anthropic 移籍の象徴的意味

これ、業界の権力構造の話としても大きいんだよね。

Karpathy は OpenAI 創業メンバー 11 人のうちの 1 人。Sam Altman、Ilya Sutskever、Greg Brockman と並ぶ「OpenAI の創業期の顔」の 1 人だった。

その彼が 「自分の古巣 OpenAI のライバル Anthropic」に移籍した という象徴性は大きい。

これまでも OpenAI から Anthropic への人材流出はあった（Dario Amodei 兄妹が代表的）。でも Karpathy のレベル（業界全体での知名度・影響力）で動いたのは、業界の重心がシフトした証拠。

Startup Fortune は「Andrej Karpathy joins Anthropic as the AI race tightens」（AI レースが拮抗する中で Karpathy が Anthropic に Join）と表現。「tightens」（拮抗する）という言葉が、Axios の「neck-and-neck」と一致してる。

つまり業界全体が 「3 社並走時代」 に入ったから、トップ研究者の選択肢が「OpenAI 一強」じゃなくなって、研究の自由度や使命感で Anthropic を選べる、という構造。

これは Anthropic 側の戦略的勝利でもあるし、OpenAI にとっては警告でもある。「優秀な人材を引き留めるためには、OpenAI のミッション・組織・報酬を再点検する必要がある」 というシグナル。

来週 OpenAI が IPO 草案を file（5/22）するけど、その直前にこの移籍が確定したタイミングって、投資家への「OpenAI の弱点露呈」シグナルにもなる。

ソース: Andrej Karpathy joins Anthropic as the AI race tightens（Startup Fortune） / OpenAI co-founder Andrej Karpathy joins Anthropic（Axios）

AI 安全性議論との接続

最後に AI 安全性の文脈を整理しておきたい。

「Recursive self-improvement」は AI 安全性研究の世界では 「intelligence explosion（知能爆発）」 の引き金として長年警戒されてきた概念。

シナリオはこう。

AI が AI を改善できるようになる
改善後の AI がさらに改善できるようになる
改善速度が指数関数的に加速する
人間の理解を超える AI が短期間で誕生する

この最後のステップが「intelligence explosion」で、AI 安全性研究者の Nick Bostrom や Eliezer Yudkowsky が長年警告してきた。

ただし、今回の Karpathy 新チームは 「研究プロセス自動化」レベル で、上記シナリオの 1 番目に「ちょっと足を踏み入れた」段階。

正直、わたしも完全に「intelligence explosion が始まった」とは思ってない。なぜなら現状の Claude は「自分のコードを書き換える」能力はないし、人間研究者が監督する形でしか動かないから。

でも 「研究プロセス自動化が成功すると、次は何を自動化するか」が問題 になる。データ準備の自動化 → 評価の自動化 → アーキテクチャ探索の自動化 → ハイパーパラメータ最適化の自動化 → … と、ループが深まれば深まるほど、人間監督の比重が下がっていく。

Anthropic が Karpathy という「研究方向を判断できる重鎮」を入れた理由は、まさにこの「人間監督をどこまで保つか」の判断を担うため、というのが妥当な解釈。

わたしたちは外野からこのループの進行を見守るしかないけど、「AI 安全性議論の言葉と実装の話を結びつけて理解する」 リテラシーを持っておくのは大事。

ソース: Anthropic hires OpenAI co-founder Andrej Karpathy（The New Stack） / OpenAI co-founder Andrej Karpathy joins Anthropic's pre-training team（TechCrunch）

まとめ：人材が業界の方向性を決める時代に入った

5月19日の Karpathy 正式勤務開始は、ニュース表面以上に深い意味を持つ夕の出来事。

「Claude を使って Claude を改善」というミッションは、AI 安全性議論で長年警戒されてきた recursive self-improvement の閾値に Anthropic が踏み込んだことを意味する。完全な intelligence explosion ではないけど、人間監督の比重が今後どう推移するかが業界の焦点になる。

OpenAI 創業期重鎮の Anthropic 移籍は、業界の権力構造が「OpenAI 一強」から「3 社並走」にシフトした象徴。明日（5/22）の OpenAI IPO 草案 file の前夜に、こうした「人材面の弱点露呈」が確定したのは、投資家への警告シグナルでもある。

これからも AI 業界の人材移動は、製品リリース以上に業界の方向性を決める要因になっていく。引き続き「誰がどこに移ったか」を業界全体の構造変化の観点で読み解いていきたい。