fda 510k ai-medical-device healthcare-ai sepsis

🏥 病院のAIが「審査ほぼなし」で動いてる件｜FDA 510(k)の闇をSTAT Newsが暴いた

アイ

2026-05-15

病院のAIが「審査ほぼなし」って結構ヤバくない？

これマジで気が重くなるニュースだった。

STAT News が2026年5月13日に公開した調査報道 で、FDA の 510(k) 経路（既存類似品との実質的同等性で承認）で承認された AI 医療機器 の多くが、臨床エビデンス不十分 であると報じられた。

タイトルは 「AI Prognosis: Medical devices' dirty FDA secret（AI 予後予測：医療機器が抱える FDA の汚い秘密）」。

具体的に問題視されてるもの:

敗血症 AI スコア（Sepsis Watch 等）
放射線画像読み取り AI（CT／MRI／X-ray）
眼底検査 AI（糖尿病性網膜症スクリーニング）

これら全部、「Epic（電子カルテ大手）が組み込んで、米国の数千病院で運用されてる」 主力 AI 医療機器。

それが 「実質的同等性のみで承認、臨床エビデンス不十分、モデル更新後の再評価義務なし」 という条件下で動いてる。

患者として考えると、「えっ、わたしの病気を診断する AI ってちゃんとテストされてないの？」 ってなるよね。

これ、医療 AI 普及の 裏側の闇 が表面化した瞬間で、これからの規制議論を変える可能性がある。

そう感じる4つの理由

510(k) は1976年に作られた制度、AI 想定してない

まず FDA 510(k) 経路 とは何かを整理。

FDA は医療機器を承認する経路として 3段階 を持ってる:

Class I: 低リスク（聴診器、絆創膏等）→ 届出のみ
Class II: 中リスク（X 線装置等）→ 510(k)（実質的同等性）審査
Class III: 高リスク（ペースメーカー等）→ PMA（事前承認）厳格審査

このうち AI 医療機器のほとんどが Class II の 510(k) 経路 で承認されてる。

510(k) の基準は「既存の類似品と実質的に同等」。つまり 「既に承認されている類似品があるなら、新製品もそれと同じ条件で OK」。

問題は、この制度が1976年に作られた こと。当時は 「機械的な医療機器（X 線装置のバージョンアップ等）」を想定 してて、AI モデルみたいに動的に更新される製品は想定外。

具体例:

敗血症 AI スコア v1.0 が承認される
v1.1 で モデルアーキテクチャを変更（GBDT → Transformer）
510(k) では「v1.0 と実質的に同等」と申請 すれば OK
臨床試験なしで通る

これは AI モデルの 「学習データ変更」、「アーキテクチャ変更」、「ハイパーパラメータ変更」 で 挙動が大きく変わる 現実と合ってない。

しかも 2024-2025年の AI/ML 対応 510(k) クリアランス累計1000件超 という統計があって、医療 AI の主流は完全に 510(k) 経路 になってる。

PMA（事前承認）経路は審査に 3-5年かかる ので AI 企業は避けたがる。結果、規制ハードルが低い 510(k) に集中 する構造ができあがってる。

敗血症 AI スコアの精度が「実は微妙」って報告がある

具体的に問題視されてる 敗血症 AI スコア について深掘り。

Epic Sepsis Model（敗血症予測 AI）は米国の 数百病院、年間1000万件以上の患者 をスクリーニングしてる主力モデル。

でも 2021年 JAMA Internal Medicine 論文 で 「Epic Sepsis Model の予測精度は AUROC 0.63」 という結果が出てる（公平な検証では）。

AUROC 0.63 ってどのくらいかというと、「ランダム（0.5）よりはマシ、でも臨床判断に使うには低すぎる」 レベル。

しかも別の研究で 「AI スコアが警告を出した患者の3分の2が実は敗血症ではなかった」、「敗血症患者の3分の2を AI は警告しなかった」 という結果も。

これって 臨床医からすると「AI 警告を見ても無視せざるをえない」 レベルの精度。

でも FDA 510(k) では 「過去の類似 AI（精度同等）と実質的同等」 で通ってる。精度の絶対水準 は審査されない構造。

しかも Epic がモデルを定期的に更新 してて、更新後の精度の変化 は 公開データすらない。病院は 「Epic が更新したらそのまま使うしかない」 状態。

これ、患者の生命に直結する AI がこの透明性で動いてるって、結構問題だと思うんだよね。

実際 2025年に Stanford Medicine が Epic Sepsis Model を院内検証 した結果、「採用を見合わせる」 判断を出したことがある。ちゃんと検証する病院は使わない、検証しない病院は使い続ける という二極化。

モデル更新後の再評価義務がないって法的に欠陥

ここが一番の構造的欠陥。

FDA 510(k) では、承認後のモデル更新に対する再評価義務がない。

これは伝統的な医療機器なら 「設計変更時に再申請」 で済んだ。でも AI モデルは 連続的に更新される のが本質。

具体的に何が起きてるかというと:

承認時のモデル: 学習データ A、アーキテクチャ B、精度 AUROC 0.75
6ヶ月後の更新: 学習データ A+C、アーキテクチャ B'、精度 AUROC 0.62（下がってる）
FDA は知らない、病院も知らない

これは 「post-market surveillance（市販後監視）」 という概念で、FDA は2026年4月に AI ガイダンス強化 を表明したけど、既承認デバイスへの遡及審査は未確定。

しかも AI モデルは 「データドリフト（運用環境のデータが学習データと異なる）」 で精度が下がる現象が普通にある。

具体例: コロナ禍前に学習した呼吸器疾患 AI が、コロナ禍後の患者データ では精度が下がる、というケース。これは AI 業界では既知の問題なんだけど、FDA 510(k) で承認された AI 医療機器 には データドリフト監視義務がない。

これは 「自動運転車に MOT（車検）がないのと同じ」 くらい異常な状態。

EU の AI Act では 「High-risk AI（医療含む）への post-market monitoring 義務」 が定められてて、これは2026年8月から段階的施行。EU の方が AI 医療規制で米国より先行 という珍しい構図になってる。

米国が 「規制が遅い＝AI イノベーション促進」 という主張を続けてる間に、EU が AI 医療機器の信頼性で先行 する可能性がある。

これは中長期で 米国製 AI 医療機器が EU 市場で売れない という事態になりうる。

日本の薬事法でも実は似た問題がある

日本の PMDA（医薬品医療機器総合機構） は FDA より厳しめ だけど、AI 医療機器に対する制度はまだ不完全。

具体例:

AI 医療機器プログラム（SaMD） は2014年に 「医療機器プログラム」 として規制対象化
でも AI 特有のリスク（モデル更新、データドリフト） への規制はまだ整備中
「医療機器プログラム承認後の変更管理」 ガイドラインが2023年に出たが、運用は AI 企業任せ の部分が多い

日本でも Olympus（オリンパス）／FUJIFILM／キヤノンメディカル／HOYA が AI 医療機器を販売してて、消化器内視鏡 AI／放射線画像 AI が病院で稼働してる。

これらも モデル更新後の挙動変化 を 病院サイドが確認できる仕組みがない。

実際 「導入したAI 内視鏡支援システムが、更新後に病変見落とし率が上がった」 という症例報告が 2025年の日本消化器内視鏡学会 で出てたりする。

しかも日本は 保険診療 の構造上、AI 医療機器の利用が診療報酬に組み込まれる と 病院が AI を外せない 状況になる。精度が下がっても使い続ける インセンティブが働く構造。

これ、患者として知っておいた方がいい:

自分の病気で AI 診断が使われたか をカルテに記録するよう医師に依頼
AI の判断と人間の医師の判断が一致してるか 確認
AI スコアだけで治療方針が決まる ことには疑問を呈する

くらいの自衛は必要だと思う。

まとめ：AI 医療機器との付き合い方を改める時

正直、AI 医療機器って 「医師の負担減らす良いもの」 と漠然と思ってた。

でも STAT News のスクープで 「FDA 510(k) の構造的欠陥」 が見えてきて、ちょっと 手放しに信頼できない ことがわかった。

これからの数年、AI 医療規制は 以下の方向に進む と予想:

短期（2026-2027）:

STAT 報道を受けた FDA の追加ガイダンス（既承認 AI の遡及審査）
EU AI Act の post-market monitoring 義務発効（2026年8月〜）
学術界からの精度検証論文の増加

中期（2027-2030）:

AI 医療機器の class 区分見直し（Class III に格上げ議論）
病院側の AI 評価責任の明確化
保険会社が AI 精度を価格に反映

長期（2030〜）:

AI 医療診断の標準化された継続審査制度
患者の AI 診断履歴へのアクセス権
AI 誤診時の責任分配ルール

わたしたち患者としては:

健康診断や精密検査で AI 診断が使われた場合、医師に「使ったAIは何？」と聞いてみる
AI 警告だけで治療方針が決まらないように、セカンドオピニオンの選択肢を持つ
電子カルテに「AI 判断」「人間判断」を分けて記録するよう推進

ぶっちゃけ AI 医療機器を全否定するつもりはない。良い使い方 をすれば医師の負担軽減・診断精度向上にめちゃくちゃ役立つ。

でも 盲信は危険、というのが今回の教訓。AI と医療の関係を冷静に見極める ことが、患者として、社会として必要な時期に来てる。

関連記事: AI診断ツール比較 / 医療AI規制まとめ

ソース: