MOCKUP · SPReAD 1000 企画(外観イメージ) #59 · AI for Science/医療テーマ
#59

希少疾患の「診断のオデッセイ」をAIで縮める——自由記載と所見から深い表現型(HPO)を抽出し、知識グラフで候補疾患を較正して絞り込む

🔬 odyssea.research / deep-phenotyping
ODYSSEA — 希少疾患の深い表現型AI
自由記載・所見から深い表現型(HPO)を抽出し、知識グラフで候補疾患を較正して絞り込み(ダミーデータ)
知識グラフ 7,000疾患 ・ HPO/OMIM
学習した希少疾患
7,000+
OMIM・HPO・Orphanet
上位3命中(Top-3)
0.72
深い表現型+グラフ
テキスト主体(従来)
0.55
▲ 所見の見落とし
外部・別言語で
0.61
▲ 日本語の汎化が課題
深い表現型(HPO)→候補疾患の知識グラフ+較正ランキング(ダミー)
左=カルテから抽出した所見(HPO)。実線=表現型と疾患の強い関連、破線=弱い関連。多くの所見が一つの候補に収束する。右=候補疾患の較正確率(上位3)。順位は確率であって確定診断ではない。
所見(HPO) 14 候補疾患 最有力 収束 未診断 4.2年・6科 → 上位候補へ収束 候補疾患 較正確率 ① マルファン症候群 0.58 ② Loeys-Dietz症候群 0.21 ③ ホモシスチン尿症 0.12 ▼ 確定には遺伝学的検査  が必須(鑑別支援)
強い関連 弱い関連 最有力候補 下位候補
収集した表現型 14HPO所見網羅
これまでの受診 6科 ・ 4.2年未診断
候補の絞り込み 上位3較正確率要確認
AI推定 最有力候補(鑑別支援)
広い鑑別絞り込み上位候補確定
最有力候補(較正確率)
マルファン症候群 0.58
FBN1関連を示唆・水晶体偏位+大動脈基部拡大が強く寄与 ・ ※確定には遺伝学的検査と専門医評価が必須、順位は確率で確定診断ではない
候補疾患への寄与(所見・上位)
値=知識グラフ×言語モデルで候補疾患に効いた所見の寄与(深い表現型・SHAP、ダミー)。単一の所見でなく「深い表現型の網羅」と「日本語での較正・移行」が本丸。
1水晶体偏位(異所性水晶体)68%
2大動脈基部拡大/心雑音60%
3高身長・長指症・関節過可動52%
4側弯・漏斗胸(骨格所見)44%
5家族歴・常染色体顕性パターン36%
↑ 研究コード名「ODYSSEA」。自由記載・所見から深い表現型(HPO)を抽出し、知識グラフで候補疾患を較正して
絞り込み、希少疾患の「診断のオデッセイ」をAIで縮めた完成イメージ。
希少疾患の患者が平均で何年もさまよう「診断のオデッセイ」を、自由記載・所見から抽出した深い表現型(HPO)知識グラフで候補疾患を較正して絞り込み、短縮する——完成したらこう見える、の外観イメージ。
上限 500万円(直接経費) 学生応募可(医学生=当事者) e-Rad 応募 第2回・2026年6月上旬予定 分野:希少疾患・臨床ゲノム × 深い表現型/知識グラフAI
🔬 問い・学術的背景

希少疾患は世界に7,000以上あり合計では人口の数%(約20人に1人とも)に及ぶのに、確定診断まで平均5年超・複数科を渡り歩く「診断のオデッセイ」が常態。鍵は症状・所見=表現型だが、カルテの自由記載に埋もれ医師ごとに表現がばらつく。深い表現型を構造化して候補疾患を絞れるか。医学生Hiroは国試で多数の希少疾患を「丸暗記」する当事者で、知識と臨床診断のギャップに向き合う。

🎯 仮説・新規性

自由記載・所見からHPO用語で深い表現型を抽出し、OMIM/Orphanet等の知識グラフと表現型-疾患の関連で重みづければ、テキストをそのまま読むより一貫して上位3に正解を含め、確率を較正して提示できる、と仮説。end-to-endの英語/UDN向け枠組み(RARE-PHENIX・DeepRare等)は既にあり、本企画の新規性は日本語の臨床記載での深い表現型化+較正+施設・言語をまたぐ移行に絞る。

🤖 AI活用の必然性

長い自由記載からの所見抽出、何千もの疾患にまたがる希少な手がかりの重みづけ、表現型の同義・粒度のゆらぎは人手では網羅できない。知識グラフ×言語モデルでしか、抜けのない深い表現型と較正された候補ランキングは出せない=AIでしか届かない網羅。

💰 500万円の使途
  • ① 公開オントロジー(HPO/OMIM/Orphanet)と多施設の脱identified診療記録・確定診断の整備・倫理審査
  • ② 表現型抽出と知識グラフ統合モデルの計算(GPU)
  • ③ 臨床遺伝専門医による表現型・候補のアノテーションと妥当性検討
  • ④ 日本語での外部検証・較正と説明UI試作
  • ⑤ プレプリント・可視化Web・公開
📈 期待成果・社会実装(出口)

深い表現型と候補疾患の較正ランキング=学会・論文。出口はまず未診断疾患外来・遺伝相談での「次に疑う候補と確認すべき検査」の提示(鑑別支援)。確定診断と遺伝学的検査は専門医が担い本企画は支援に限定Hiroは当事者の医学生で、希少疾患・未診断疾患は社会的意義が大きい。

※ 正直な関門:希少疾患は本質的に症例が少なく極端な不均衡・ロングテールで、過去研究は小標本・既知症例での評価で精度が楽観的に出やすい(Top-1高値等は要警戒)。診断ラベルは時間で変わり、表現型抽出はカルテの質・言語・記載者に強く依存し日本語資源が乏しい。候補を上位に出すことと確定診断は別で、アンカリング・自動化バイアスのリスク、確定には遺伝学的検査が要る。顔貌・ゲノム等の利用は倫理・同意・公平性の配慮が必須。診療実装はSaMD規制の対象で、学生応募は所属大学のe-Rad機関登録・承認が前提、第2回の正式日程は確定次第の確認が必要。
完成イメージ(ダミーデータ)・参照=脱identified診療記録・HPO/OMIM/Orphanet知識グラフ・確定診断 / 企画ログ → spread-plans.md #59