希少疾患は世界に7,000以上あり合計では人口の数%(約20人に1人とも)に及ぶのに、確定診断まで平均5年超・複数科を渡り歩く「診断のオデッセイ」が常態。鍵は症状・所見=表現型だが、カルテの自由記載に埋もれ医師ごとに表現がばらつく。深い表現型を構造化して候補疾患を絞れるか。医学生Hiroは国試で多数の希少疾患を「丸暗記」する当事者で、知識と臨床診断のギャップに向き合う。
自由記載・所見からHPO用語で深い表現型を抽出し、OMIM/Orphanet等の知識グラフと表現型-疾患の関連で重みづければ、テキストをそのまま読むより一貫して上位3に正解を含め、確率を較正して提示できる、と仮説。end-to-endの英語/UDN向け枠組み(RARE-PHENIX・DeepRare等)は既にあり、本企画の新規性は日本語の臨床記載での深い表現型化+較正+施設・言語をまたぐ移行に絞る。
長い自由記載からの所見抽出、何千もの疾患にまたがる希少な手がかりの重みづけ、表現型の同義・粒度のゆらぎは人手では網羅できない。知識グラフ×言語モデルでしか、抜けのない深い表現型と較正された候補ランキングは出せない=AIでしか届かない網羅。
深い表現型と候補疾患の較正ランキング=学会・論文。出口はまず未診断疾患外来・遺伝相談での「次に疑う候補と確認すべき検査」の提示(鑑別支援)。確定診断と遺伝学的検査は専門医が担い本企画は支援に限定。Hiroは当事者の医学生で、希少疾患・未診断疾患は社会的意義が大きい。