病期が同じでも予後は分かれる——多面的データからがん予後の「隠れた型」をAIで発見し可視化する

🔬 oncostrata.research / prognosis-subtypes

🎗️

OncoStrata — 予後サブタイプの発見

研究プロトタイプ・臨床×病理×経過データを統合（ダミーデータ）

解析 1.92万件

解析した症例

1.92万件

発見した予後サブタイプ

4型

予後の識別

C.74

▲ 病期＋α

同病期内の生存差

HR2.4

▲ サブA vs C

病期が同じでも、AIが見つけた型で予後が分かれる

縦＝生存率／横＝経過（月）／3本＝同一病期内でAIが発見した予後サブタイプ／＋＝打ち切り（ダミーデータ）。

サブA（予後良好）サブB（中間）サブC（予後不良）＋打ち切り（censoring）

予後サブタイプを分ける駆動因子上位（寄与度）

各サブタイプを最も特徴づける解釈可能な軸／濃い＝予後の分かれ方への寄与が大。

1腫瘍微小環境の免疫所見（病理）.29

2主要検査マーカーの推移パターン（経過）.24

3初期治療への反応速度.18

4併存疾患・全身状態（PS）.15

5病変分布・進展パターン.10

↑ 研究コード名「OncoStrata」。臨床・病理・経過を統合し、同じ病期でも予後が分かれる
「隠れたサブタイプ」とその駆動因子をAIで発見・可視化した完成イメージ。

がんの予後は病期（TNM）が基軸。でも同じ病期でも転帰は大きく分かれる。臨床・病理・経過を束ね、病期では捉えきれない予後の「隠れた型」を解釈可能な形でAIが発見する——完成したらこう見える、の外観イメージ。

上限 500万円（直接経費）学生応募可（医学生＝当事者） e-Rad 応募第2回・2026年6月上旬予定分野：腫瘍学 × 予後科学 × 説明可能AI

🔬 問い・学術的背景

がんの予後予測は病期分類（TNM）が基軸だが、同じ病期でも転帰は大きく分かれる。臨床・病理・検査・経過を束ねて「病期では捉えきれない予後の軸」を解明し、しかも解釈可能な形で取り出した日本語の公開研究は乏しい。

🎯 仮説・新規性

多面的データ（臨床＋病理所見＋検査＋治療経過）を表現学習＋生存時間モデルで統合すれば、(1)同一病期内で予後が分かれる潜在サブタイプを教師なしに発見でき、(2)各サブタイプを駆動する解釈可能な軸を取り出せ、(3)既存の病期に上乗せの予後情報を定量化できる、と仮説。「発見＋解釈＋病期への上乗せ」を日本語臨床で示す設計は新規。

🤖 AI活用の必然性

予後は多面・非線形・打ち切り（検閲）を含む高次元の生存問題で、単変量や単純なリスク表では潜在構造を取り出せない。表現学習＋生存解析＋クラスタリング＋説明性でしか、隠れたサブタイプと駆動因子を同時に解明できない。

💰 500万円の使途

① 協力施設の臨床・病理・予後データ連携と倫理審査・標準化
② 腫瘍内科／病理医によるアノテーション
③ GPU/API（表現学習・生存モデル・説明性）
④ サブタイプ可視化ダッシュボード試作
⑤ 学会発表・プレプリント公開

📈 期待成果・社会実装（出口）

同一病期内の予後サブタイプ＋駆動因子マップ＝学会発表・論文。加えて医学生・研修医向けに「病期が同じでも予後が分かれる理由」を可視化する教材。Hiroはがんの病期・予後を学ぶ医学生＝当事者で、初学者の「なぜ」を内側から設計できる。

※ 正直な関門：予後データは打ち切りが多く長期追跡（コホート構築・追跡）が最大の関門。施設・治療世代でバイアスが乗りやすく外的妥当性に注意。教師なしサブタイプは「後付け解釈」に陥りやすく前向き検証が要る。がん予後AIは海外で活発（EXPAND・ASD-cancer等）で、新規性は「同一病期内の解釈可能サブタイプ＋日本語臨床」に絞る（誇張しない）。臨床判断支援の薬事位置づけに注意。学生応募はe-Rad機関承認が前提、第2回日程は確定次第確認。

完成イメージ（ダミーデータ）・元データ＝臨床×病理×経過（みんこく非依存）／企画ログ → spread-plans.md #9