MOCKUP · SPReAD 1000 企画(外観イメージ) #33 · AI for Science/医療テーマ
#33

「腸内細菌叢」で病を層別化できるか——コホートを超えて再現するマイクロバイオームの説明可能AIを作る

🦠 symbio.research / gut-microbiome
Symbio — 腸内細菌叢をAIで層別化(コホート横断)
研究プロトタイプ ・ 便メタゲノムの群集構造から疾患群を層別化し別コホート再現性を検証(ダミーデータ)
便メタゲノム 8.6千件
解析した便メタゲノム
8.6千件
同一コホートでのAUC
.82
別コホートでの再現性(AUC)
.72
▲ 食事・薬・地域で低下
腸疾患での再現性(AUC)
.84
便メタゲノムの群集構造から、AIが疾患群を層別化し、別コホートでの再現性まで検証
腸内細菌叢は炎症性腸疾患・大腸がん・代謝疾患と結びつく。だがAIは単一コホートで当たっても別コホートで再現しない——食事・薬・地域・前処理の交絡が信号を覆う。境界付近は交絡で紛れる。実測ではなくダミー描画。
PCoA2 PCoA1(群集構造の主軸)→ 層別化の境界 AI解析(説明可能) 疾患群を層別化 AUC .82 便メタゲノムの群集構造から疾患群を層別化し、別コホート再現性まで検証するイメージ(ダミー描画)
健常の便メタゲノム 疾患群(AIが層別化) AIの層別化境界 境界付近=交絡で紛れる例
層別化に効いた菌・代謝経路 上位(寄与度・ダミー)
1酪酸産生菌(Faecalibacterium等)の減少26%
2腸内多様性(α多様性)の低下21%
3Enterobacteriaceae(炎症性)の増加19%
4短鎖脂肪酸の産生経路の低下18%
5胆汁酸代謝の変化16%
↑ 研究コード名「Symbio」。便メタゲノムの群集構造から、AIが疾患群(紫)を層別化し、効いた菌・
代謝経路を根拠つきで示し、別コホートでの再現性まで検証した完成イメージ。
腸内細菌叢は炎症性腸疾患・大腸がん・代謝疾患などと結びつく。だが microbiome のAIは単一コホートで当たっても別コホートで再現しない——食事・薬・地域・前処理の交絡が信号を覆う。交絡補正+組成データ対応+説明可能AIで、別コホートでも再現する層別化と効いた菌の根拠を作る——完成したらこう見える、の外観イメージ。
上限 500万円(直接経費) 学生応募可(医学生=当事者) e-Rad 応募 第2回・2026年6月上旬予定 分野:消化器・感染・代謝 × 便メタゲノムAI
🔬 問い・学術的背景

腸内細菌叢(マイクロバイオーム)は炎症性腸疾患(IBD)・大腸がん・代謝疾患・C. difficile感染などと関連し、便という非侵襲検体で測れる。だが研究の多くは単一コホートで高精度でも別コホートで再現しない。腸疾患・抗菌薬適正使用は医学生が消化器・感染の実習で必ず触れる当事者領域

🎯 仮説・新規性

便メタゲノム(菌の組成・代謝経路)に組成データ対応+交絡補正+説明可能AIを当てれば、(1)疾患群を別コホートでも再現して層別化でき、(2)どの菌・経路が頑健な信号か(コホート由来の偽信号と区別)を示せ、(3)食事・薬・地域の交絡を補正できる、と仮説。新規性は精度自慢でなくクロスコホート再現性・交絡補正・頑健な信号の同定に置く。

🤖 AI活用の必然性

数百〜数千次元の組成(合計1の制約)・非線形な菌間相互作用は人手では読めず、バッチ効果・交絡の補正も学習ベースが要る。コホート横断で頑健な信号を選ぶのは機械学習でしかできない。

💰 500万円の使途
  • ① 多コホートの便メタゲノム・臨床メタデータ(食事・薬)の整備・倫理審査
  • ② 疾患ラベル・交絡因子の紐付け
  • 組成データ対応・交絡補正・ドメイン適応モデルの開発・計算資源
  • ④ 頑健な菌・経路を示す説明UI試作
  • 別コホートでの外部検証・学会発表・プレプリント
📈 期待成果・社会実装(出口)

同一コホート↔別コホートのAUC差+頑健な信号の妥当性=学会発表・論文。出口はまず腸疾患(IBD・大腸がん)の非侵襲な層別化・モニタの補助(確定診断は内視鏡等)、将来は抗菌薬・食事介入の層別化Hiroは消化器・感染を実習で学ぶ医学生=当事者

※ 正直な関門:microbiomeのAIは単一コホートでAUC約0.77でも別コホートで再現性が落ちる(腸疾患はAUC約0.73–0.84と比較的保つが非腸疾患は弱い)。食事・薬・地域・サンプル前処理・解析法の交絡が巨大で、しばしば疾患より菌叢を支配する。観察データから因果は言えない(菌が原因か結果か不明)。データは小規模・不均衡で組成データ特有の統計的扱いが要る。診断置換でなく補助=SaMDの整理が必要。学生応募可だが所属大学のe-Rad機関登録・承認と倫理審査が前提、第2回の正式日程・公募要領は確定次第確認。
完成イメージ(ダミーデータ)・元アイデア → spread-plans.md #33