MOCKUP · SPReAD 1000 企画(外観イメージ) #31 · AI for Science/医療テーマ
#31

「息」で病をふるい分ける——呼気中のVOCを説明可能AIで読み、非侵襲スクリーニングの再現性を解明する

💨 pneuma.research / breath-voc
Pneuma — 呼気VOCをAIで読み非侵襲スクリーニング
研究プロトタイプ ・ 呼気の揮発性有機化合物を説明可能AIで層別化(ダミーデータ)
解析した呼気 1.2万件
解析した呼気サンプル
1.2万件
疾患群の層別化 AUC
.90
外部施設での再現性(AUC)
.85
▲ 別装置・別集団で検証
確定検査との一致(κ)
.82
標準化した呼気から、AIがVOCフィンガープリントを読み疾患群を根拠つきで層別化
呼気は採血より非侵襲だが、breathomics研究は単施設・外部検証不足で実装に至らない。AIが電子鼻/GC-MSのVOCパターンを読み、効いたVOC(分子)を示し、確率を提示。実測ではなくダミー描画。
信号強度 健常の平均レベル ノナナール ↑ アセトン ↑ 硫黄化合物 ↑ AI解析(説明可能) 疾患群の確率 0.91 VOC(保持時間順に整列) 呼気VOCフィンガープリントのイメージ・AIが効いたVOCを選び疾患群を層別化(ダミー描画)
呼気のVOCピーク AIが選んだバイオマーカー 健常の平均レベル
層別化に効いたVOC/センサー 上位(寄与度・ダミー)
1アルデヒド類(C6–C9)25%
2アセトン・ケトン類22%
3硫黄化合物(含硫VOC)19%
4芳香族炭化水素18%
5イソプレン16%
↑ 研究コード名「Pneuma」。標準化した呼気のVOCフィンガープリントから、AIが疾患群を
層別化し、効いたVOC(緑=バイオマーカー)を根拠つきで示した完成イメージ。
多くの疾患は呼気のVOCを変える。だが breathomics は単施設・外部検証不足で実装に至らない。標準化+説明可能AI+外部検証で、採血より非侵襲なふるい分けを再現性高く作る——完成したらこう見える、の外観イメージ。
上限 500万円(直接経費) 学生応募可(医学生=当事者) e-Rad 応募 第2回・2026年6月上旬予定 分野:呼吸器・消化器・腫瘍スクリーニング × 呼気VOC
🔬 問い・学術的背景

がん・呼吸器疾患・感染・代謝異常は、呼気中の揮発性有機化合物(VOC)パターンを変えることが知られる。だが「電子鼻/breathomics」研究は単施設・小規模・外部検証不足で、装置差・食事・喫煙などの交絡に弱く、臨床実装はごく一部にとどまる。呼気は採血より非侵襲で、スクリーニングは医学生が実習で必ず触れる当事者領域

🎯 仮説・新規性

標準化した呼気採取+(電子鼻のセンサー応答/GC-MSフィンガープリント)に説明可能AIを当てれば、(1)疾患群を非侵襲で層別化でき、(2)どのVOC/センサーが効いたか根拠を示せ、(3)装置・食事・喫煙などの交絡を補正して外部施設で再現できる、と仮説。新規性は精度自慢ではなく標準化・説明可能性・多施設外部検証・交絡補正に置く。

🤖 AI活用の必然性

数百次元のVOC・センサー応答の微小で非線形なパターンの集積は人手では読めず、機械学習でしか定量・標準化できない。交絡補正やドメイン適応も学習ベースが要る。

💰 500万円の使途
  • ① 多施設で標準化した呼気採取・電子鼻/GC-MS測定・倫理審査
  • ② 疾患ラベルの紐付け
  • 交絡補正・ドメイン適応モデルの開発・計算資源
  • ④ 効いたVOCを示す説明UIの試作
  • 外部施設での前向き検証・学会発表・プレプリント
📈 期待成果・社会実装(出口)

層別化のAUC↔外部施設での再現性+VOC根拠の妥当性=学会発表・論文。出口はまず非侵襲スクリーニングの補助(確定診断は既存検査)、将来は健診・在宅の一次ふるい分けHiroはスクリーニングを実習で学ぶ医学生=当事者

※ 正直な関門:breathomics/電子鼻は先行研究が多数あるが外部検証した研究はごく一部で、再現性・標準化の壁が大きく臨床実装は限定的(Owlstone等)。食事・喫煙・口腔・装置・サンプリングの交絡が巨大で、データは小規模・不均衡、過学習しやすい。観察データから因果は言えない。診断置換でなく補助=SaMDの整理が必要。学生応募可だが所属大学のe-Rad機関登録・承認と倫理審査が前提、第2回の正式日程・公募要領は確定次第確認。
完成イメージ(ダミーデータ)・元アイデア → spread-plans.md #31