「息」で病をふるい分ける——呼気中のVOCを説明可能AIで読み、非侵襲スクリーニングの再現性を解明する

💨 pneuma.research / breath-voc

💨

Pneuma — 呼気VOCをAIで読み非侵襲スクリーニング

研究プロトタイプ・呼気の揮発性有機化合物を説明可能AIで層別化（ダミーデータ）

解析した呼気 1.2万件

解析した呼気サンプル

1.2万件

疾患群の層別化 AUC

.90

外部施設での再現性(AUC)

.85

▲ 別装置・別集団で検証

確定検査との一致(κ)

.82

標準化した呼気から、AIがVOCフィンガープリントを読み疾患群を根拠つきで層別化

呼気は採血より非侵襲だが、breathomics研究は単施設・外部検証不足で実装に至らない。AIが電子鼻／GC-MSのVOCパターンを読み、効いたVOC（分子）を示し、確率を提示。実測ではなくダミー描画。

呼気のVOCピーク AIが選んだバイオマーカー健常の平均レベル

層別化に効いたVOC／センサー上位（寄与度・ダミー）

1アルデヒド類（C6–C9）25%

2アセトン・ケトン類22%

3硫黄化合物（含硫VOC）19%

4芳香族炭化水素18%

5イソプレン16%

↑ 研究コード名「Pneuma」。標準化した呼気のVOCフィンガープリントから、AIが疾患群を
層別化し、効いたVOC（緑＝バイオマーカー）を根拠つきで示した完成イメージ。

多くの疾患は呼気のVOCを変える。だが breathomics は単施設・外部検証不足で実装に至らない。標準化＋説明可能AI＋外部検証で、採血より非侵襲なふるい分けを再現性高く作る——完成したらこう見える、の外観イメージ。

上限 500万円（直接経費）学生応募可（医学生＝当事者） e-Rad 応募第2回・2026年6月上旬予定分野：呼吸器・消化器・腫瘍スクリーニング × 呼気VOC

🔬 問い・学術的背景

がん・呼吸器疾患・感染・代謝異常は、呼気中の揮発性有機化合物(VOC)パターンを変えることが知られる。だが「電子鼻／breathomics」研究は単施設・小規模・外部検証不足で、装置差・食事・喫煙などの交絡に弱く、臨床実装はごく一部にとどまる。呼気は採血より非侵襲で、スクリーニングは医学生が実習で必ず触れる当事者領域。

🎯 仮説・新規性

標準化した呼気採取＋（電子鼻のセンサー応答／GC-MSフィンガープリント）に説明可能AIを当てれば、(1)疾患群を非侵襲で層別化でき、(2)どのVOC／センサーが効いたか根拠を示せ、(3)装置・食事・喫煙などの交絡を補正して外部施設で再現できる、と仮説。新規性は精度自慢ではなく標準化・説明可能性・多施設外部検証・交絡補正に置く。

🤖 AI活用の必然性

数百次元のVOC・センサー応答の微小で非線形なパターンの集積は人手では読めず、機械学習でしか定量・標準化できない。交絡補正やドメイン適応も学習ベースが要る。

💰 500万円の使途

① 多施設で標準化した呼気採取・電子鼻/GC-MS測定・倫理審査
② 疾患ラベルの紐付け
③ 交絡補正・ドメイン適応モデルの開発・計算資源
④ 効いたVOCを示す説明UIの試作
⑤ 外部施設での前向き検証・学会発表・プレプリント

📈 期待成果・社会実装（出口）

層別化のAUC↔外部施設での再現性＋VOC根拠の妥当性＝学会発表・論文。出口はまず非侵襲スクリーニングの補助（確定診断は既存検査）、将来は健診・在宅の一次ふるい分け。Hiroはスクリーニングを実習で学ぶ医学生＝当事者。

※ 正直な関門：breathomics／電子鼻は先行研究が多数あるが外部検証した研究はごく一部で、再現性・標準化の壁が大きく臨床実装は限定的（Owlstone等）。食事・喫煙・口腔・装置・サンプリングの交絡が巨大で、データは小規模・不均衡、過学習しやすい。観察データから因果は言えない。診断置換でなく補助＝SaMDの整理が必要。学生応募可だが所属大学のe-Rad機関登録・承認と倫理審査が前提、第2回の正式日程・公募要領は確定次第確認。

完成イメージ（ダミーデータ）・元アイデア → spread-plans.md #31