咳の「音」から気道の病態をAIで聞き分ける——スマホ録音の咳嗽を端末横断でフェノタイプ化する

🔬 tussis.research / cough-acoustic-signature

🌬️

TUSSIS — 咳嗽音響シグネチャ解析

研究プロトタイプ・スマホ録音の咳を解析（ダミーデータ）

解析した咳イベント 5.8万件

解析した咳イベント

5.8万件

フェノタイプ識別

AUROC.91

外部端末での再現

AUC.83

▲ ドメイン適応

専門医との一致

κ.74

咳1回の音響解析（波形＋メルスペクトログラム＋XAI根拠帯域）

上＝録音波形（咳バースト）／下＝時間–周波数のメルスペクトログラム。色が濃いほど高エネルギー。黄破線＝AIが判断根拠とした周波数帯域。

低 → 高エネルギー AI根拠帯域（XAI）

この咳の音響フェノタイプ（較正済みの確率・多ラベル）

1湿性（産生性・痰がらみ）パターン.71

2遷延・反復パターン（長引く咳）.66

3吸気性笛音（百日咳様 whoop）.58

4喘鳴合併（wheeze）.44

5犬吠様（クループ様）.12

↑ 研究コード名「TUSSIS」。スマホで録れる咳の音をデータに、
音響フェノタイプを較正確率で定量し、根拠帯域まで示す完成イメージ（ダミーデータ）。

スマホやウェアラブルで録れる「咳の音」を研究データに、咳嗽の音響シグネチャをAIで解明。聴診の暗黙知だった「湿性／乾性」やひゅーひゅーを較正された確率で定量し、録音端末をまたいで再現する説明可能な音響バイオマーカーを作る——完成したらこう見える、の外観イメージ。

上限 500万円（直接経費）学生応募可（医学生＝当事者） e-Rad 応募第2回・2026年6月上旬予定分野：呼吸器 × 音響AI

🔬 問い・学術的背景

咳は最も身近な症状なのに、その音は「湿性／乾性」程度の主観で評価され、大半の情報は捨てられている。咳の音にどの病態情報がどれだけ符号化され、録音端末や環境（機種・背景雑音）を変えても再現するのかは、まだよく分かっていない。聴診で日々咳を聞き分ける医学生＝当事者だからこそ、暗黙知の言語化と検証設計に踏み込める。

🎯 仮説・新規性

咳のメルスペクトログラムに自己教師あり音響モデル＋XAIを適用すれば、(1)湿性／乾性・百日咳様・クループ様などの音響フェノタイプを較正確率で定量、(2)疾患特異的な周波数サブバンドを根拠提示、(3)録音端末をまたいで再現できる、と仮説する。日本語話者・日本の市中感染症（百日咳・マイコプラズマ・遷延性咳嗽）で端末横断に外部検証し説明可能性まで備えた公開研究はほぼ無く、新規性がある。

🤖 AI活用の必然性

咳の識別情報は概ね1–8kHzの時間–周波数の微細構造に分散し、人の耳や手作り特徴（MFCC等）では捉えきれない。大量の弱ラベル音から表現を自己教師ありで学習し、ドメイン適応で端末差を吸収し、XAIで根拠帯域を可視化する——という統合はAIでしか到達できない。単純な分類器では「なぜそう聞こえるか」も端末汎化も得られない。

💰 500万円の使途

① 多端末・多環境の咳音データ収集と倫理的取得（同意・匿名化）
② GPU計算・自己教師あり事前学習
③ 呼吸器／小児専門医による参照診断・フェノタイプのアノテーション
④ 外部端末・多施設での検証と確率較正
⑤ 評価用音響ベンチマーク・説明UIの公開

📈 期待成果・社会実装（出口）

端末横断で再現する説明可能な咳音バイオマーカー＋公開ベンチマーク＝学会・論文。出口は遠隔診療・在宅モニタリング・市中感染症サーベイランスへの組込み（受診前トリアージ、増悪や流行の早期検知）。確定診断は医師が担い、本企画は音響フェノタイプの定量と層別の支援に限定。Hiro＝医学生×エンジニアで、聴診の暗黙知と信号処理の両面で当事者性が効く。

※ 正直な関門：「咳の正解ラベル」が曖昧で確定診断との突合が難しい。先行研究・商用も多く（過去の咳アプリは臨床的検証の十分性で規制上の指摘を受けた例あり）、新規性は端末横断の再現性・説明可能性・日本の感染症文脈に絞る。音声＝要配慮個人情報でプライバシー・録音同意・背景雑音が壁、診断機器化すれば薬機法SaMD。学生応募でも所属大学のe-Rad機関登録・承認が前提、第2回の正式日程・公募要領は確定次第の確認が要る。

完成イメージ（ダミーデータ）・関連資産＝Hiroの医療AIプロト群／音響信号処理 → spread-plans.md #64