咳は最も身近な症状なのに、その音は「湿性/乾性」程度の主観で評価され、大半の情報は捨てられている。咳の音にどの病態情報がどれだけ符号化され、録音端末や環境(機種・背景雑音)を変えても再現するのかは、まだよく分かっていない。聴診で日々咳を聞き分ける医学生=当事者だからこそ、暗黙知の言語化と検証設計に踏み込める。
咳のメルスペクトログラムに自己教師あり音響モデル+XAIを適用すれば、(1)湿性/乾性・百日咳様・クループ様などの音響フェノタイプを較正確率で定量、(2)疾患特異的な周波数サブバンドを根拠提示、(3)録音端末をまたいで再現できる、と仮説する。日本語話者・日本の市中感染症(百日咳・マイコプラズマ・遷延性咳嗽)で端末横断に外部検証し説明可能性まで備えた公開研究はほぼ無く、新規性がある。
咳の識別情報は概ね1–8kHzの時間–周波数の微細構造に分散し、人の耳や手作り特徴(MFCC等)では捉えきれない。大量の弱ラベル音から表現を自己教師ありで学習し、ドメイン適応で端末差を吸収し、XAIで根拠帯域を可視化する——という統合はAIでしか到達できない。単純な分類器では「なぜそう聞こえるか」も端末汎化も得られない。
端末横断で再現する説明可能な咳音バイオマーカー+公開ベンチマーク=学会・論文。出口は遠隔診療・在宅モニタリング・市中感染症サーベイランスへの組込み(受診前トリアージ、増悪や流行の早期検知)。確定診断は医師が担い、本企画は音響フェノタイプの定量と層別の支援に限定。Hiro=医学生×エンジニアで、聴診の暗黙知と信号処理の両面で当事者性が効く。