MOCKUP · SPReAD 1000 企画(外観イメージ) #19 · AI for Science/医療テーマ
#19

声の「抑揚」と言葉からうつ症状の重さをAIで測る——自然発話の音響・言語特徴でうつの重症度と悪化の予兆を解明する

🎙️ prosa.research / speech
Prosa — 声と言葉からうつ症状を読む
研究プロトタイプ ・ 自然発話の音響+言語特徴を解析(ダミーデータ)
解析発話 1.8万session
解析した発話
1.8万session
重症度推定 AUC
.84
PHQ-9との一致(r)
.71
▲ 主観評価を客観化
悪化の予兆を検知
3週前
▲ 受診前に検知
自然発話の音響・言語からうつ重症度を推定し、悪化の予兆を縦断で捉える
AIが算出した「発話うつスコア」を週ごとに表示し、外来のPHQ-9と対応づけ。悪化局面ではAIスコアが受診より先に上昇。実測ではなくダミー描画。
重症度 重症 中等症 軽症 寛解閾値 悪化の予兆を検知 受診の約3週前に上昇 0週6121824週 発話うつスコアの縦断推移 + 外来PHQ-9(ダミー)
AI発話スコア PHQ-9(臨床評価) 受診前の予兆 窓 再燃の確認
うつ重症度に寄与する発話特徴 上位(寄与度)
1声の抑揚(韻律)の平板化26%
2発話速度の低下・間(ポーズ)の増加24%
3否定語・一人称の増加(言語)19%
4声質の変化(ジッタ/シマー)17%
5文の意味的つながり(一貫性)の低下14%
↑ 研究コード名「Prosa」。自然発話の音響+言語特徴から「発話うつスコア」を再構成し、
PHQ-9との対応と受診前の悪化の予兆をAIで可視化した完成イメージ。
うつの重症度評価はPHQ-9など主観に依存し客観指標が乏しい。自然発話の音響+言語からうつ重症度を客観スコア化し、韻律の平板化・ポーズ・否定語などの寄与を解釈受診前の悪化の予兆を縦断で捉える——完成したらこう見える、の外観イメージ。
上限 500万円(直接経費) 学生応募可(医学生=当事者) e-Rad 応募 第2回・2026年6月上旬予定 分野:精神医学 × 音響・言語マルチモーダル
🔬 問い・学術的背景

うつ病の重症度評価はPHQ-9など主観的な自己・他者評価に依存し、客観指標が乏しい。声には抑揚(韻律)・発話速度・間・声質、言葉には否定語・一人称・意味的一貫性など状態を映す手がかりがあるとされるが、(1)どの音響・言語特徴がうつ重症度を駆動するか、(2)日本語特異性(助詞・敬語・間)でどう変わるか、(3)受診前の悪化を先取りできるかは未確立。精神科は国試頻出、医学生自身のメンタルヘルスも切実な当事者テーマ。

🎯 仮説・新規性

自然発話に音響+言語のマルチモーダル学習を適用すれば、(1)うつ重症度を客観スコア化しPHQ-9と対応づけられ、(2)韻律の平板化・ポーズ増加・否定語などの寄与を解釈でき、(3)受診前の悪化の予兆を縦断で捉えられる、と仮説。海外で音声バイオマーカー(Ellipsis Health等)の先行はあるが、日本語の臨床ラベル付き縦断+解釈可能性+cross-cultural一般化は空白。

🤖 AI活用の必然性

うつのサインは多次元の微細な音響・言語特徴に分散し、人の主観評価では揺れる。マルチモーダル学習でしか、再現性ある重症度推定と受診前の早期悪化検出はできない。

💰 500万円の使途
  • ① 外来音声・言語の収集・倫理審査・匿名化(声紋=個人情報の保護)
  • ② 精神科医によるPHQ-9等のラベリング
  • ③ GPU/API(音響・言語モデル)
  • 重症度・予兆の可視化ダッシュボードの試作
  • ⑤ 学会発表・プレプリント公開
📈 期待成果・社会実装(出口)

うつ重症度の客観スコア↔PHQ-9対応+日本語ベンチマーク=学会発表・論文。加えて受診間隔の最適化や悪化の早期警告の土台。Hiroは精神科を学ぶ医学生=当事者

※ 正直な関門:声・言葉は強い個人情報で、プライバシー・同意・再識別が最重い。ラベル(PHQ-9)自体が主観で「正解」が揺れ、音響特徴は録音環境・マイク・方言・併存症で大きく動く。文化・言語依存で海外モデルは流用しにくく、観察データから因果は言えない。診断の置換ではなく補助に留め、プログラム医療機器(SaMD)の整理を要する。学生応募可だが所属大学のe-Rad機関登録・承認が前提、第2回の正式日程・公募要領は確定次第確認。
完成イメージ(ダミーデータ)・元アイデア → spread-plans.md #19