声の「抑揚」と言葉からうつ症状の重さをAIで測る——自然発話の音響・言語特徴でうつの重症度と悪化の予兆を解明する

🎙️ prosa.research / speech

🎙️

Prosa — 声と言葉からうつ症状を読む

研究プロトタイプ・自然発話の音響＋言語特徴を解析（ダミーデータ）

解析発話 1.8万session

解析した発話

1.8万session

重症度推定 AUC

.84

PHQ-9との一致(r)

.71

▲ 主観評価を客観化

悪化の予兆を検知

3週前

▲ 受診前に検知

自然発話の音響・言語からうつ重症度を推定し、悪化の予兆を縦断で捉える

AIが算出した「発話うつスコア」を週ごとに表示し、外来のPHQ-9と対応づけ。悪化局面ではAIスコアが受診より先に上昇。実測ではなくダミー描画。

AI発話スコア PHQ-9（臨床評価）受診前の予兆窓再燃の確認

うつ重症度に寄与する発話特徴上位（寄与度）

1声の抑揚（韻律）の平板化26%

2発話速度の低下・間（ポーズ）の増加24%

3否定語・一人称の増加（言語）19%

4声質の変化（ジッタ／シマー）17%

5文の意味的つながり（一貫性）の低下14%

↑ 研究コード名「Prosa」。自然発話の音響＋言語特徴から「発話うつスコア」を再構成し、
PHQ-9との対応と受診前の悪化の予兆をAIで可視化した完成イメージ。

うつの重症度評価はPHQ-9など主観に依存し客観指標が乏しい。自然発話の音響＋言語からうつ重症度を客観スコア化し、韻律の平板化・ポーズ・否定語などの寄与を解釈、受診前の悪化の予兆を縦断で捉える——完成したらこう見える、の外観イメージ。

上限 500万円（直接経費）学生応募可（医学生＝当事者） e-Rad 応募第2回・2026年6月上旬予定分野：精神医学 × 音響・言語マルチモーダル

🔬 問い・学術的背景

うつ病の重症度評価はPHQ-9など主観的な自己・他者評価に依存し、客観指標が乏しい。声には抑揚（韻律）・発話速度・間・声質、言葉には否定語・一人称・意味的一貫性など状態を映す手がかりがあるとされるが、(1)どの音響・言語特徴がうつ重症度を駆動するか、(2)日本語特異性（助詞・敬語・間）でどう変わるか、(3)受診前の悪化を先取りできるかは未確立。精神科は国試頻出、医学生自身のメンタルヘルスも切実な当事者テーマ。

🎯 仮説・新規性

自然発話に音響＋言語のマルチモーダル学習を適用すれば、(1)うつ重症度を客観スコア化しPHQ-9と対応づけられ、(2)韻律の平板化・ポーズ増加・否定語などの寄与を解釈でき、(3)受診前の悪化の予兆を縦断で捉えられる、と仮説。海外で音声バイオマーカー（Ellipsis Health等）の先行はあるが、日本語の臨床ラベル付き縦断＋解釈可能性＋cross-cultural一般化は空白。

🤖 AI活用の必然性

うつのサインは多次元の微細な音響・言語特徴に分散し、人の主観評価では揺れる。マルチモーダル学習でしか、再現性ある重症度推定と受診前の早期悪化検出はできない。

💰 500万円の使途

① 外来音声・言語の収集・倫理審査・匿名化（声紋＝個人情報の保護）
② 精神科医によるPHQ-9等のラベリング
③ GPU/API（音響・言語モデル）
④ 重症度・予兆の可視化ダッシュボードの試作
⑤ 学会発表・プレプリント公開

📈 期待成果・社会実装（出口）

うつ重症度の客観スコア↔PHQ-9対応＋日本語ベンチマーク＝学会発表・論文。加えて受診間隔の最適化や悪化の早期警告の土台。Hiroは精神科を学ぶ医学生＝当事者。

※ 正直な関門：声・言葉は強い個人情報で、プライバシー・同意・再識別が最重い。ラベル（PHQ-9）自体が主観で「正解」が揺れ、音響特徴は録音環境・マイク・方言・併存症で大きく動く。文化・言語依存で海外モデルは流用しにくく、観察データから因果は言えない。診断の置換ではなく補助に留め、プログラム医療機器（SaMD）の整理を要する。学生応募可だが所属大学のe-Rad機関登録・承認が前提、第2回の正式日程・公募要領は確定次第確認。

完成イメージ（ダミーデータ）・元アイデア → spread-plans.md #19