「嗄声」の正体を、声帯振動の時空間表現（ラリンゴバイブログラム）でAIが解く

🔬 voxvibro.research / vocal-fold-dynamics

🎙

VoxVibro — 声帯振動の時空間解析

研究プロトタイプ・喉頭ハイスピード内視鏡＋音響を解析（ダミーデータ）

解析発声 2,640件

解析した発声

2,640件

左右非対称の検出

AUC.90

撮影フレームレート

8,000fps

同定した振動表現型

5型

▲ 時空間表現から

ラリンゴバイブログラム（声帯振動の時空間表現）

上＝声門面積波形（声帯の開大）／下＝左右声帯エッジの変位。右声帯の振幅低下と振動開始の遅延（位相差）が見える。

左声帯エッジ右声帯エッジ声門面積波形振動開始の左右差

発声障害を分ける振動の時空間特徴（モデルの寄与度）

正常／病的を分離する特徴の重要度。声帯の「左右差」を捉える指標が上位を占める。

1振動開始の左右遅延（onset asymmetry）.88

2振幅比（右／左）.81

3粘膜波動の左右差.64

4周期ゆらぎ（cycle-to-cycle, Jitter）.52

5閉鎖率（closed quotient）の偏り.44

↑ 研究コード名「VoxVibro」。喉頭ハイスピード内視鏡と音響を時空間表現し、
声帯振動の左右非対称から器質・麻痺・神経筋性の発声障害を解く完成イメージ。

嗄声を「声の印象」で評価する現状を超え、喉頭ハイスピード内視鏡＋音響から声帯振動を時空間表現（ラリンゴバイブログラム）し、左右非対称から器質・麻痺・神経筋性の発声障害をAIで解く——完成したらこう見える、の外観イメージ。

上限 500万円（直接経費）学生応募可（医学生＝当事者） e-Rad 応募第2回・2026年6月上旬予定分野：音声科学 × 高速イメージング

🔬 問い・学術的背景

声帯は発声中、毎秒100〜250回振動する。通常の喉頭内視鏡（約30fps）やストロボスコピーは「平均的な1周期」を疑似的に再構成しているにすぎず、左右非対称・粘膜波動・振動開始の遅延という本質は人の目とフレームレートの壁に阻まれている。嗄声(dysphonia)は声帯麻痺・ポリープ・痙攣性発声障害・早期喉頭癌・神経筋疾患まで原因が幅広いのに、初期評価はいまも"声の印象"と数フレームの観察に依存している。

🎯 仮説・新規性

喉頭ハイスピード内視鏡（HSV, 2,000〜20,000fps）の声門面積波形と左右声帯のエッジ変位を「ラリンゴバイブログラム（正規化した時空間表現）」に落とせば、左右の位相差・振幅比・周期ゆらぎが疾患群を分ける、と仮説する。深層学習による声門の自動セグメンテーションは検者非依存の精度に達しつつあり（U-LSTM等）、振動の時空間表現を疾患横断で解くのは萌芽段階。

🤖 AI活用の必然性

毎秒数千枚・1発声で数万フレームを、声門輪郭の追跡という主観作業で人手処理するのは非現実的。微細な左右非対称や振動開始の遅延は人の知覚を超える。時系列ディープラーニングでしか定量できない＝AIの必然。単なる「声の印象」では振動の左右差は見えない。

💰 500万円の使途

① 既存HSV動画の二次利用・公開データの統合
② 声門セグメンテーション＋時空間表現モデルの開発計算（GPU）
③ 音響同時記録の前処理・同期
④ 外部施設データでの汎化検証・IRB／データ管理
⑤ 結果公開（プレプリント・可視化Web）

📈 期待成果・社会実装（出口）

嗄声のレッドフラグ（喉頭癌・声帯麻痺）の拾い上げ、発声障害の病型鑑別の標準化、音声治療の客観的な効果判定。出口は耳鼻科・音声外来の評価支援と、神経筋疾患の音声スクリーニング。Hiro自身が医学生＝喉頭診察を学ぶ当事者で、臨床の見え方とデータの両面に接地できる。

※ 正直な関門：確定診断・処方は医師（医師法）。HSVは専門機器で実施施設が限られ侵襲もある。音声は環境ノイズに弱い。確定診断ラベルが少なく希少病型でデータ不足。音響バイオマーカーの疾患特異性は未確立で過大評価は禁物。前向き・多施設での検証が要る。第2回の正式日程・公募要領は確定次第の確認が必要。

完成イメージ（ダミーデータ・実在データや企業名は不使用）・分野＝耳鼻咽喉／音声科学 × 高速イメージング／企画ログ → spread-plans.md #93