医療面接は何が「上手い」のか——模擬診療対話のマルチモーダルAIで臨床コミュニケーションを構造化する

🔬 anamne.research / interview-analysis

💬

Anamne — 医療面接スキルの構造化

研究プロトタイプ・模擬診療対話をマルチモーダル解析（ダミーデータ）

解析対話 1,240件

解析した模擬診療対話

1,240件

専門家評価との一致

r=.89

▲ 人手採点を再現

抽出した対話行動因子

9因子

グローバル評価の予測

AUC.87

▲ 系列モデル

医療面接の対話タイムライン（1症例の解析例）

医師／患者の発話を話者分離し、医師の発話を行動タイプで色分け。共感の「タイミング」と漏斗型質問を可視化。

開放質問閉鎖質問/導入共感・受容要約・確認情報提供

医師 41%

患者 59%

✓ 患者の発話比率が高く、開放質問の直後に長い語り＝良好な情報収集パターン

面接の質（専門家グローバル評価）に効く行動因子上位

SHAP寄与度：その行動が評価を押し上げる強さ（ダミー）

1共感表現の的確なタイミング.34

2開放→閉鎖の漏斗型質問.28

3要約・確認（teach-back）.23

4発話を遮らない・沈黙の活用.19

5専門用語の平易な言い換え.16

↑ 研究コード名「Anamne」。模擬診療対話を話者分離・行動タグ・韻律で解析し、
「面接の質に効く行動」を定量化した完成イメージ（ダミーデータ）。

医療面接の「上手さ」は、いまもOSCEの主観採点に依存している。模擬診療対話をマルチモーダルAIで解析し、共感のタイミング・漏斗型質問・要約など「何が・どの瞬間に効くか」を定量化する——完成したらこう見える、の外観イメージ。みんこくのデータには依存しない、医学生＝当事者性そのものを軸にした独立テーマ。

上限 500万円（直接経費）学生応募可（医学生＝当事者） e-Rad 応募第2回・2026年6月上旬予定分野：医学教育 × 臨床コミュニケーション科学

🔬 問い・学術的背景

医療面接（問診・ラポール形成・共感・意思決定の共有）は診断精度・患者満足・服薬アドヒアランスを左右する。だがその「上手さ」の評価は、いまもOSCEのルーブリックによる人手・主観採点に依存し、再現性が低く粒度も粗い。「何が・どの瞬間に効くのか」を大規模・定量的に構造化した日本語の公開研究は乏しい——が問い。

🎯 仮説・新規性

模擬患者との診療対話を、発話内容(NLP)＋韻律・間(音声)＋ターン構造のマルチモーダルで解析すれば、面接の質は「情報収集の網羅性／開放→閉鎖の漏斗型質問／共感表現のタイミング／talk-time比・沈黙の活用／要約・確認(teach-back)」など少数の潜在因子に分解でき、専門家のグローバル評価を高精度に予測・説明できる、と仮説。日本語・医療面接の大規模マルチモーダル定量化は前例が乏しく新規。

🤖 AI活用の必然性

数百〜千の長尺対話 × 微小ダイナミクス（共感の一言、0.5秒の間）は、人手採点では規模・粒度ともに不能。発話埋め込み・話者分離・韻律抽出・系列モデルでターン単位の効き目を推定して初めて到達できる。LLM-as-judge と専門家評価の一致検証も組み合わせる。

💰 500万円の使途

① 模擬患者(SP)を用いた診療対話の収録・文字起こし
② 医学教育専門家による多面アノテーション（ゴールドラベル）
③ GPU/API（音声・対話モデル）
④ IRB・同意・データ管理（対話は要配慮）
⑤ フィードバック可視化Web・プレプリント公開

📈 期待成果・社会実装（出口）

日本語・医療面接の定量評価ベンチマーク＋「どの行動がグローバル評価を上げるか」の説明モデル＝学会発表・論文。加えてOSCE対策・地域医療研修で使える客観フィードバックツール（自分の面接を可視化）。Hiroは医学生＝OSCE/医療面接を実際に受ける当事者で、評価のリアルと使い所を熟知している。

※ 正直な関門：模擬対話は実診療と乖離しうる（生態学的妥当性）。共感・ラポールは文化依存で正解ラベルが揺れる。日本語の話者分離・韻律解析の精度、SP収録の同意とコスト。「良い面接→良い転帰」の因果主張には別途デザインが要る。学生応募可だが所属大学のe-Rad機関登録・承認が前提、第2回の正式日程・公募要領は確定次第確認。

完成イメージ（ダミーデータ）・テーマ＝医療面接/臨床コミュニケーション（みんこく非依存）／企画ログ → spread-plans.md #4