MOCKUP · SPReAD 1000 企画(外観イメージ) #1 · AI for Science/医療テーマ
#1

対戦型国試学習ログから医学知識の「つまずき構造」をAIで解明する

🔬 knowmap.research / med-knowledge-graph
KnowMap — 医学知識構造マッピング
研究プロトタイプ ・ みんこく対戦ログを解析(ダミーデータ)
解析ログ 28.4万件
解析した解答ログ
28.4万件
抽出した知識依存
412
つまずきの定型
37
習得予測の精度
AUC.86
▲ DKTで推定
医学知識の依存ネットワーク(誤答共起から推定)
ノード=知識領域/線=「Aを落とすとBも落ちやすい」依存。赤=つまずきが集中するハブ。
循環器 腎・電解質 内分泌 感染症 呼吸器 免疫 心電図 酸塩基平衡 抗菌薬
知識領域 つまずきハブ 誤答から推定した知識依存
つまずき構造 上位(依存つまずきの誤答率)
1酸塩基平衡 → 電解質異常 への波及62%
2心電図所見 → 不整脈の診断58%
3抗菌薬スペクトル → 感染症の治療選択54%
4副腎・電解質(内分泌×腎の交差)49%
↑ 研究コード名「KnowMap」。みんこくの対戦ログ(国試)をデータに、
医学知識の依存と「つまずきの定型」をAIで実証マッピングした完成イメージ。
みんこくの大規模対戦ログ(国試・1文字4択)を研究データに、医学知識の「つまずき構造」をAIで実証マッピング。経験則だった医学教育の知識依存を、誤答の科学で可視化する——完成したらこう見える、の外観イメージ。
上限 500万円(直接経費) 学生応募可(医学生=当事者) e-Rad 応募 第2回・2026年6月上旬予定 分野:医学教育 × 学習科学
🔬 問い・学術的背景

医学教育で「どの概念が・なぜつまずかれるか」は、いまも指導者の経験則に依存している。国家試験スケールの知識依存を実証データで構造化した公開研究は日本にほとんど無い。大規模な学習ログから、医学知識の構造そのものを解明できるか——が問い。

🎯 仮説・新規性

1v1対戦+1文字4択の大量解答ログに 項目反応理論(IRT)+知識追跡(Knowledge Tracing/DKT)+誤答共起グラフを適用すれば、国試の「知識依存ネットワーク」と「つまずきの定型パターン」が抽出でき、個別最適出題に転用できる、と仮説する。日本語・国試規模で公開された知識構造マップは前例が見当たらず、新規性がある。

🤖 AI活用の必然性

数十万件規模の系列解答ログは人手で構造化できない。系列深層モデル(DKT/Transformer系)で潜在的な知識状態を推定し、設問埋め込みで概念間の潜在依存を学習する必要がある=AIでしか到達できない粒度と規模。単なる集計では「つまずきの連鎖」は見えない。

💰 500万円の使途
  • ① GPU計算・クラウドAPI(モデル学習)
  • ② 学習ログ基盤の整備と匿名化
  • ③ 専門家アノテーション(領域・概念タグ付け)
  • ④ 倫理審査(IRB)・データ管理
  • ⑤ 結果公開(プレプリント・可視化Web)
📈 期待成果・社会実装(出口)

医学教育の知識構造マップ=学会発表・論文に加え、みんこくの個別最適出題エンジンへ即実装(既存プロダクトを持つので社会実装が速い)。将来は薬剤師・看護等の他資格、他大学カリキュラムへ横展開。Hiro自身が医学生=データとドメイン両面で優位

※ 正直な関門:学生単独でも応募資格はあるが、所属大学のe-Rad機関登録・承認が前提。プロダクト計画書ではなく「問い・仮説・新規性」を備えた研究の体裁に仕立てる必要がある。第2回の正式日程・公募要領は確定次第の確認が必要。
完成イメージ(ダミーデータ)・元データ資産=みんこく(国試学習)/ 企画ログ → spread-plans.md #1