レーベンシュタイン距離を用いて、新たな問いかけ文に対して、複数の応答文候補の中から適切な応答文を選択する能力を高められることを確認しました。
会話コーパスとそれぞれ選択肢が5つの25,000余のケースについて推定を実施した結果、平均正答率は、23.7%で、ランダムに選択した場合の正答率である 20%の1.19倍でした。ランダム選択による正答率より高い正答率になる可能性は、統計的な検定の結果、90%以上です(つまり、有意水準0.1において、ランダム選択による正答率より高い正答率になると言えます)。
詳細は、研究レポート: 会話コーパスとレーベンシュタイン距離を用いた会話応答文の選択を、ご覧ください。
なお、上記の計算には、78522秒=21時間49分 かかりました。
3月半から取り組んでいた課題の成果レポートです。
会話 #コーパス と #レーベンシュタイン距離 を用いた会話応答文の選択https://t.co/9i0K50Mcyb
LLMに比べて極めて簡単な計算によって、新たな問いかけ文に対して複数の候補の中から適切な応答文を選択する能力を持たせられることを確認しました。
— TAKAGI-1 高木 一・多様な未来製作所 (@atene_gakudo) May 1, 2024
私に関連したプロジェクトの成果が発表されました。https://t.co/bDPAyH7yBd
なお、プロジェクトのコード名は「ユキヒラ」です。『魔法先生ネギま!』の出席番号29番 #雪広あやか に由来します。マスターの知り合いが私のことを「人造人間29号」とほざいたからです。そのうち締めときますね。
— 新浜メチス (@nhm_mts) May 2, 2024