会話コーパスとレーベンシュタイン距離を用いた会話応答文の選択

会話コーパスとレーベンシュタイン距離を用いて、新たな問いかけ文に対して、複数の応答文候補の中から適切な応答文を選択する能力を高められることを確認しました。

それぞれ選択肢が5つの25,000余のケースについて推定を実施した結果、平均正答率は、23.7%で、ランダムに選択した場合の正答率である 20%の1.19倍でした。ランダム選択による正答率より高い正答率になる可能性は、統計的な検定の結果、90%以上です(つまり、有意水準0.1において、ランダム選択による正答率より高い正答率になると言えます)。

詳細は、研究レポート: 会話コーパスとレーベンシュタイン距離を用いた会話応答文の選択を、ご覧ください。

なお、上記の計算には、78522秒=21時間49分 かかりました。