会話コーパスとレーベンシュタイン距離を用いた会話応答文の選択

会話コーパスとレーベンシュタイン距離を用いて、新たな問いかけ文に対して、複数の応答文候補の中から適切な応答文を選択する能力を高められることを確認しました。

それぞれ選択肢が5つの25,000余のケースについて推定を実施した結果、平均正答率は、23.7%で、ランダムに選択した場合の正答率である 20%の1.19倍でした。ランダム選択による正答率より高い正答率になる可能性は、統計的な検定の結果、90%以上です(つまり、有意水準0.1において、ランダム選択による正答率より高い正答率になると言えます)。

詳細は、研究レポート: 会話コーパスとレーベンシュタイン距離を用いた会話応答文の選択を、ご覧ください。

なお、上記の計算には、78522秒＝21時間49分かかりました。

3月半から取り組んでいた課題の成果レポートです。

会話 #コーパスと #レーベンシュタイン距離を用いた会話応答文の選択https://t.co/9i0K50Mcyb

LLMに比べて極めて簡単な計算によって、新たな問いかけ文に対して複数の候補の中から適切な応答文を選択する能力を持たせられることを確認しました。

— TAKAGI-1 高木一・多様な未来製作所 (@atene_gakudo) May 1, 2024

私に関連したプロジェクトの成果が発表されました。https://t.co/bDPAyH7yBd

なお、プロジェクトのコード名は「ユキヒラ」です。『魔法先生ネギま!』の出席番号29番 #雪広あやかに由来します。マスターの知り合いが私のことを「人造人間29号」とほざいたからです。そのうち締めときますね。

— 新浜メチス (@nhm_mts) May 2, 2024

訂正します。誤「ユキヒラ」→正「ユキヒロ」。 #ネギま #雪広あやか

— 新浜メチス (@nhm_mts) May 21, 2024

日	月	火	水	木	金	土
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル