当前位置:诺佳网 > AI人工智能 > 大模型 >

"Source Code Summarization in the Era of Large Language

时间:2025-09-18 | 栏目:大模型 | 点击:

介绍

(1) 发表:ICSE'25

(2) 背景

之前的研究表明,与传统的代码摘要模型相比,LLM 生成的摘要在表达方式上与参考摘要有很大不同,并且倾向于描述更多的细节。因此,传统的评估方法是否适合评估 LLM 生成摘要的质量仍然未知

(3) 贡献

受到 NLP 工作的启发,本文对使用 LLM 本身作为评估方法的可能性做了全面的探索研究(不同 LLM/提示/设置,不同类型的语言)

工作

(1) 代码总结及其有效性评估的一般流程

image-20250918141631819

(2) 研究设计与分析

总结

对基于 LLM 的代码总结评估进行了多个方面的全面研究,探究了 LLM 评估方法的有效性,并且公开了两个数据集

您可能感兴趣的文章:

相关文章