《A Survey on Evaluation of Large Language Models》
一、论文介绍:微软亚洲研究院公开了介绍大模型评测领域的论文《A Survey on Evaluation of Large Language Models》。该论文一共调研了219篇文献,以评测内容 (what to evaluate)、评测领域 (where to evaluate)、评测方法 (How to evaluate)和目前的评测挑战话题展开的研究。
二、评测过程
三、感谢的朋友可以留言,无条件分享论文!!!
- Evaluation 研究院 Language 模型 Surveyevaluation研究院language模型 evaluation language large model evaluation automatic generated language basedautonomous language笔记survey evaluation holistic language models language survey models论文 language模型large model recommender language模型systems transformer模型 研究生pytorch 方法研究 模型 大小 格式