大模型评测-微软亚洲研究院：A Survey on Evaluation of Large Language Models论文分享-526互联

《A Survey on Evaluation of Large Language Models》

一、论文介绍：微软亚洲研究院公开了介绍大模型评测领域的论文《A Survey on Evaluation of Large Language Models》。该论文一共调研了219篇文献，以评测内容 (what to evaluate)、评测领域 (where to evaluate)、评测方法 (How to evaluate)和目前的评测挑战话题展开的研究。