书生大模型实战营L1:第六关:使用OpenCompass 评测大模型
五花八门的大模型能力到底有多强?有没有客观评价的标准?本节课的目标是进行大语言模型的评测。使用的评测工具是OpenCompass。OpenCompass是上海人工智能实验室研发的开...
这是关于 opencompass 标签的相关文章列表
五花八门的大模型能力到底有多强?有没有客观评价的标准?本节课的目标是进行大语言模型的评测。使用的评测工具是OpenCompass。OpenCompass是上海人工智能实验室研发的开...