书生大模型实战营L1:第六关:使用OpenCompass 评测大模型
五花八门的大模型能力到底有多强?有没有客观评价的标准?本节课的目标是进行大语言模型的评测。使用的评测工具是OpenCompass。OpenCompass是上海人工智能实验室研发的开...
这是关于 compass 标签的相关文章列表
五花八门的大模型能力到底有多强?有没有客观评价的标准?本节课的目标是进行大语言模型的评测。使用的评测工具是OpenCompass。OpenCompass是上海人工智能实验室研发的开...
01 背景 继OPPO大数据平台开源基于Spark诊断产品Compass(代号“罗盘”)之后,我们又持续迭代开发集成了实时Flink引擎诊断,可用于诊断Flink作业的资源...