llm学习

原创已于 2024-09-22 14:30:32 修改 · 292 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #nlp #自然语言处理

于 2024-09-20 16:25:34 首次发布

文章目录

前言
TASK一、使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能，记录复现过程并截图。

前言

这是一篇学习第三期书生大模型实战营的记录。

TASK一、使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能，记录复现过程并截图。

在这里插入图片描述

再a100上做的OpenCompass评测，花了大概4个小时，从图中看出internlm2-chat-1.8b模型在ceval-middle_school_biology，ceval-middle_school_chemistry等中学题目上表现良好，在ceval-computer_architecture 计算机架构方面表现欠佳。