感谢您的下载,由于资源文件过大,请到此处下载资源:https://pan.quark.cn/s/5cbd6771c862
基于多轮开放式问题的汽车行业中文大模型细粒度测评基准
需积分: 0 112 浏览量
更新于2025-08-23
收藏 384B ZIP 举报
资源下载链接为:
https://pan.quark.cn/s/5cbd6771c862
近年人工智能技术发展推动大模型在各领域普及,高速发展的汽车行业中,智能化、智能驾驶、车联网等技术进步,使中文大模型需求渐增。但现有大模型测评基准多针对通用能力,未覆盖汽车行业需求,导致行业缺乏大模型能力公开评价标准。 为此,我们推出首个汽车行业大模型测评基准 ——SuperCLUE-Auto。这是多维度多轮开放式问题测评基准,既能评价汽车行业大模型能力,还能结合具体维度给出模型回答的细化反馈,以期推动中文大模型在汽车行业的应用效果提升与智能化水平进步,为行业研发提供方向。 各维度有专属标准,如汽车营销维度含符合场景设定程度、满足客户要求、内容创造性。 1 分:不相关或严重错误;2 分:轻微错误、质量低;3 分:中等、及格;4 分:良好、符合预期;5 分:优秀、超预期。 另有智能座舱与交互、汽车营销、汽车理解及知识、车辆使用指南四类多轮对话示例。 含 SuperCLUE-Auto 四大能力与应用、第一二轮得分分解表(注:分数差异 = 第二轮得分 - 第一轮得分)。

2501_92343407
- 粉丝: 2
最新资源
- 大型煤炭企业项目管理论文.doc
- 数据库实验研究分析.doc
- 支持通用OpenAPI的AI聊天界面,支持实时对话和流式响应
- 2019年计算机实习的工作总结.doc
- 计算机实训心得体会的相关范文.doc
- 2020年LTE系统下的D2D通信技术分析研究论文.doc
- Unit3Understandingideas导学案-高中英语外研版选择性.docx
- 清单填报软件使用说明.doc
- 谈对工程项目管理索赔的认识-工程管理毕业论文.doc
- VB高级编程Transparancy2完美版资料.ppt
- 某集团网站方案书(多篇).doc
- 改善程序设计技术的50个有效做法电子教案.ppt
- 基于ieee802.15.4的无线传感器网络的研究(定稿).doc
- 系统软件推广销售合作协议模板.doc
- 【精品课件】教育科学出版社高中信息技术必修:信息技术基础7.3.2认识数据库管理(7).pptx
- 项目管理网上作业.docx