感谢您的下载,由于资源文件过大,请到此处下载资源:https://pan.quark.cn/s/5a1797f8e0fe
由大语言模型驱动的 AI 骗子酒馆对战框架
需积分: 0 63 浏览量
更新于2025-08-21
收藏 340B ZIP 举报
资源下载链接为:
https://pan.quark.cn/s/5a1797f8e0fe
Liars Bar LLM 是一个由大语言模型驱动的 AI 版骗子酒馆对战框架,其程序主要分为游戏主体与分析工具两部分。 游戏主体包含骗子酒馆游戏主程序、参与游戏的 LLM 智能体、用于保存和提取游戏记录的功能模块、用于配置模型接口和发起 LLM 请求的模块,以及用于批量运行多轮游戏的模块。 分析工具则由用于统计所有对局数据的工具、用于提取互为对手的 AI 间对局记录进行分析的工具,以及用于将 json 游戏记录转为可读文本的工具构成。 配置方面,可通过 conda 环境配置相应依赖包。本项目的 API 配置在此处,且利用了 New API 配置了统一的接口调用格式,使用时需自行配置相应模型的 API 接口,也可采用类似的 API 管理项目 One API 实现统一接口调用。 使用方法上,完成项目配置后,在相关位置和主程序入口中设置正确的模型名称。运行单局游戏可通过相应操作,运行多局游戏则在指定处设置希望运行的局数,默认为 10 局。 分析时,游戏记录会以 json 形式保存在目录下的对应文件夹中。将 json 文件转为可读性更强的文本格式后,转换后的文件会保存在目录下的特定文件夹中;提取所有游戏中 AI 之间两两对决的对局,转换后的文件会保存在目录下的相应文件夹中,同时可统计并打印所有对局数据。 Demo 中,项目已将 DeepSeek-R1、o3-mini、Gemini-2-flash-thinking、Claude-3.7-Sonnet 四个模型作为玩家运行了 50 局,记录存放在对应文件夹中。 已知问题是模型在出牌和质疑阶段的输出可能不稳定,当输出无法满足游戏规定时会自动重试。若多次因输出问题中断运行,可在相关位置和对应处增加调用大模型的重试次数,或修改文件夹中的相关内容和提示

2501_92343407
- 粉丝: 2
最新资源
- 倾斜高大钢筋混凝土柱施工技术.doc
- 凝固点降低法测定摩尔质量.docx
- 2008年公司员工的个人总结.doc
- 项目分包管理程序-secret.docx
- 屋面工程细部构造施工工艺.doc
- 防盗门分包招标文件.doc
- Unit1FoodForThoughtDevelopingideas课件高中英语2.pptx
- 人工)土方回填分项工程质量管理.doc
- 第十二章-配管、配线.doc
- 城测量施工方案.doc
- 计算机专业毕业生求职信撰写-计算机应届毕业生求职信(七篇).docx
- 网站策划专业技术方案写作、演示标准.doc
- 虹吸排水技术p.doc
- 山西省市政道路工程造价指数测算.doc
- 小说在线阅读系统设计与实现-计算机技术毕业设计论文.pdf
- 城镇污水处理厂设计高程计算.doc