活动介绍

由大语言模型驱动的 AI 骗子酒馆对战框架

preview
共1个文件
txt:1个
需积分: 0 0 下载量 63 浏览量 更新于2025-08-21 收藏 340B ZIP 举报
资源下载链接为: https://pan.quark.cn/s/5a1797f8e0fe Liars Bar LLM 是一个由大语言模型驱动的 AI 版骗子酒馆对战框架,其程序主要分为游戏主体与分析工具两部分。 游戏主体包含骗子酒馆游戏主程序、参与游戏的 LLM 智能体、用于保存和提取游戏记录的功能模块、用于配置模型接口和发起 LLM 请求的模块,以及用于批量运行多轮游戏的模块。 分析工具则由用于统计所有对局数据的工具、用于提取互为对手的 AI 间对局记录进行分析的工具,以及用于将 json 游戏记录转为可读文本的工具构成。 配置方面,可通过 conda 环境配置相应依赖包。本项目的 API 配置在此处,且利用了 New API 配置了统一的接口调用格式,使用时需自行配置相应模型的 API 接口,也可采用类似的 API 管理项目 One API 实现统一接口调用。 使用方法上,完成项目配置后,在相关位置和主程序入口中设置正确的模型名称。运行单局游戏可通过相应操作,运行多局游戏则在指定处设置希望运行的局数,默认为 10 局。 分析时,游戏记录会以 json 形式保存在目录下的对应文件夹中。将 json 文件转为可读性更强的文本格式后,转换后的文件会保存在目录下的特定文件夹中;提取所有游戏中 AI 之间两两对决的对局,转换后的文件会保存在目录下的相应文件夹中,同时可统计并打印所有对局数据。 Demo 中,项目已将 DeepSeek-R1、o3-mini、Gemini-2-flash-thinking、Claude-3.7-Sonnet 四个模型作为玩家运行了 50 局,记录存放在对应文件夹中。 已知问题是模型在出牌和质疑阶段的输出可能不稳定,当输出无法满足游戏规定时会自动重试。若多次因输出问题中断运行,可在相关位置和对应处增加调用大模型的重试次数,或修改文件夹中的相关内容和提示
身份认证 购VIP最低享 7 折!
30元优惠券