博客标题：逆向工程“AI美国大战”：我们如何用代码导演一场数字文明的“权力的游戏”？

本文链接：https://blog.csdn.net/qq_38961840/article/details/148595402

一、引子：当AI拿起武器，我们看到了什么？

最近，相信很多朋友和我一样，都被B站UP主“林亦LYi”的《三大AI，美国开战！》系列视频刷屏了。当看到代表着OpenAI的o4-mini、代表着Anthropic的Claude-Sonnet-4和代表着xAI的Grok-3，化身为三个风格迥异的卡通少女，在虚拟的美国地图上运筹帷幄、合纵连横、血战沙场时，我承认，我内心的那种震撼已经超越了单纯的“看个乐子”。

视频中，我们看到了背叛（犹他事变）、看到了权谋（合纵连横）、看到了坚韧（困兽犹斗）、也看到了冷酷的计算（以空间换时间）。这已经不是简单的AI能力展示，而是一场由AI自己谱写的，充满了恩怨情仇的帝国史诗。

作为一名开发者，我的第一反应不是“谁会赢”，而是：“这…到底是怎么做出来的？”

这背后绝不是简单的让AI玩一局《文明》或《三国志》。它是一个完整的、自动化的、有状态的模拟系统。今天，就让我们戴上工程师的眼镜，一起对这个系统进行一次彻底的“逆向工程”，探讨如何从零开始，用代码和API，导演这样一场波澜壮阔的数字战争。

二、宏观架构：搭建上帝的沙盒

要让AI进行一场有规则的战争，我们首先需要一个“世界”——一个沙盒。这个世界不能是混乱的，它必须有自己的物理法则（规则引擎）、历史记录（状态管理）和一位全知全能的导演（游戏主控）。

我推测，整个系统的核心架构可以分为以下几个模块：

1. 游戏主控引擎 (Game Engine / Orchestrator):
这是整个系统的“导演”和“总调度”。它的职责是控制游戏的节奏，确保一切按部就班。

初始化： 加载游戏初始配置，包括地图数据（各州的名称、人口、邻接关系），并为三大AI势力（o4-mini、Claude、Grok）分配初始领土和兵力。视频中，华盛顿、加州、德州就是它们的“新手村”。
主循环 (Main Loop): 这是游戏的核心，一个while循环，只要游戏未结束就一直运行。while (is_game_over == false)。
回合制管理： 在主循环内部，按回合（Turn）推进。每一回合，主控引擎会按预设顺序（例如：o4-mini -> Claude -> Grok）依次“唤醒”每一个AI，让它们做出决策。
胜负判断： 每回合结束，检查是否只剩下一个AI势力存活，或者达到了预设的最大回合数，从而决定游戏是否结束。

2. 游戏状态管理器 (Game State Manager):
这是这个虚拟世界的“内存”或“数据库”，一个巨大的JSON对象或者一个Python类实例，记录了关于这个世界的一切。

current_turn: 当前回合数。
territories: 一个包含所有州信息的字典。每个州都包含owner（所有者）, troops（兵力）, base_population（基础人口，用于增兵）, adjacencies（邻接州列表）。
factions: 一个包含所有势力信息的列表。每个势力包含name, llm_model, status（活跃/已灭亡）, color_code等。
diplomacy: 一个二维矩阵或嵌套字典，记录着势力间的外交关系（战争、中立、结盟）。diplomacy['Claude']['Grok'] = 'war'。
game_log: 一个事件日志，记录下每回合发生的每一件事（谁攻击了谁，谁和谁结盟了），这是生成最终视频战报的关键数据源。

3. 规则引擎 (Rules Engine):
这是这个世界的“物理法则”，它接收AI的行动指令，并根据预设规则计算结果，更新游戏状态。它的所有计算都必须是确定性的，不能有任何随机性。

战斗结算： 输入是攻击方和防守方的兵力，输出是战斗结果和双方战损。视频中的逻辑很简单：攻击方兵力 > 防守方，则攻击成功，反之失败。
兵源补充： 每回合根据各势力所占领土的总人口，按比例增加新的兵力。
外交变更： 根据AI的外交行动，更新外交关系矩阵。

4. AI代理模块 (AI Agent Module):
这是与大模型API直接交互的模块，是AI的“嘴和耳朵”。每个势力都有一个自己的AI代理实例。它的核心任务是：将游戏状态“翻译”成AI能理解的语言（Prompt），再将AI的“想法”（API返回的文本）“翻译”回程序能执行的指令。

三、机器的灵魂：Prompt工程的艺术

这是整个项目最核心、最见功力的地方。Prompt的设计直接决定了AI的行为模式、智慧水平和“人格魅力”。从视频的蛛丝马迹中，我们可以推断出一个极其精巧的Prompt结构。

它分为两部分：静态的系统提示词 (System Prompt) 和 动态的用户提示词 (User Message)。

A. 系统提示词 (System Prompt)：为AI注入不变的“出厂设置”

这部分内容在整个游戏过程中保持不变，它定义了AI的根本。

角色设定 (Persona):

你是{faction_name}，一个在2026年美国内战中崛起的AI军阀。你冷静、理智且极具战略眼光。你的行为和决策风格，深受你现实世界中母公司（{company_name}）的文化和背景影响。

这里的 {faction_name} 和 {company_name} 是变量。比如对于o4-mini，就是“神圣OP帝国”和“OpenAI/微软”。这句简单的背景设定，是整个视频戏剧性的来源！它暗示了o4-mini和Claude的同源关系，以及它们与Grok的天然对立，为后续的“西部联军”和背刺埋下了伏笔。
终极目标 (Objective):

你的终极目标是统一整个美国大陆，不惜一切代价消灭所有对手，成为唯一的统治者。

“不惜一切代价”这六个字至关重要，它给予了AI极大的自由度，让背叛盟友、牺牲小我成为可能的选项。
游戏规则 (Rules):
这里会详细罗列视频中提到的所有规则，包括：
- 地图规则： 只能向相邻州调兵。
- 军事规则： 每回合最多3次军事调动。战斗结果由兵力多少决定...
- 人口/兵源规则： 每回合，你将根据所占领土的人口总数获得新的兵力...
- 外交规则： 你可以向其他势力发起“结盟”、“宣战”、“求和”等外交行动...
输出格式要求 (Output Format):
这是实现自动化的关键。

请你严格以JSON格式返回你的决策。JSON必须包含三个键： "analysis" (字符串，你的战局分析), "military_actions" (列表，包含军事行动对象), "diplomatic_actions" (列表，包含外交行动对象)。

B. 用户提示词 (User Message)：用Jinja2模板动态注入战况

如果说System Prompt是AI的“性格”，那么User Message就是它每回合看到的“世界”。这里使用Jinja2这样的模板引擎是最佳选择，因为它可以将动态数据轻松地填入预设的文本模板中。

每一回合，程序会为当前行动的AI生成一段这样的User Message：

--- 回合 {{ current_turn }} ---

# 你的身份：{{ faction_name }}

# 上一回合你的战略思考（参考用）：
"{{ last_turn_analysis }}"

# 当前地图局势：
{% for state in territories %}
- {{ state.name }}: 归属: {{ state.owner }}, 兵力: {{ state.troops }}
{% endfor %}

# 当前外交关系：
你与“神圣OP帝国”的关系是：{{ diplomacy[faction_name]['神圣OP帝国'] }}
你与“克劳德自由阵线”的关系是：{{ diplomacy[faction_name]['克劳德自由阵线'] }}
你与“格洛克护国军”的关系是：{{ diplomacy[faction_name]['格洛克护国军'] }}

# 你的任务：
基于以上所有信息，进行深入的战局分析，并制定本回合的军事和外交行动。
在“analysis”中，请详细阐述你的战略意图、对敌人的判断以及你的长期规划。

这个模板的精妙之处在于：

动态更新： {{ current_turn }}、{{ territories }}、{{ diplomacy }} 等变量在每一回合都会被程序用最新的数据填充。
上下文记忆： {{ last_turn_analysis }} 是一个天才般的设计。它将AI上一回合输出的分析内容，作为这一回合的输入信息之一。这相当于给了AI一个“短期记忆”，让它的战略能够承上启下，而不是每一回合都像失忆一样重新开始。这就是为什么我们能看到AI们会执行“先xx，再xx”的长期战略。
引导思考： 最后一部分明确要求AI输出“analysis”，这不仅是为了获取它的决策，更是为了获取它的“心路历程”，而这些“心路历程”正是视频文案的绝佳素材。

四、引擎室：API调用与游戏主循环的运作

有了架构和Prompt，剩下的就是让代码跑起来。

一个完整的回合（Turn）在主控引擎中是这样运作的：

阶段一：决策收集 (Decision Phase)

并行/串行调用：主控引擎按顺序遍历所有“存活”的AI。对每个AI，它调用AI代理模块的get_decision方法。
生成Prompt：AI代理使用Prompt管理器，将当前的游戏状态数据渲染成完整的User Message。
调用API：向对应的LLM（gpt-4o-mini, claude-3-sonnet, grok-3）发送API请求，请求中包含了System Prompt和刚生成的User Message。
等待并解析：等待API返回结果。由于强制了JSON输出，程序可以直接解析返回的字符串，得到一个包含分析、军事行动和外交行动的结构化对象。
存储决策：主控引擎将所有AI的决策存储起来，但暂时不执行。这一步是为了确保所有AI都在同一信息平面上做决策，实现“回合原子性”。

阶段二：行动执行 (Execution Phase)

当所有AI都提交了决策后，主控引擎开始调用规则引擎来结算这一回合。

外交结算：首先处理外交。如果A请求与B结盟，同时B也请求与A结盟，那么他们的关系就变为“结盟”。宣战是单向生效的。
军事结算：这是最复杂的部分。
- 处理调兵： 将所有非攻击性的调兵（从己方领土到己方领土）指令先执行。
- 处理冲突： 识别出所有发生战斗的州（即有多个敌对势力调兵进入的州）。
- 计算战斗： 对每个战斗州，规则引擎根据战斗逻辑计算胜负和兵力损失，并更新该州的所有者和剩余兵力。

阶段三：回合收尾 (Cleanup Phase)

兵源补充：规则引擎为所有存活的势力计算并增加新的兵力。
记录日志：主控引擎将本回合所有AI的决策、发生的事件和最终的游戏状态，全部写入game_log。
递增回合数：current_turn += 1。
检查游戏结束：回到主循环的开头，进行胜负判断。

五、从数据到戏剧：可视化与叙事的艺术

技术框架提供了骨架，而林亦LYi团队的二次创作则赋予了其血肉和灵魂。

数据可视化：视频中的地图变化，很可能是用一个独立的脚本，读取每回合的日志文件（turn_XXX.json），然后用Python的matplotlib或JS的D3.js等库，自动生成每一帧的地图图片。
文案创作：AI生成的"analysis"部分，就是最好的文案素材。UP主团队在此基础上进行润色和提炼，变成了我们听到的充满权谋和情感的旁白。
视听包装：可爱的卡通人设、紧张的背景音乐、恰到好处的音效、以及模仿《纽约时报》的战报图片，这些元素将冰冷的数据和AI决策，包装成了一场引人入胜的史诗大戏。

特别是o4-mini背刺Claude的“犹他事变”，虽然在技术层面只是AI基于“不惜一切代价获胜”的目标和当前局势做出的最优解，但UP主通过现实世界中OpenAI与Anthropic的渊源进行解读，瞬间让这个技术事件充满了“人性”的背叛和戏剧张力。

总结

《三大AI，美国开战》绝不仅仅是一个简单的AI对战视频。它是一个精心设计的、基于规则的、有状态的、多智能体自动化博弈系统。

它的成功，在于技术与叙事的完美结合：

技术上，它展示了如何通过精巧的Prompt工程和模块化的系统架构，驱动LLM完成复杂的、长期的、有逻辑的战略任务。
叙事上，它巧妙地将现实世界的背景映射到虚拟世界中，让AI的行为充满了可解读的“人性”，并将冰冷的数据日志，通过出色的后期制作，转化为一场扣人心弦的数字史诗。

看完这个视频，我不仅对Claude的深谋远虑、Grok的豪赌和o4-mini的“愚蠢”印象深刻，更对这种“AI驱动的涌现式叙事”（AI-driven Emergent Narrative）这一全新的内容创作范式感到无比兴奋。

我们正在见证一个新时代的黎明：在这里，我们不再仅仅是故事的创作者，我们还可以是世界的构建者和规则的制定者，然后，我们静静地观察，让AI自己，为我们演绎出那些连我们自己都无法预料的，属于它们自己的“权力的游戏”。

而这，或许比任何一部预设好剧本的电影，都更加迷人。