五子棋

🎯 引言：博弈论与人工智能

历史背景

博弈论的数学基础可追溯到 1928年 冯·诺依曼（John von Neumann）的极小化极大定理。1950年代，克劳德·香农（Claude Shannon）首次提出计算机下棋的理论框架。

💡

趣味知识：1997年，IBM的"深蓝"击败国际象棋世界冠军卡斯帕罗夫，每秒可评估2亿个棋局位置。而我们的五子棋AI在你的浏览器中运行，每秒约评估数万个位置！

零和博弈 (Zero-Sum Game)

五子棋属于二人零和完全信息博弈：

零和：一方的收益等于另一方的损失
完全信息：双方都能看到棋盘全貌
确定性：没有随机因素（如掷骰子）

V(玩家A) + V(玩家B) = 0

其中 V 表示局面价值

📊 评分算法 (Position Scoring)

简单模式 / 中等模式

算法起源

评分算法是最直观的AI策略，源于人类棋手的经验总结。早在1970年代的早期电脑游戏中就已广泛使用，至今仍是许多棋类AI的基础。

核心原理

为棋盘上每个空位计算一个分数，分数越高表示该位置越有价值。分数由两部分组成：

Score(p) = α · Attack(p) + β · Defense(p)

p = 位置坐标
Attack(p) = 进攻价值（我方在此落子的收益）
Defense(p) = 防守价值（阻止对手在此落子的收益）
α, β = 权重系数（中等模式：α=1.1, β=1.0）

棋型分值表

棋型	形态	分值
连五	●●●●●	10,000,000
活四	○●●●●○	1,000,000
冲四	●●●●○ 或 ●●●○●	100,000
活三	○●●●○	80,000
眠三	●●●○○	2,000
活二	○●●○	1,000
眠二	●●○○	200
活一	○●●○	50

● = 棋子，○ = 空位

示例分析

  A B C D E F G
7 · · · · · · ·
6 · · · ● · · ·
5 · · ● · · · ·
4 · ● · · ○ · ·
3 · · · · · · ·
2 · · · · · · ·

假设黑棋（●）考虑在 D5 位置落子：

形成对角线三子 → 活三(5000分)
该位置进攻价值 Attack(D5) = 5000

🎲

简单模式的秘密：为什么简单模式更"笨"？它通常从得分最高的前3个位置中随机选择，模拟人类"手滑"。但在面临必杀或必防局面时，它会变得警觉！

🌳 极小化极大算法 (Minimax)

困难模式

算法起源

1928年，数学家冯·诺依曼证明了极小化极大定理，奠定了博弈论的数学基础。该算法成为AI博弈领域的基石，几乎所有棋类AI都基于此原理。

🏆

历史时刻：1997年国际象棋、2016年围棋（AlphaGo）、2019年德州扑克——AI在复杂博弈中一次次超越人类，Minimax的变体始终是核心组件。

核心思想

假设双方都是完美理性的：

MAX层（AI）：选择对自己最有利的走法
MIN层（对手）：假设对手也会选择对AI最不利的走法

minimax(s) = { eval(s), 若s是终止状态或深度=0
{ max(minimax(s')), 若是MAX层
{ min(minimax(s')), 若是MIN层

s = 当前状态，s' = 所有可能的后继状态

博弈树示意

                    [MAX] 根节点 (AI选择)
                      │
         ┌────────────┼────────────┐
         ▼            ▼            ▼
      [MIN]        [MIN]        [MIN]  (对手选择)
         │            │            │
      ┌──┴──┐     ┌──┴──┐     ┌──┴──┐
      ▼     ▼     ▼     ▼     ▼     ▼
     [3]   [5]   [2]   [9]   [1]   [6]  (叶子节点评分)

MIN层选择：  3         2         1
MAX层选择：        max(3,2,1) = 3

AI会选择左边分支，因为即使对手最优应对，AI也能保证得分≥3

时间复杂度

O(b^d)

b = 分支因子（每个节点的子节点数）
d = 搜索深度
五子棋：b ≈ 200（空位数），d = 4 → 节点数呈指数级增长

✂️ Alpha-Beta 剪枝

困难模式

算法起源

1958年，Allen Newell 和 Herbert Simon 在研究国际象棋程序时首次描述了这一优化技术。1975年，Donald Knuth 和 Ronald Moore 对其进行了严格的数学分析。

核心原理

在Minimax搜索中，很多分支是不必要探索的——因为无论结果如何，都不会影响最终决策。

α = 当前MAX层已找到的最佳选择（下界）
β = 当前MIN层已找到的最佳选择（上界）

剪枝条件： α ≥ β 时停止搜索

剪枝示意

                    [MAX] α=-∞
                      │
         ┌────────────┼────────────┐
         ▼            ▼            ▼
      [MIN]        [MIN]        [MIN]
      β=+∞         β=3
         │            │
      ┌──┴──┐     ┌──┴──┐
      ▼     ▼     ▼     ▼
     [3]   [5]   [2]   ✂️    ← 剪枝！
                  ↑
            发现2 < α(=3)，后续无需搜索

第二个MIN节点发现值为2，小于已知的α=3，无论后续节点值如何，MAX都不会选择这条分支。

效率提升

最优情况：O(b^d/2)
平均情况：O(b^3d/4)

在最优情况下，搜索效率提升至平方根级别！
原本需要40,000节点 → 优化后约200节点

⚡

优化技巧：本游戏还使用了"候选位置筛选"——只考虑得分最高的20个位置，进一步将分支因子从200+降到20！

🔍 棋型识别 (Pattern Recognition)

四方向扫描

对每个位置，AI在四个方向上扫描棋型：

─ 水平

│ 垂直

╲ 主对角线

╱ 副对角线

评估函数伪代码

function evaluateLine(position, direction):
    count = 1          // 连续棋子数
    block = 0          // 被封堵的端点数

    // 正向扫描
    for i = 1 to 4:
        next = position + direction * i
        if next是己方棋子: count++
        else if next是空位: break
        else: block++; break

    // 反向扫描
    for i = 1 to 4:
        next = position - direction * i
        // ... 同上

    // 返回棋型分数
    return getScore(count, block)

选择AI难度

选择你的棋子

📖 五子棋AI算法说明书

目录

🎯 引言：博弈论与人工智能

历史背景

零和博弈 (Zero-Sum Game)

📊 评分算法 (Position Scoring)

算法起源

核心原理

棋型分值表

示例分析

🌳 极小化极大算法 (Minimax)

算法起源

核心思想

博弈树示意

时间复杂度

✂️ Alpha-Beta 剪枝

算法起源

核心原理

剪枝示意

效率提升

🔍 棋型识别 (Pattern Recognition)

四方向扫描

评估函数伪代码

五子棋

对局记录