有限自动机（Finite Automaton，FA）是计算理论中的基础模型，用于描述系统在有限状态下的行为和状态转移逻辑

原创于 2025-06-15 13:24:33 发布 · 1k 阅读

30 ·

CC 4.0 BY-SA版权

文章标签：

#系统架构

Structured(design engineering) 同时被 3 个专栏收录

451 篇文章

订阅专栏

Java Card(Java Card Platform)

130 篇文章

订阅专栏

Lock(Mutual Exclusion THREADS)

106 篇文章

订阅专栏

有限自动机（Finite Automaton，FA）是计算理论中的基础模型，用于描述系统在有限状态下的行为和状态转移逻辑，在编译原理、人工智能、形式语言等领域有广泛应用。以下从定义、分类、数学模型、应用等方面详细介绍：

一、有限自动机的定义与核心概念

有限自动机是一种具有离散输入输出的数学计算模型，它能根据输入序列从一个状态转移到另一个状态，最终通过状态判断输入是否被接受。其核心要素包括：

状态集合（States, Q）：有限个状态的集合，每个状态表示系统当前的状态。
输入字母表（Input Alphabet, Σ）：有限个输入符号的集合。
转移函数（Transition Function, δ）：定义状态转移规则，即从当前状态和输入符号，确定下一个状态。
初始状态（Initial State, q₀）：系统开始时的状态，属于状态集合Q。
接受状态集合（Accept States, F）：若自动机处理完输入后停在该集合中的状态，则输入被接受。

二、有限自动机的分类

根据转移函数的确定性，有限自动机主要分为两类：

1. 确定有限自动机（Deterministic Finite Automaton, DFA）

特点：对于每个状态和输入符号，转移函数δ唯一确定下一个状态。
数学定义：五元组 ( M = (Q, Σ, δ, q₀, F) )。
示例：
若DFA用于识别以“0”结尾的二进制串，状态可定义为：
- ( Q = {q₀, q₁} )（( q₀ )：初始状态，未读到“0”；( q₁ )：读到过“0”）
- ( Σ = {0, 1} )
- 转移函数：
  ( δ(q₀, 0) = q₁ ), ( δ(q₀, 1) = q₀ )
  ( δ(q₁, 0) = q₁ ), ( δ(q₁, 1) = q₁ )
- ( F = {q₁} )（以“0”结尾时处于( q₁ )）。

2. 非确定有限自动机（Nondeterministic Finite Automaton, NFA）

特点：对于同一状态和输入符号，可能转移到多个状态，或无需输入即可转移（ε转移）。
数学定义：五元组 ( M = (Q, Σ, δ, q₀, F) )，但δ的输出是状态的子集（允许多转移或ε转移）。
示例：
识别包含“01”子串的二进制串，可通过ε转移简化设计：
- ( Q = {q₀, q₁, q₂} )（( q₀ )：初始；( q₁ )：读到“0”；( q₂ )：读到“01”）
- 转移函数：
  ( δ(q₀, 0) = {q₀, q₁} ), ( δ(q₀, 1) = {q₀} )
  ( δ(q₁, 1) = {q₂} ), ( δ(q₁, 0) = {q₁} )
  ( δ(q₂, 0/1) = {q₂} )
- ( F = {q₂} )。

3. DFA与NFA的关系

等价性：任何NFA都可以转换为等价的DFA（通过“子集构造法”），但DFA是NFA的特例。
转换示例：将NFA转换为DFA时，DFA的每个状态对应NFA的一个状态子集（即NFA可能到达的所有状态组合）。

三、有限自动机的数学模型与表示方法

1. 状态转移图（Transition Diagram）

图形化表示：用节点表示状态，有向边表示转移（边标注输入符号），双圈节点表示接受状态。
示例：识别“0*1”（任意个0后接1）的DFA状态图：
- ( q₀ )（初始）：输入0→( q₀ )，输入1→( q₁ )（接受状态）
- ( q₁ )：输入0/1→保持( q₁ )。

2. 状态转移表（Transition Table）

表格形式：行表示当前状态，列表示输入符号，单元格表示转移后的状态。
示例：上述“0*1”DFA的转移表：
当前状态输入0 输入1
( q₀ ) ( q₀ ) ( q₁ )
( q₁ ) ( q₁ ) ( q₁ )

当前状态	输入0	输入1
( q₀ )	( q₀ )	( q₁ )
( q₁ )	( q₁ )	( q₁ )

四、有限自动机的应用场景

1. 编译原理

词法分析器：DFA用于识别单词（如标识符、关键字、常量等），例如：
- 识别整数的DFA：从初始状态读数字→保持数字状态，遇非数字则结束（若为数字则接受）。

2. 文本处理与模式匹配

字符串匹配：NFA可高效识别复杂模式（如正则表达式），例如：
- 用NFA识别包含“ab”或“cd”的字符串，通过ε转移实现多模式并行匹配。

3. 硬件设计与控制系统

数字电路控制：DFA描述有限状态机（FSM），用于电路状态转移逻辑（如时序电路设计）。

4. 自然语言处理与人工智能

句法分析预处理：有限自动机辅助识别句子结构中的词法单元；
简单决策系统：如电梯控制系统，根据楼层按钮输入转移状态（上行、下行、停止）。

五、有限自动机的局限性

无法处理上下文相关语言：例如识别“aⁿbⁿ”（n个a后接n个b）的字符串，需上下文无关文法（如栈自动机）。
状态爆炸问题：复杂逻辑可能导致DFA状态数指数级增长（NFA转DFA时常见），需通过最小化算法优化（如Hopcroft算法）。

六、延伸：有限自动机与正则表达式

等价性：有限自动机与正则表达式可相互转换，均描述正则语言（3型语言）。
转换规则：
- 正则表达式“a|b”对应NFA的两个并行转移；
- 正则表达式“a*”对应NFA的自环（ε转移+输入a循环）。

通过有限自动机，可将抽象的计算逻辑转化为结构化的状态转移模型，是理解计算理论和构建实际系统的重要工具。如需进一步探讨某类自动机的具体实现或应用案例，可深入展开分析。
有限自动机（Finite Automaton，简称 FA）是计算理论中的一种基本模型，用于描述和处理有限状态的机器或系统。它是一种抽象的计算模型，主要用于研究语言的识别、模式匹配以及形式语言的理论基础。以下是关于有限自动机的详细介绍：

1. 基本概念

定义：有限自动机是一种抽象的计算模型，它由有限个状态组成，并且在输入符号的驱动下从一个状态转移到另一个状态。它主要用于识别特定的字符串集合（即语言）。
组成：有限自动机通常由以下几部分组成：
- 状态集合 ( Q )：有限的状态集合，表示自动机在运行过程中可能处于的所有状态。
- 输入字母表 ( \Sigma )：有限的符号集合，表示自动机可以接收的输入符号。
- 转移函数 ( \delta )：描述状态之间的转移关系，通常表示为 ( \delta: Q \times \Sigma \to Q )。它定义了在当前状态下，输入某个符号后，自动机将转移到的下一个状态。
- 初始状态 ( q_0 )：自动机开始运行时所处的状态，属于状态集合 ( Q )。
- 接受状态集合 ( F \subseteq Q )：表示自动机能够接受输入字符串的结束状态集合。

2. 类型

有限自动机主要有两种类型：确定性有限自动机（DFA） 和 非确定性有限自动机（NFA）。

（1）确定性有限自动机（DFA）

特点：对于每个状态和输入符号的组合，DFA 都有且仅有一个确定的转移状态。即转移函数 ( \delta ) 是一个单值函数。
形式化定义：
- ( M = (Q, \Sigma, \delta, q_0, F) )
- 其中 ( Q ) 是状态集合，( \Sigma ) 是输入字母表，( \delta ) 是转移函数，( q_0 ) 是初始状态，( F ) 是接受状态集合。
工作原理：DFA 从初始状态 ( q_0 ) 开始，读取输入字符串中的每个符号，根据转移函数逐步转移到下一个状态。如果输入字符串读取完毕后，自动机处于接受状态集合 ( F ) 中的某个状态，则认为该输入字符串被接受；否则被拒绝。

（2）非确定性有限自动机（NFA）

特点：NFA 允许在某些情况下有多个可能的转移状态，甚至在没有输入符号的情况下也可以发生转移（即空转移，用 ( \epsilon ) 表示）。这使得 NFA 在某些情况下比 DFA 更灵活。
形式化定义：
- ( M = (Q, \Sigma, \delta, q_0, F) )
- 与 DFA 类似，但转移函数 ( \delta ) 的定义有所不同：( \delta: Q \times (\Sigma \cup {\epsilon}) \to \mathcal{P}(Q) )，其中 ( \mathcal{P}(Q) ) 表示 ( Q ) 的幂集，即 ( Q ) 的所有子集。
工作原理：NFA 从初始状态 ( q_0 ) 开始，读取输入字符串中的每个符号。在每一步，NFA 可以根据转移函数选择多个可能的状态之一进行转移。如果存在某种路径使得输入字符串读取完毕后，自动机处于接受状态集合 ( F ) 中的某个状态，则认为该输入字符串被接受；否则被拒绝。

3. DFA 与 NFA 的关系

等价性：虽然 DFA 和 NFA 在形式上有所不同，但它们在表达能力上是等价的。即对于任何 NFA，都可以构造一个等价的 DFA，反之亦然。这种转换称为 子集构造法。
子集构造法：将 NFA 的多个可能状态组合成 DFA 的一个状态。具体步骤如下：
1. 从 NFA 的初始状态开始，计算其所有可能的 ( \epsilon )-闭包（即通过空转移可达的状态集合）。
2. 将这些闭包作为 DFA 的状态。
3. 对于每个 DFA 的状态和每个输入符号，计算 NFA 在这些状态下的所有可能转移，并将这些转移的结果作为 DFA 的新状态。
4. 重复上述过程，直到所有状态都被处理完毕。

4. 应用

语言识别：有限自动机可以用于识别正则语言。正则语言是可以通过正则表达式描述的语言，而有限自动机是正则语言的识别器。
模式匹配：在文本处理和字符串搜索中，有限自动机可以用于快速匹配模式。例如，KMP 算法和 Aho-Corasick 算法都可以通过有限自动机实现高效的模式匹配。
编译原理：在编译器的词法分析阶段，有限自动机用于识别源代码中的单词（如关键字、标识符、数字等）。
硬件设计：有限自动机可以用于设计简单的数字电路，例如状态机。

5. 示例

以下是一个简单的 DFA 示例，用于识别所有以“01”结尾的二进制字符串。

状态集合 ( Q = { q_0, q_1, q_2 } )
输入字母表 ( \Sigma = { 0, 1 } )
转移函数 ( \delta )：
- ( \delta(q_0, 0) = q_0 )
- ( \delta(q_0, 1) = q_1 )
- ( \delta(q_1, 0) = q_2 )
- ( \delta(q_1, 1) = q_1 )
- ( \delta(q_2, 0) = q_0 )
- ( \delta(q_2, 1) = q_1 )
初始状态 ( q_0 )
接受状态集合 ( F = { q_2 } )