KMP(Knuth-Morris-Pratt)算法是一种用于字符串匹配的著名算法,其核心思想是利用已经匹配的信息来避免做无用的比较,从而提高匹配效率。下面,我将通过C++代码来详细介绍KMP算法的实现过程。
首先,我们需要了解KMP算法的几个关键概念:
-
前缀函数(Prefix Function):对于一个给定的字符串
s
,前缀函数π[i]
定义为s
的前缀(即s[0..i]
)中最长相等的前缀后缀的长度。例如,如果s
是"ababaca",那么π
数组将是[0, 0, 1, 2, 3, 0, 1]
。 -
Border(Border):在KMP算法中,Border是指已经匹配的子串的最长前缀,也是后缀。例如,在字符串"ababa"中,border是"ab"。
现在,我们开始看代码:
#include <iostream>
#include <string>
#include <vector>
// 计算前缀函数
std::vector<int> computePrefixFunction(const std::string& pattern) {
int m = pattern.size();
std::vector<int> pi(m);
pi = 0; // 第一个字符的前缀函数值为0
int k = 0; // Border的长度
for (int q = 1; q < m; q++) {
// 找到Border的最大长度k,使得pattern[k]与pattern[q]匹配
while (k > 0 && pattern[k] != pattern[q]) {
k = p