全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

C++怎么实现一个AC自动机_C++高效解决多模式串匹配问题的算法

AC自动机通过构建Trie树、失败指针和执行匹配实现高效多模式串查找,时间复杂度为O(n + m + z),适用于大规模关键词匹配。

AC自动机(Aho-Corasick Automaton)是一种用于高效解决多模式串匹配的经典算法。当需要在一个主串中查找多个模式串是否出现时,使用AC自动机比逐个进行KMP或暴力匹配要高效得多。C++实现AC自动机主要包含三个步骤:构建Trie树、构建失败指针(fail指针)、执行匹配。

构建Trie树

将所有模式串插入到Trie树中,每个节点代表一个字符,路径从根到叶表示一个完整的模式串。同时在每个节点记录是否为某个模式串的结尾,并保存对应的模式串编号或出现次数。

- 每个节点用数组或map存储子节点指针 - 设置一个标记变量表示该节点是否为某个模式串的结束 - 可额外记录模式串索引或数量

示例结构:

struct Node {
    int next[26]; // 假设只有小写字母
    bool isEnd;
    int id;       // 模式串编号
    Node() {
        fill(next, next + 26, -1);
        isEnd = false;
        id = -1;
    }
};
vector trie(1); // 初始化根节点

构建失败指针(Fail指针)

失败指针的作用类似于KMP中的next数组,用于在匹配失败时跳转到最长公共前后缀的位置。通过BFS遍历Trie树来构建fail指针。

- 根节点的所有直接子节点的fail指向根 - 对于当前节点u的子节点v,查找trie[u].fail对应节点是否有相同字符的子节点 - 如果有,则v的fail指向那个子节点;否则继续沿fail链向上找 - 若最终没找到,指向根节点

BFS过程伪代码逻辑:

queue q;
for (int i = 0; i < 26; ++i) {
    if (trie[0].next[i] != -1) {
        int child = trie[0].next[i];
        fail[child] = 0;
        q.push(child);
    }
}
while (!q.empty()) {
    int u = q.front(); q.pop();
    for (int i = 0; i < 26; ++i) {
        int &v = trie[u].next[i];
        int f = fail[u];
        if (v != -1) {
            while (f != -1 && trie[f].next[i] == -1) f = fail[f];
            fail[v] = (f == -1) ? 0 : trie[f].next[i];
            q.push(v);
        }
    }
}

执行多模式匹配

从主串第一个字符开始,在Trie树上逐字符转移状态。如果当前节点没有对应子节点,则通过fail指针回溯,直到可以转移或回到根节点。

- 遍历主串每个字符c - 当前状态为cur,尝试转移到trie[cur].next[c-'a'] - 若无法转移,通过fail链寻找可转移位置 - 每到达一个节点,沿fail链回溯所有可能的模式串结尾并记录结果

关键匹配逻辑:

int cur = 0;
for (char c : text) {
    int idx = c - 'a';
    while (cur != -1 && trie[cur].next[idx] == -1)
        cur = fail[cur];
    cur = (cur == -1) ? 0 : trie[cur].next[idx];
int temp = cur;
while (temp != 0) {
    if (trie[temp].isEnd) {
        cout << "Pattern found at position: "
             << i - pattern_len + 1 << endl;
    }
    temp = fail[temp];
}

}

优化建议:

  • 使用静态数组代替vector以提升性能
  • 合并重复模式串避免冗余
  • 在构建fail指针时同时更新输出链(output link),避免每次匹配都遍历fail链

基本上就这些。AC自动机的时间复杂度为O(n + m + z),其中n是主串长度,m是所有模式串总长度,z是匹配次数,非常适合大规模多关键词匹配场景。


# node  # ai  # c++  # asic  # 指针  # map  # 算法  # 关键词  # 遍历  # 多模  # 是一种  # 第一个  # 多个  # 适用于  # 得多  # 现时  # 类似于 


相关文章: javascript基本数据类型及类型检测常用方法小结  小型网站制作HTML,*游戏网站怎么搭建?  建站主机选购指南:核心配置优化与品牌推荐方案  免费ppt制作网站,有没有值得推荐的免费PPT网站?  如何制作一个表白网站视频,关于勇敢表白的小标题?  如何选择域名并搭建高效网站?  如何在服务器上三步完成建站并提升流量?  移动端手机网站制作软件,掌上时代,移动端网站的谷歌SEO该如何做?  网站图片在线制作软件,怎么在图片上做链接?  盘锦网站制作公司,盘锦大洼有多少5G网站?  成都网站制作价格表,现在成都广电的单独网络宽带有多少的,资费是什么情况呢?  自助网站制作软件,个人如何自助建网站?  如何高效利用200m空间完成建站?  建站VPS推荐:2025年高性能服务器配置指南  建站之星CMS建站配置指南:模板选择与SEO优化技巧  如何在VPS电脑上快速搭建网站?  建站之星安装失败:服务器环境不兼容?  Android滚轮选择时间控件使用详解  极客网站有哪些,DoNews、36氪、爱范儿、虎嗅、雷锋网、极客公园这些互联网媒体网站有什么差异?  nginx修改上传文件大小限制的方法  如何用腾讯建站主机快速创建免费网站?  公众号网站制作网页,微信公众号怎么制作?  学生网站制作软件,一个12岁的学生写小说,应该去什么样的网站?  定制建站平台哪家好?企业官网搭建与快速建站方案推荐  微信h5制作网站有哪些,免费微信H5页面制作工具?  如何在Windows环境下新建FTP站点并设置权限?  威客平台建站流程解析:高效搭建教程与设计优化方案  东莞市网站制作公司有哪些,东莞找工作用什么网站好?  香港服务器WordPress建站指南:SEO优化与高效部署策略  东莞专业制作网站的公司,东莞大学生网的网址是什么?  建站之星安装步骤有哪些常见问题?  三星网站视频制作教程下载,三星w23网页如何全屏?  为什么Go需要go mod文件_Go go mod文件作用说明  公司网站制作需要多少钱,找人做公司网站需要多少钱?  潍坊网站制作公司有哪些,潍坊哪家招聘网站好?  如何通过FTP服务器快速搭建网站?  在线ppt制作网站有哪些软件,如何把网页的内容做成ppt?  测试制作网站有哪些,测试性取向的权威测试或者网站?  重庆市网站制作公司,重庆招聘网站哪个好?  如何在腾讯云服务器上快速搭建个人网站?  香港服务器租用费用高吗?如何避免常见误区?  深圳网站制作费用多少钱,读秀,深圳文献港这样的网站很多只提供网上试读,但有些人只要提供试读的文章就能全篇下载,这个是怎么弄的?  如何基于PHP生成高效IDC网络公司建站源码?  建站之星2.7模板快速切换与批量管理功能操作指南  香港服务器租用每月最低只需15元?  怀化网站制作公司,怀化新生儿上户网上办理流程?  C#怎么创建控制台应用 C# Console App项目创建方法  在线制作视频网站免费,都有哪些好的动漫网站?  南宁网站建设制作定制,南宁网站建设可以定制吗?  北京网站制作费用多少,建立一个公司网站的费用.有哪些部分,分别要多少钱? 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。