【编译原理】语法分析之分析策略

甜瓜瓜哥

已于 2023-02-23 21:38:17 修改

阅读量290

点赞数

CC 4.0 BY-SA版权

分类专栏：课堂笔记文章标签：编辑器

于 2022-12-03 15:19:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46130027/article/details/128153378

课堂笔记专栏收录该内容

35 篇文章

订阅专栏

本文介绍了语法分析的基本概念，包括语法分析的目的、分析树的构建、两种解析策略（自顶向下与自底向上），以及解析策略的标准。通过本文，读者可以了解如何构建解析树、识别语法错误，并理解不同解析策略的特点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 语法分析的目的

构建一个解析树或语法树

根：独特的符号，“< program >"或其他
叶子：词法分析阶段的tokens序列
树中的每个分支点都由语法规则认可
可能同时执行语义检查
这个阶段可以一次一位地生成一系列机器代码指令或程序的其他中间形式
如果程序的语法无效，请尽可能多地给出有用的错误消息

识别比单词更大的单位

单位表示语法结构
表达式、函数、声明

基于词汇分析，根据语法规则。例如
A:=x + 3.14*y

指出语法错误
生成内部表达式以便进行语义处理

2. 分析树

根：语法起始符号
内部节点：有一个或多个孩子
叶子：没有孩子

3. 两种解析策略

搜索问题 – 给定根和叶，在它们之间找到适当的标记分支点

自顶向下解析策略
从顶部开始搜索，从< program >开始，尝试向下搜索填充在树中的树叶。

自下而上的解析策略
从词汇分析阶段的叶子序列开始，在我们朝着＜program＞的方向前进时，尝试构建树的一部分。

4. 语法分析器

语法分析器决定了程序的机构。
语法分析的结果是解析树或语法树。

解析树:
在这里插入图片描述

5. 语法分析的两种句法分析策略

自上而下分析 LL（1）/** k =1 **/

第一个L代表从左边开始扫描
第二个L表示产生最左推导
数字1表示每一步推导式只需要向后看一个符号就可以

自下而上分析LR（0）/** k =0 **/

第一个L代表从左边开始扫描
第二个R代表最右推导的逆过程
数字0表示向右查看0个字符

语法分析的概念
形式上，对于指定的字符串α，识别它是否是指定语法G(Z)的句子。

解析策略的标准
力量
回退
预测
效率
小规模

解析策略的标准-力量
必须足够强大，以便分析语言。

Earley和CYK可以用于任何上下文无关的语法。

当我们为新的编程语言编写语法时，我们必须检查语法是否与所提出的解析策略兼容。如果没有，我们必须以适当的方式修改语法。

解析策略的标准-回退
一些解析策略涉及反向跟踪。

当解析器确定先前关于解析树某部分的形式的决定是错误的时，它会返回到该决定，并以不同的方式重新执行该决定。

反向跟踪效率很低，因为它需要解析器对输入流进行多次传递。

但该决定的任何后果也必须以某种方式扭转。

从符号表中删除或修改的条目
删除生成的机器/中间代码
等等

一旦对输入程序的某一部分的形式做出决定，就永远不会修改。

本模块中的技术不需要反向跟踪。

解析策略的标准-向前看
回退的另一种选择是向前看，当解析器需要做出决定时，它会查看输入流中接下来的几个标记，以帮助做出正确的决定。

原则上，解析器可以沿着输入程序任意地看得很远，也许可以一直看到底，但这可能效率很低。

我们希望尽量减少向前看。

两种策略都涉及一定的前瞻性，但它们通常需要最多一个前瞻性符号。

当做出决定时，解析器只允许查看来自词法分析器的下一个输入标记。这对于普通编程语言来说通常足够了。

解析策略的标准-效率
需要与程序长度成比例的时间。

解析策略是O（n）算法，其中n是输入字符串的长度。

解析策略的标准-小规模
如果解析器也可以很小，那就太好了，但现在问题不大了，因为存储非常便宜。

一些版本的最佳解析策略实际上可以生成非常大的表，以向解析器指定在每种情况下要做什么。如果我们在一台小型机器上工作，就必须避免这种情况。

自上而下分析
从顶部（根）到底部（叶）构造解析树。

通常从符号S开始的过程导出字符串w。

如果每个字符串都在树叶上，那么这个句子就被接受了。

在每一步中，我们应该有两个选择：

应替换哪个非终端
这个非终端产品应该用哪个来替代

两种解析策略
两组主要的解析策略，称为LL(K)和LR(K)

第一个L表示从左到右处理令牌的输入流

k是允许的前瞻tokens的数量，结果通常是0或1

第二个字母指定解析器生成的派生类型

LL(k)解析器产生最左边的派生，是一个自顶向下的解析器。

LR(k)解析器产生最右边的派生，是一种自下而上的方法。

LL(k)和LR(k)不像Early和CYK那样完整，但幸运的是足以处理大多数PL语法。

Thanks to Dr. John: Some contents are from their slides.

博客等级

码龄6年

1041
原创

1746
点赞

2378
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Java基础学习导论

下一篇：: Java基础语法之面向对象

最新评论

Dubbo和OpenFeign及Http和RPC的区别
甜瓜瓜哥: 我书写有误，现已修改，感谢指正~
Dubbo和OpenFeign及Http和RPC的区别
weixin_42277890: Open Feign用的http，为啥说它是RPC框架那？
线程池是如何管理线程的
暴龙战士呦: 说了等于没说
幻读及其解决方法
ad10086112: 应该说的更具体一点，第一次查询这个数据时的范围中（相当于第一次select而进行快照读），第二次查询时数据不一致，不只余插入操作，而事务本身进行当前读与第一次进行的快照读数据不一致也是幻读，幻读的重点在于数据不一致，查询到了最新的数据。所以需要在具体业务上查看需要加锁的实情。
幻读及其解决方法
ad10086112: 我认为幻读应该是在可重复读的隔离级别下也就是mvcc版本控制下两次操作的情况不一致，违背事务的一致性的情况，比如事务1 count(*)一次，而事务2插入了一条数据，这样违背了事务的一致性，又比如事务1不进行快照读进行了当前读又违背了事务的一致性，而对于事务幻读的情况应该考虑具体业务实际情况而加间隙锁。

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。