1. 实验目的及要求
1、 目的
通过设计、编制、调试一个具体的词法分析程序,加深对词法分析原理
的理解,并掌握在对程序设计语言源程序进行扫描过程中将其分解为各
类单词的词法分析方法。
2、 要求
根据具体情况,由同学们自己选取 C 语言的一个适当大小的子集
(可取一类典型单词,也可以尽可能使各种类型的单词都兼顾到);
在实习前一定要制出相应的表。
实验时间:4-8 学时
检查内容及时间:A)完整的实验报告。
B)在机器上调试成功的源程序。
3、 软件、硬件环境
Visual studio 2010 ,Windows 7 操作系统
计算机一台
2.实验步骤
分析
对于单词符号我们将其分成四类:保留字K、标识符I、常数C和界符P,每类单词
符号均可使用一张表格表示.在词法分析过程中,保留字K和界符P这两个表格的内
容是固定不变的(由语言确定),源程序字符串只能从其中选取,而标识符I、常数
C这两表是在分析过程中不断形成的.
对于一个具体源程序而言,在扫描字符串时识别出一个单词,若这个单词的类型
是K、I、C或P中之一,那么就以单词的二元式形式输出.每次调用词法分析程序,
它均能自动继续扫描下去,形成下一个单词,直到整个源程序全部扫描完毕,从而形
成相应的单词串.
各类单词的二元式表述均具有相同的结构与长度,形式如下:
(单词种别t,单词自身的值i)
t是单词种别,而单词种别共分为K、I、C、P四类且每类对应一张表格.因此,
t实际上就是一个指向这四类中某一类对应表格的指针.i则为指向该类表格中一个
特定项目的指针.
所以整个的词法分析过程就是从源程序中获得一个个的单词符号,将这些符号分
别填入四张类表中,并且有一个二元式序列构成一个索引,这个索引为以后的语法分
析提供处理上的方便.
为了减少实习量,可以适量地选取K,P中的一个子集来进行.如下表:
表 1 保留字K表
内部地址
1 2 3 4 5 6 7 8 9 10
保 留 字
for while
表 2 界符P表
内
部
1 2 3 4 5 6 7 8 9 1
0
1
1
1
2
1
3
1
4
1
5
1
6
1
7
18