当前位置: 首页 > news >正文

编译原理 实验二 词法分析程序自动生成工具实验

文章目录

  • 实验环境的准备
  • 实验
    • 实验预备知识
    • 分析案例
    • 所要做的任务
    • 实战

实验环境的准备

  • 安装flex
    在这里插入图片描述

  • 安装MinGW
    在这里插入图片描述

  • MinGW Installation Manager页面

在这里插入图片描述

  • apply changes

在这里插入图片描述

下载比较耗时

在这里插入图片描述

  • 只看到了一个文件,复制过去

在这里插入图片描述

  • 配置环境变量

在这里插入图片描述

  • 使用gcc -v检验是否安装完成

在这里插入图片描述

实验

实验预备知识

  • 咱们先来分析一下实验到底想让我们干什么!

flex是干什么的

  • flex(Fast Lexical Analyzer Generator)是一个词法分析器生成工具,用于自动生成词法分析器(lexer/scanner)的代码

  • 输入:flex 接收一个 .l(或 .lex)文件,其中定义了词法规则(正则表达式 + 动作)。

  • 输出:生成一个 C 语言 的词法分析器(通常是 lex.yy.c),该代码可以识别输入流中的单词(token)。

  • 用途:主要用于编译器、解释器、文本处理工具等需要分词(tokenization)的场景。

flex 的基本工作原理
# flex 的工作流程:
(1)编写 .l 文件:定义词法规则(正则表达式 + 对应的动作)。
(2)运行 flex:生成 lex.yy.c(词法分析器代码)。
(3)编译 lex.yy.c:生成可执行程序,用于分词。

典型的.l文件

%{
/* C 代码,如头文件、变量声明 */
#include <stdio.h>
%}

/* 正则表达式定义 */
DIGIT    [0-9]
LETTER   [a-zA-Z]

%%
/* 规则部分:模式 + 动作 */
{DIGIT}+    { printf("Number: %s\n", yytext); }
{LETTER}+   { printf("Word: %s\n", yytext); }
[ \t\n]     ;  /* 忽略空白符 */
.           { printf("Unknown: %s\n", yytext); }
%%

/* 可选的 C 代码(如 main 函数) */
int main() {
    yylex();  // 启动词法分析
    return 0;
}

分析案例

  • 实验名称:识别输入文本中的单词(word)和数(num)并分别统计个数

实例.lex代码

%{
/* 全局变量声明部分(C代码块) */
int wordCount = 0;   // 统计单词数量
int numCount = 0;    // 统计数字数量
%}

/* 正则表达式定义部分 */
chars      [A-Za-z\_\'\.\"]    // 匹配字母、下划线、引号等字符
numbers    ([0-9])+           // 匹配一个或多个数字
delim      [" "\n\t]          // 匹配空格、换行、制表符等分隔符
whitespace {delim}+           // 匹配一个或多个分隔符
words      {chars}+           // 匹配一个或多个字符组合(单词)

%% 
/* 规则部分:模式 + 动作 */

/* 当匹配到"while"时,打印该词 */
while  { printf("%s\n", yytext); }

/* 当匹配到单词时,增加单词计数器 */
{words} { 
    wordCount++;     // 单词数量加1
} 

/* 当匹配到空白符时,不执行任何操作 */ 
{whitespace} { 
    /* 空动作:忽略空白字符 */ 
} 

/* 当匹配到数字时,增加数字计数器 */
([0-9])+ { 
    numCount++;      // 数字数量加1
} 

%%  
/* 用户自定义代码部分 */

/* 主函数 */
void main() { 
    printf("ok1\n");          // 调试信息,表示程序开始运行
    yylex();                  // 启动词法分析
    printf("ok2\n");          // 调试信息,表示词法分析结束
    // 打印统计结果
    printf("No of words: %d\nNumber: %d\n", wordCount, numCount);  
    return 0;  
}

/* 必须定义的yywrap函数(当输入文件结束时调用) */
int yywrap() { 
    return 1;  // 返回1表示处理结束
} 

测试的文本:b.c

asd asdf 23 q 
a1 
b2
!#@
while

程序的输出

ok1
!#@while
ok2
No of words: 5
    number: 3
  • 简单分析一下输出结果
(1)这个ok1和ok2都是.lex程序中定义的输出
(2)其中!#@是没哟被匹配到的,所以会默认输出,这个while的话,.lex中规定了,遇到while就输出
(3)统计结果
wordCount = 5(asd, asdf, q, a, b)
numCount = 323, 1, 2

所要做的任务

在这里插入图片描述

  • 说白了,就需要你自己设计这个 a.lex 构词规则序列
  • 然后使用flex来生成词法生成程序lex.yy.c

在这里插入图片描述

flex a.lex 
gcc -o a lex.yy.c -lfl 
  • 自己设计b.c程序
  • 然后使用lex.yy.c来分析b.c

在这里插入图片描述

a.exe <b.c> a.txt 

实战

  • 当然是自己写啦

相关文章:

  • 解决 Ubuntu 上 Docker 安装与网络问题:从禁用 IPv6 到配置代理
  • 【微知】如何将echo某个数据到文件然后cat出来结合在一起输出?(echo 1 | tee filea; cat fileb | tee fila)
  • 【图像生成之22】CVPR024—SwiftBrush基于变分分数蒸馏的文生图扩散模型
  • LeetCode hot 100—不同路径
  • 软考 系统架构设计师系列知识点之杂项集萃(49)
  • 【力扣hot100题】(093)最长公共子序列
  • 基于 Vue 3 + Express 的网盘资源搜索与转存工具,支持响应式布局,移动端与PC完美适配
  • 关于 Spring Boot 监控方式的详细对比说明及总结表格
  • CAN总线发送方每发送一位,接收方接收一位,但是当在非破坏性仲裁方式失利的情况下是否还能够正确接收数据呢?
  • 【C语言-全局变量】
  • Linux:进程优先级的理解
  • 对话记忆(Conversational Memory)
  • 《汽车电器与电子技术》实验报告
  • HotSpot虚拟机中对象的访问定位机制是怎样的?
  • Python实现贪吃蛇一
  • 定制一款国密浏览器(6):初识国密算法
  • sql查询时对null的处理
  • txt、Csv、Excel、JSON、SQL文件读取(Python)
  • Vuex Actions 多参数传递的解决方案及介绍
  • vivado + modelsim 仿真:Post-Synthesis Timing Simulation
  • 徐汇区b2b"b2c行业门户网站开发_电子商业门户网站建设/抖音seo关键词优化怎么做
  • 网站程序源代码/高质量外链购买
  • 奉贤宜昌网站建设/国内十大软件培训机构
  • 网站如何做传输网盘/网站开通
  • 怎么使用vs2017做网站/网络营销网站推广方法
  • 哪种网站/网站百度收录突然消失了