正则生成器编译成易语言elalr语法分析代码

易语言 2020-08-21 16:40:49

正则生成器编译成易语言elalr语法分析代码

通过这样的文法 LALR(1)可以描述几乎所有的CFG文法 也就是说可以解析 HTML JSON XML C/C++ JAVA 基本上所有的语言 网上也有很多他们的文法 可以比着写一下
%左结合 '+' '-' '*' '/'; //定义优先级与结合性

%开始符 表达式; // 这句的意思是 文法的开始就是 '表达式'

表达式 -> 表达式 '+' 表达式 [表达式_相加] | // 这是表达式的5个产生式 也就是说表达式可以用5种格式组成 [] 中包括的内容就是遇到这个形式的产生式将会调用什么子程序
表达式 '-' 表达式 [表达式_相减] |
表达式 '*' 表达式 [表达式_相乘] |
表达式 '/' 表达式 [表达式_相除] |
'(' 表达式 ')' [表达式_括号] ;
表达式 -> 数字 | 函数调用 ; // 这里是表达式的另外两个产生式 表达式可以是函数调用 也可以是数字

数字 -> "[0-9]+" [表达式_值] ;

函数调用 -> 标识符 '(' 参数列表 ')' [表达式_函数调用] ; // 函数调用的产生式 用来表述函数调用的形式

参数列表 -> 参数列表 ',' 表达式 [参数表_加入] | // 这个产生式是左递归的 只要后面出现 ',' 就会调用 参数表_加入 向数据中加入后面的表达式 表达式 [参数表_创建] ;
标识符 -> "([a-zA-Z_]|[\x81-\xfe][\x40-\xfe])([a-zA-Z0-9_]|[\x81-\xfe][\x40-\xfe])*"; // 中文标识符

'xxx' 单引号包裹的是 文本字面量 如 'if' 注意:内含转义
"xxx" 双引号包裹的是正则表达式
bracket
支持的正则语法比较简单 但也可以描述大部分正则了 不支持negative bracket。