当我在Ubuntu Linux中运行这个野牛代码时,我得到以下警告:1shift / reduce conflict [-Wconflicts-sr] 2减少/减少冲突[-Wcolficts-sr]
这是一个更清晰的屏幕截图:http://i.imgur.com/iznzSsn.png
编辑/删除删除了一点θ6:Data_type 101:Function_type
并且shift / reduce错误位于:第129行:entoli_if
我找不到如何修复它们可以有人帮忙吗?
这是下面的野牛代码:
%{
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int totalerrors=0;
extern int yylex();
extern FILE *yyin;
extern int lineno; //Arithmos grammis pou kanei parse
//error handling
void yyerror(const char *msg) {
}
//filling the error array
void printError(char y[],int x){
//param 1: error string
//param 2: line number
char temp[15];
char temp2[5];
char final[256];
sprintf(temp2,"%d: ",x);
strcpy(temp, "In Line ");
strcat(temp,temp2);
strcpy(final,"");
strcat(final,temp);
strcat(final,y);
printf("%d) %s\n",totalerrors+1,final);
totalerrors++;
}
%}
%start start
%token T_sigkritikos_telestis
%token T_typos_dedomenwn
%token T_typos_synartisis
%token T_stathera
%token T_newline
%token T_kefalida_programmatos
%token T_extern
%token T_void
%token T_return
%token T_if
%token T_else
%token T_plus
%token T_minus
%token T_mult
%token T_div
%token T_percentage
%token T_int
%token T_bool
%token T_string
%token T_true
%token T_false
%token T_id
%token T_semic
%token T_comma
%token T_openpar
%token T_closepar
%token T_ampersand
%token T_begin
%token T_end
%token T_excl
%token T_or
%token T_equals
%token T_semileft
%token T_semiright
%%
start: exwterikes_dilwseis T_kefalida_programmatos tmima_orismwn tmima_entolwn;
exwterikes_dilwseis: exwteriko_prwtotypo exwterikes_dilwseis
| ;
exwteriko_prwtotypo: T_extern prwtotypo_synartisis;
tmima_orismwn: orismos tmima_orismwn
| ;
orismos: orismos_metavlitwn
| orismos_synartisis
| prwtotypo_synartisis;
orismos_metavlitwn: typos_dedomenwn lista_metavlitwn T_semic;
typos_dedomenwn: T_int
| T_bool
| T_string;
loop1: T_comma T_id
| ;
lista_metavlitwn: T_id loop1;
orismos_synartisis: kefalida_synartisis tmima_orismwn tmima_entolwn;
prwtotypo_synartisis: kefalida_synartisis T_semic;
kefalida_synartisis: typos_synartisis T_id T_openpar lista_typikwn_parametrwn T_closepar
| typos_synartisis T_id T_openpar T_closepar;
typos_synartisis: T_int
| T_bool
| T_void;
lista_typikwn_parametrwn: typikes_parametroi loop2;
loop2: T_comma typikes_parametroi
| ;
typikes_parametroi: typos_dedomenwn T_ampersand T_id;
tmima_entolwn: T_begin loop3 T_end;
loop3: entoli loop3
| ;
entoli: apli_entoli T_semic
| domimeni_entoli
| sintheti_entoli;
sintheti_entoli: T_semileft loop3 T_semiright;
domimeni_entoli: entoli_if;
apli_entoli: anathesi
| klisi_sunartisis
| entoli_return
| ;
entoli_if: T_if T_openpar geniki_ekfrasi T_closepar entoli else_clause
| T_if T_openpar geniki_ekfrasi T_closepar entoli;
else_clause: T_else entoli;
anathesi: T_id T_equals geniki_ekfrasi;
klisi_sunartisis: T_id T_openpar lista_pragmatikwn_parametrwn T_closepar
| T_id T_openpar T_closepar;
lista_pragmatikwn_parametrwn: pragmatiki_parametros loop4;
loop4: T_semic pragmatiki_parametros loop4
| ;
pragmatiki_parametros: geniki_ekfrasi;
entoli_return: T_return geniki_ekfrasi
| T_return;
geniki_ekfrasi: genikos_oros loop5;
loop5: T_or T_or genikos_oros loop5
| ;
genikos_oros: genikos_paragontas loop6;
loop6: T_ampersand T_ampersand loop6
| ;
genikos_paragontas: T_excl genikos_protos_paragontas
| genikos_protos_paragontas;
genikos_protos_paragontas: apli_ekfrasi tmima_sigrisis
| apli_ekfrasi;
tmima_sigrisis: T_sigkritikos_telestis apli_ekfrasi;
apli_ekfrasi: aplos_oros loop7;
loop7: T_plus aplos_oros loop7
| T_minus aplos_oros loop7
| ;
aplos_oros: aplos_paragontas loop8;
loop8: T_mult aplos_paragontas loop8
| T_div aplos_paragontas loop8
| T_percentage aplos_paragontas loop8
| ;
aplos_paragontas: T_plus aplos_prot_oros
| T_minus aplos_prot_oros
| aplos_prot_oros;
aplos_prot_oros: T_id
| stathera
| klisi_sunartisis
| T_openpar geniki_ekfrasi T_closepar;
stathera: T_true
|T_false;
%%
int main(int argc, char *argv[]){
++argv; --argc; //agnooume to onoma tou exe
if (argc==1) {
FILE *fp = fopen(argv[0],"r");
if (fp!=NULL) {
printf("Reading input from file: %s\n",argv[0]);
printf("Output:\n\n");
yyin = fp;
yyparse();
} else {
printf("File doesn't exist\n");
return 1;
}
} else if (argc>1) {
printf("Only one file allowed for input...\n");
return 1;
} else {
printf ("Parsing from stdin..\n");
yyparse();
}
if (totalerrors==0) {
printf("All good!\n");
printf("===================================\n");
printf("Parsing complete! No errors found!!\n");
} else {
printf("===================================\n");
printf("Total Errors: %d\n",totalerrors);
}
return 0;
}
减少/减少冲突是因为你有两个非终端只存在于不同类型的聚集:
typos_dedomenwn: T_int
| T_bool
| T_string;
typos_synartisis: T_int
| T_bool
| T_string;
在使用这些非终端的情况下,解析器不可能知道应用哪个终端;直到声明的进一步说,它才能分辨出来。但是,没关系。您可以只定义一个typos
非终端,并在整个过程中使用它:
typos: T_int
| T_bool
| T_string;
orismos_metavlitwn: typos lista_metavlitwn T_semic;
kefalida_synartisis: typos T_id T_openpar lista_typikwn_parametrwn T_closepar
| typos T_id T_openpar T_closepar;
typikes_parametroi: typos T_ampersand T_id;
转移/减少冲突是“C”式if
陈述的经典问题。这些陈述难以以不含糊不清的方式描述。考虑:
if (expr1) if (expr2) statement1; else statement2;
我们知道else
必须匹配第二个if
,所以上面相当于:
if (expr1) { if (expr2) statement1; else statement2; }
但语法也与其他可能的解析相匹配,相当于:
if (expr1) { if (expr2) statement1; } else statement2;
这个问题有三种可能的解决方案:
else
可以匹配开放的if
声明,野牛将永远这样做,而不是保持else
以匹配一些外部if
声明。龙书中有很好的描述,以及其他地方。
此解决方案的问题在于您仍然会收到关于转换/减少冲突的警告,并且很难区分“OK”冲突和新创建的“不正常”冲突。 Bison提供了%expect
声明,因此您可以告诉它您预期会发生多少冲突,如果找到正确的数字,这将会抑制警告,但这仍然非常脆弱。%precedence T_then /* Fake terminal, needed for %prec */
%precedence T_else
/* ... */
%%
/* ... */
entoli_if: T_if T_openpar geniki_ekfrasi Tw_closepar entoli T_else entoli
| T_if T_openpar geniki_ekfrasi T_closepar entoli %prec T_then
在这里,我已经消除了不必要的非终端else_clause
,因为它隐藏了else
令牌。如果你想保留它,无论出于何种原因,你需要在使用它的%prec T_else
生产的末尾添加一个entoli_if
。
%precedence
声明只能从bison 3.0开始提供。如果您有早期版本的bison,则可以使用%nonassoc
声明,但这可能会隐藏其他一些错误。if (expr) statement1 else statement2
statement1
不能成为无与伦比的if
声明。如果statement1
是if
声明,它必须包括else
条款;否则,外部else
的if
将匹配内部if
。并且这适用于statement1
中的任何尾随语句,例如
if (e2) statement2;
else if (e3) statement3
else /* must be present */ statement;
我们可以通过将语句分成“匹配”语句(所有if
与else
匹配)和“不匹配”语句来表达这一点:(我没有试图在这里保留希腊非终端名称;抱歉。你会必须使这个想法适应你的语法)。
statement: matching_statement | non_matching_statement ;
matching_statement: call_statement | assignment_statement | ...
| matching_if_statement
non_matching_statement: non_matching_if_statement
/* might be others, see below */
if_condition: "if" '(' expression ')' ;
matching_if_statement:
if_condition matching_statement "else" matching_statement ;
non_matching_if_statement:
if_condition statement
| if_condition matching_statement "else" non_matching_statement
;
在C中,还有其他复合语句可以以语句结尾(while
,for
)。其中每个都有一个“匹配”和“不匹配”版本,具体取决于最终语句是匹配还是不匹配:
while_condition: "while" '(' expression ')' ;
matching_while_statement: while_condition matching_statement ;
non_matching_while_statement: while_condition non_matching_statement ;
据我所知,这不适用于您的语言,但您可能希望将来扩展它以包含此类语句。T_openpar
然后编写使用它的详细规则,你可以写'('
;你甚至不需要声明它。 (在你的flex - 或其他 - 扫描仪中,你只需要return '(';
而不是return T_openpar
,这就是你不需要声明令牌的原因。)这通常使语法更具可读性。yacc
派生词中都有,但它很常见。),这也可以使语法更具可读性。例如,您可以为if
和else
标记指定名称,如下所示:
%token T_if "if"
%token T_else "else"
然后你可以在你的语法规则中使用引用的字符串。 (我在上一个例子中做了悬挂 - 其他问题。)在flex扫描仪中,你仍然需要使用标记符号T_if
和T_else
。&&
这样的双符号标记,通常情况下,如果扫描程序识别它并返回单个标记,而不是解析器识别两个连续的&
标记。在第二种情况下,解析器将识别:
boolean_expr1 & & boolean_expr2
好像它已经写好了
boolean_expr1 && boolean_expr2
虽然第一个很可能是一个应该报告的错误。apli_ekfrasi: aplos_oros
| apli_ekfrasi '+' aplos_oros
| apli_ekfrasi '-' aplos_oros;
而不是使用LL风格的重复后缀(你的语法中的loop7
)。左递归语法可以在不扩展解析器堆栈的情况下进行解析,并且更准确地表示表达式的语法结构,使得解析器操作更容易编写。
您的语法中还有许多其他地方可能需要重新访问。
(这个建议直接来自bison manual:“你应该总是使用左递归,因为它可以解析具有有限堆栈空间的任意数量元素的序列。”)