第一篇:編譯原理練習答案蔣宗禮
編譯原理練習
一、對下列語言集合設計CFG,?={a,b}(1)L={anbma2n | n,m>=0}。
(2)所有非空符號串,其首尾字符相同。
(3)所有a的個數大于b的個數的符號串。
(4)由a,b組成的回文串。
二、(1)構造一個能識別所有除以5余2的二進制數的DFA
(2)假設有一自動售貨機,接收1元、2元、3元的硬幣,出售2元和4元的商品,多投不找零,請構造能實現此功能有限自動機。
三、對于文法G[S],(1)給出至少兩個理由說明它不是LL(1)文法。(2)將文法改寫為LL(1)文法,并計算改造后文法的各非終結符的First 和 Follow集合,構造其預測分析表。
S ?bAb |bBa A ?aS| CB B ?b| BC C ? c |cC
三、對于正則表達式0*11,構造一個SLR(1)文法G[S],給出為SLR(1)文法理由:構造識別文法活前綴的有限自動機,并構造相應的SLR(1)分析表。
第二篇:編譯原理 形式語言題+答案
第2章 形式語言
1.試分別構造產生下列語言的文法:(1){an#bn|n≥0}∪{cn#dn|n≥0};
(2)任何不是以0打頭的所有奇整數所組成的集合。
答:(1)對應文法為G(S)=({S,X,Y},{a,b,c,d,#}, {S→X, S→Y, X→aXb|#, Y→cYd|# },S)
(2)G(S)=({S,A,B,I,J},{0,1,2,3,4,5,6,7,8,9}, {S→J|IBJ, B→0B|IB|ε, I→J|2|4|6|8, J→1|3|5|7|9},S)
2.對于下列的文法
S→AB|c
A→bA|a
B→aSb|c
試給出句子bbaacb的最右推導。
答:S=>AB=>AaSb=> Aacb=>bAacb=>bbAacb=>bbaacb
3.已知文法G[S]:
S->(AS)|(b)
A->(SaA)|(a)請找出符號串(a)和(A((SaA)(b)))的短語、簡單短語和句柄。答:
因為S 不能 ?(a), 所以(a)不是文法的句型。沒有短語、直接短語和句柄。
因為S ?(AS)?(A(AS))?(A((SaA)S))?(A((SaA)(b))),所以(A((SaA)(b)))是文法的句型。短語:(A((SaA)(b))),((SaA)(b)),(SaA),(b)直接短語:(SaA),(b)句柄:(SaA)S
(A
S)
(A
S)
(S a A)(b)
4.試描述由下列文法所產生的語言的特點:(1)S→10S0
S→aA
A→bA
A→a(2)S→aSS
S→a
答:(1)本文法構成的語言集為:L(G)={(10)nabma0n|n,m≥0}。(2)由L(G)={a2n-1|n≥1}可知,該語言特點是:產生的句子是奇數個a。
附加題:試證明文法
S→AB|DC
A→aA|a
B→bBc|bc
C→cC|c
D→aDb|ab 為二義性文法。
答:因為存在句子:abc,它對應兩個最右推導:
S ? AB ? Abc ? abc S ? DC ? Dc ? abc 所以,本文法具有二義性。
第三篇:編譯原理課程設計
課 程 設 計 報 告
設計題目:一個簡單文法的編譯器前端的設計與實現
班
級: 計算機1206 組長學號:201239 組長姓名:閆智宣 指導教師:李曉華 設計時間:2014年12月
[在此處鍵入]
設計分工
組長學號及姓名: 20123974
閆智宣
分工:
語法分析,四元式生成,目標代碼優化及生成 組員1學號及姓名:20123977
廖峭 分工:
詞法分析,錯誤處理 組員2學號及姓名:20123959
郭天龍
分工:
符號表生成,語義動作插入,操作界面[在此處鍵入]
摘要
編譯原理課程設計是通過C語言編譯器相關子系統的設計,進一步加深對編譯器構造的理解;第一部分詞法分析,設計各單詞的狀態轉換圖,并為不同的單詞設計種別碼,制作掃描器識別一個個單詞,返回值為識別碼的序號,返回Token序列。將詞法分析器設計成供語法分析器調用的子程序。詞法分析器具備預處理功能。將不翻譯的注釋等符號先濾掉,只保留要翻譯的符號串,即要求設計一個供詞法分析調用的預處理子程序;第二部分,語法分析,用遞歸下降法,實現對表達式、各種說明語句、控制語句進行語法分析。若語法正確,則用語法制導翻譯法進行語義翻譯;生成并打印出語法樹;若語法錯誤,要求指出出錯性質和出錯位置(行號)。
我們還做了附加功能,即編譯后端,有中間代碼優化,生成目標代碼匯編語言。通過此次課程設計,提高了我們的獨立分析問題、解決問題的能力,以及系統軟件設計的能力; 提高程序設計能力、程序調試能力,團結協作能力
關鍵詞:詞法分析,語法分析,四元式生成,錯誤處理,符號表生成,語義動作插入,中間代碼優化,生成目標代碼 [在此處鍵入]
目錄
摘要
1.概述
2.課程設計任務及要求
2.1 設計任務
2.2 設計要求
3.算法及數據結構
3.1算法的總體思想(流程)
3.2 詞法分析模塊
3.2.1 功能
3.2.2 數據結構
3.2.3 算法
3.3 語法分析模塊
3.3.1功能
3.3.2 數據結構
3.3.3算法
3.4 符號表模塊
3.4.1功能
3.4.2 數據結構
3.4.3算法
3.5 四元式模塊
3.5.1功能
[在此處鍵入]
3.5.2 數據結構
3.5.3算法
3.6 語義動作分析模塊
3.6.1功能 3.6.2 數據結構
3.6.3算法
3.7 錯誤處理模塊
3.7.1功能
3.7.2 數據結構
3.7.3算法
3.8 目標代碼模塊
3.8.1功能
3.8.2 數據結構
3.8.3算法
4.程序設計與實現
4.1 程序流程圖
4.2 程序說明
4.3 實驗結果
5.結論 6.參考文獻。7.收獲、體會和建議。
[在此處鍵入]
1.概述
編譯器是將C語言翻譯為匯編語言代碼的計算機程序。編譯器將源程序(source language)編寫的程序作為輸入,翻譯產生目標語言(target language)機器代碼的等價程序。通常地,源程序為高級語言(high-level language),C語言程序,而目標則是 機器語言的目標代碼(object code),也就是可以在計算機硬件中運行的機器代碼軟件程序。這一過程可以表示為:
源程序→編譯器 →目標機器代碼程序
2.課程設計任務及要求
2.1設計任務
學生在學習《編譯原理》課程過程中,結合各章節的構造編譯程序的基本理論,要求用C#語言描述及上機調試,實現一個 C編譯程序(包括詞法分析,語法分析等重要子程序),使學生將理論與實際應用結合起來,受到軟件設計等開發過程的全面訓練,從而提高學生軟件開發的能力。
2.2設計要求 要求:
(1)設計詞法分析器
設計各單詞的狀態轉換圖,并為不同的單詞設計種別碼。將詞法分析器設計成供語法分析器調用的子程序。功能包括:
a.具備預處理功能。將不翻譯的注釋等符號先濾掉,只保留要翻譯的符號串,即要求設計一個供詞法分析調用的預處理子程序;
b.能夠拼出語言中的各個單詞; [在此處鍵入]
c.返回(種別碼,屬性值,行號)。
(2)語法分析
要求用學習過的自底向上或自頂向下的分析方法等,實現對表達式、各種說明語句、控制語句進行語法分析。若語法正確,則用語法制導翻譯法進行語義翻譯;生成并打印出語法樹;若語法錯誤,要求指出出錯性質和出錯位置(行號)。
3.算法及數據結構
3.1算法的總體思想(流程)
本節主要分析程序的代碼結構和代碼工程文件的劃分。(程序由幾個類組成: Token類和Variable類SymbolTable類ObjectCode類Lexical類Grammar類Four_Yuan類Action類ErrorItem類,分別為詞法分析和語法分析類。工程分為幾個文件:Form1.cs,Token.cs,Variable.cs,SymbolTable.cs,ObjectCode.cs,Lexical.cs,Grammar.cs,Four_Yuan,cs,Action.cs,ErrorItem.cs分別對應Token類和Variable類SymbolTable類ObjectCode類Lexical類Grammar類Four_Yuan類Action類ErrorItem類的聲明和實現文件)。本程序采用C#語言以面向對象的思想編寫,程序分為幾部分:詞法分析(Lexical),語法分析(Grammer),目標代碼生成(ObjectCode)。Lexical類主要的工作是詞法分析獲取Token。Grammer類的主要工作是根據Lexical類詞法分析之后的Token進行語法分析,生成語法樹,最后并輸出語法樹。在處理過程中,Token類的對象作為Lexical類的一個成員變量,配合Grammer類進行語法分析。
工程文件總體上是按照九個類的格局分為十個文件,分別是九個類的聲明文件和實現文件。十個文件為Form1.cs,Token.cs,Variable.cs,SymbolTable.cs,ObjectCode.cs,Lexical.cs,Grammar.cs,Four_Yuan,cs,Action.cs,ErrorItem.cs,他們分別是Lexical類聲明文件、Lexical類實現文件、Grammer類聲明文件、Grammer類實現文件。[在此處鍵入]
程序流程
在程序中,Lexical類的對象(Token)作為Grammer類中的一個成員變量,配合Grammer類進行語法分析。它們的關系是這樣的:Grammer類的一個成員變量temp首先對源程序刪除注釋,然后進行詞法分析獲取所有Token,并將獲取的Token存儲在Token對象的tokenList(List類型)中。然后Grammer類的語法分析程序就根據tokenList中的Token進行語法分析,生成語法樹,最后打印語法樹。同時,這也是程序的流程。[在此處鍵入]
3.2 詞法分析模塊 3.2.1功能
Lexical類主要的工作是詞法分析獲取Token序列。
3.2.2數據結構
詞法分析階段的代碼被封裝成一個類——Lexical,Token中主要是Lexical類的聲明代碼,Lexical.cs中主要是Lexical類的實現代碼。Lexical類對外提供的函數主要有:
static public int RecogId(string str, int i),static public int RecogDig(string str,int i),static public int RecogOperator(string str, int i),static public int RecogBound(string str, int i),以上幾個函數構成了詞法分析的骨架,在Lexical類中還有其他成員變量和函數,主要作為這三個函數處理過程的中間步驟,為這三個函數服務。Lexical類的代碼結構和主要的成員變量和函數及其含義如下圖所示:
3.2.3算法
算法的基本任務是從字符串表示的源程序中識別出具有獨立意義的單詞符號,其基本思想是[在此處鍵入]
根據掃描到單詞符號的第一個字符的種類,拼出相應的單詞符號。
主程序示意圖:
主程序示意圖如圖3-1所示。
⑴ 關鍵字表的初值。
關鍵字作為特殊標識符處理,把它們預先安排在一張表格中(稱為關鍵字表),當掃描程序識別出標識符時,查關鍵字表。如能查到匹配的單詞,則該單詞為關鍵字,否則為一般標識符。
(2)程序中需要用到的主要變量為type和number 掃描子程序的算法思想:
首先設置3個變量: [在此處鍵入]
①token用來存放構成單詞符號的字符串; ②number用來整型單詞;
③type用來存放單詞符號的種別碼。
Token定義
Token定義:
Token類型(TokenType):
3.3 語法分析模塊
3.3.1功能
語法分析是編譯過程的一個邏輯階段。語法分析的功能是在詞法分析的基礎上將單詞序列組合成各類語法短語,如“程序”,“語句”,“表達式”等等.語法分析程序判斷源程序在結構上是否正確.源程序的結構由上下文無關文法描述.3.3.2 數據結構
下圖為實現語法分析的類Grammar,屬性與方法的作用都已說明 在此處鍵入]
3.3.3算法
1.文法
下面終結符與非終結符意義
B程序開始
Z 數據類型,如int,char,float等
V 標識符
S 語句
P 語句塊
E 加減算術表達式
D 逗號表達式
T 乘除算術表達式
C 關系表達式
L 邏輯表達式
Q 標識符或圓括號
e 表示空
i 表示標識符 a)函數文法
B----ZV()S
[
[在此處鍵入]
b)語句塊文法
P----SP|e
S----{P} c)語句文法
表達式語句文法
S----V=E
goto語句文法
S----i:S
S----goto i
if語句文法
S----if(E)S[else S]
while語句文法
S----while(E)S
聲明語句文法
S----ZVD
D----,VD|=ED|e d)表達式文法
E----T|E+T|E-T
T----F|T*F|T/F
C----C|C
L----Q|L&&Q|L||Q
Q----i|(E)|!Q
2.遞歸下降程序流程圖
對應于每個文法編寫如下遞歸下降子程序
主程序(B)[在此處鍵入] [在此處鍵入]
3.4 符號表模塊
3.4.1功能
進行符號表的儲存,添加,更新,查找,保存標識符活躍信息以及輸出。3.4.2 數據結構
在此處鍵入]
3.4.3算法
3.5 四元式模塊
3.5.1功能
四元式為中間代碼,編譯程序進行完語義分析后,先生成中間代碼作為過渡,此時中間代碼與目標代碼已經比較相似
3.5.2 數據結構
[ 在此處鍵入]
3.5.3算法
3.6語義動作分析模塊
3.6.1功能
在語法分析中嵌入相應的語義動作,生成四元式 3.6.2 數據結構
[
[在此處鍵入]
3.6.3算法 GEQ(+)(-)(*)(/)
(+,i1,i2,t)PUSH(i)ASSI(=)
(=,t,_,POP)LABER(i)
(lb,_,_,i)GOTO(i)
(gt,_,_,i)IF(if)
(if,a,_,_)EL(el)
(el,_,_,_)IE(ie)
(ie,_,_,_)WH()
(wh,_,_,_)DO()
(do,a,_,_)WE(we)
(we,_,_,_)
3.7 錯誤處理模塊
3.7.1功能 保存運行時發現的錯誤,儲存行號已經詳細信息并輸出。
3.7.2 數據結構
3.7.3算法 [在此處鍵入]
public static void AddErrorMessage(int lineno,string content)函數用作在發現錯誤時保存錯誤信息以及行號。
public static string PrintErrorList()把所有發現的錯誤格式化后統一輸出。
錯誤信息在語法分析,語義分析,符號表檢錯中添加。3.8 目標代碼模塊
3.8.1功能
目標代碼生成把優化后的中間代碼變換成目標代碼,此處的目標代碼為匯編代碼,采用單寄存器生成目標代碼 3.8.2 數據結構[在此處鍵入]
3.8.3算法
對于一個基本塊有如下流程圖
W:操作符,B:第一操作數,C:第二操作數,R:寄存器
5.結論
網上找一段話抄上 [在此處鍵入]
6.測試
測試打開文件
測試保存文件
如果沒打開文件,直接敲代碼,點保存時會彈出另存為窗口[在此處鍵入]
測試錯誤檢測,程序缺少main函數的類型,錯誤列表中顯示第一行函數缺少錯誤類型。
測試錯誤檢測,程序缺少分號,錯誤列表中顯示該行缺少語句結束標志';' 單擊錯誤列表,會自動選定錯誤行
編譯成功,生成并顯示token串、符號表、四元式與目標代碼 [在此處鍵入]
測試if與while語句,而且while嵌套在if當中
測試goto語句,結果正確。[在此處鍵入]
測試優化,輸入課件中的代碼,結果與課件一樣
6.參考文獻。
1、陳火旺.《程序設計語言編譯原理》(第3版).北京:國防工業出版社.2000.2、美 Alfred V.Aho Ravi Sethi Jeffrey D.Ullman著.李建中,姜守旭譯.《編譯原理》.24 [在此處鍵入]
北京:機械工業出版社.2003.3、美 Kenneth C.Louden著.馮博琴等譯.《編譯原理及實踐》.北京:機械工業出版社.2002.4、金成植著.《編譯程序構造原理和實現技術》.北京:高等教育出版社.2002.7.收獲、體會和建議。
直接拷貝好歹也檢查一下錯誤
對于編譯原理的這次課程設計,自己經歷了從剛開始的不懂?明白任務的要求和內容?理論知識的了解?開始著手寫代碼?完成基本功能?根據DFA及自頂向下等理論修改完善代碼等這些過程。
自己著手寫詞法分析的時候還不清楚詞法分析的任務內容,還不知道詞法分析的結果是什么,詞法分析出錯的情況和類型有哪些,也總是將詞法分析和語法分析混在一起,不明白哪些錯誤在詞法分析中報,哪些錯誤在語法分析中判斷,后來經過查書、網上資料、請教同學等途徑逐步清晰了詞法分析的工作內容是從源代碼文件中獲取出Token,供語法分析使用。在充分了解了語法分析需要哪些信息時,我才真正了解了詞法分析的工作內容和目標,才知道詞法分析需要完成哪些任務獲取到哪些信息。充分了解了詞法分析的任務之后,就開始理論知識的學習。經過揣摩書上的例子,自己理解和掌握了怎么設計過濾注釋和分析程序中Token的DFA,于是開始根據設計好的DFA進行編碼,最后經過調試已經可以正確地完成詞法階段的任務了。這只是詞法分析的原始代碼,在之后還進行了兩次徹底的改動。雖然之前寫的詞法分析的代碼已經完成了詞法分析的需求,也是根據DFA的原理編寫的,但是在代碼結構上卻難以體現,在對書上的根據已知DFA寫代碼的例子進行了詳細的研究之后,發現自己的代碼并沒有像書上那樣完全按照所依據的DFA各狀態轉移的關系進行編寫,所以對代碼進行了重寫,像書上一樣嚴格按照狀態之間轉移的方式進行編寫,將狀態劃分成11個狀態,狀態分別按1~11進行標注,程序也按照DFA來編寫,也實現了詞法分析的功能。再后來寫報告的時候,發現分析出Token的那個DFA并不是最簡的,有很多多余的狀態,完全可以用一個flag標志來標識,從而簡化代碼結構,于是又重寫了一次詞法分析函數scan()的代碼,將狀態縮減為5個,且不再用1-5來表示,而是像書上那樣分別取了名字(START、INNUM、INID、INDBSYM、DONE),同時為了簡化代碼將輸出Token到文件的部分從scan()中剝離開來,而在Lexical類中加了一個printToken()的函數,使scan()函數邏輯更加清晰,使讀者能夠容易地將代碼與DFA進行查看比照。
在寫語法分析的時候,已經對編譯器的語法分析的內容有了一定的了解,所以直接進行了理論的學習。首先自己對遞歸向下分析法進行了學習,將書上的幾個遞歸向下分析的偽代碼看過之后,自己對遞歸向下的分析方法的原理有了初步的認識,大概知道了根據文法怎么分析,但是對于如何編寫代碼卻還在此處鍵入]
是難以下手,于是就對照TINY語言的文法看了幾遍書后面的TINY語言的遞歸向下分析的語法分析程序,這樣就基本知道了C-語言的語法分析程序怎么寫。由于C-語言給出的文法有左遞歸存在,于是自己將存在左遞歸的文法改寫成EBNF的形式,并據此進行代碼編寫。由于在編寫代碼的過程中需要確定分析是否正確或選擇多個文法中的某一個文法進行分析,有時必須探測需要的或下一個Token的類型,在這種情況下需要求First集合,在推導中若存在empty,又需要求Follow集合,所以這樣又需要我了解First集合和Follow集合,自己在程序中也根據求出的First集合和Follow集合進行判斷,以確定程序的走向。在編寫過程中,還有一類問題,就是存在公共左因子,如文法expression→ var = expression | simple-expression,左因子為ID,在分析過程中,由于已經取出了一個ID的Token,且生成了一個IdK的節點,但是在當前狀態無法確定是哪一個推導,然而IdK節點已經生成,又無法回退,并且是使用自頂向下的分析方法,已經生成的IdK在程序上方無法使用,自己通過查閱資料等途徑的學習確定了在這種情形下的處理方式:將已經生成的IdK節點傳到下方的處理程序,所以TreeNode * simple_expression(TreeNode * k)、TreeNode * additive_expression(TreeNode * k)等函數都被設計成有節點類型參數的函數,目的就是將已經生成的節點傳到下面的分析函數中去。
通過這次的編譯原理課程的學習和實踐,自己獲益良多。首先最基本的成果是完成了課程設計的任務,實現了編譯器的詞法分析和語法分析階段的功能,詞法分析主要能過濾注釋、分析出語法分析階段需要的Token并滿足語法階段的所有要求,能夠判別詞法分析階段是否出錯和出錯類型和位置。語法分析主要能根據遞歸向下的分析思想和C-文法對詞法分析獲取的Token進行語法分析,能夠構造出語法樹,能夠判別語法分析過程中是否出錯以及出錯位置和錯誤類型。
由于在編寫程序過程中,涉及到了正則表達式、DFA、提取公共左因子、消除左遞歸、EBNF、求First集合和Follow集合、遞歸向下分析方法以及編程語言方面的知識,所以,通過本次的課程設計的實踐,使得自己對編譯原理這門課的許多知識點有了更加深刻和具體的理解,而不再只限制于做題。此外,對以前那些已掌握的知識有了溫習和動手鍛煉的機會。如:以前在編譯原理課上雖然知道First集合和Follow集合怎么求的,卻不知道First集合和Follow集合到底是干什么的,通過編寫程序自己明白了他們的實際作用,使得自己不僅知其然還知其所以然,從而使得自己加深了對知識點的理解和掌握。由于以前編寫代碼都是使用JAVA語言,所以C/C++很多內容都忘記了,通過本次的實踐,自己又重新拾起了以前的知識。此外,由于在做報告的時候,需要描繪DFA和程序流程圖,使得自己初步掌握了使用visio和word畫圖的能力。此外,對于文檔的編寫和美化自己也獲得了許多有用的經驗。[
第四篇:編譯原理 學習心得
國際學院 0802 楊良燕 200819100227
《編譯原理》課程學習心得
《編譯原理》是計算機專業的一門重要課程,正如教材
第一章的引論所述,“編譯程序是現代計算機系統的基本組成部分之一”。“一個編譯程序就是一個語言翻譯程序,語言翻譯程序把一種語言(源語言)書寫的程序翻譯成另一種語言(目標語言)的等價程序”。
通過這一學期的學習,我覺得編譯原理是一門理論性很強的課程,從文法和語言的概念到LL(1)文法和LR(0)文法的分析,幾乎都是對具體問題的抽象。因而,我們需要更多的時間來理解、掌握相關的知識,當然在這一過程中也存在很多問題,比如我們后期學習具體文法的分析方法時,對于文法的概念不夠清晰,影響了上課的效率,知道老師再次給我們講解了文法等基礎的知識點,我們才慢慢掌握后面所學的LL(1)文法等,也發現了知識點之間的關聯。此外,這門課程的課時被安排得很少,一周只有一次,這樣很不利于我們對這門重要課程的理解和掌握。但是我覺得我們很幸運,因為老師在有限的課程中盡量將知識點以比較容易接受的方式給我們講解,教我們用簡單的方法理解記憶不同的知識,對于我們提出的問題,無論課上或是課外,老師一直是不厭其煩,甚至利用課余時間為我們講解重要的難題。
編譯原理這門課程不僅僅在于其本身的理論價值,更在于為我們解決問題提供的思維方式和方法。從LL(1)到LR(0),問題不斷被解決的同時,又有一個個新的問題提了出來。對計算機語言世界的知識積累,像滾雪球一樣越滾越大。這個逐漸遞進,逐漸解決問題的過程對我來說是收獲很大的。整個過程好像踏著前人研究編譯理論的路線,不斷感覺他們遇到的問題,更重要的是他們解決問題的思路。編譯原理的課程帶給我的不只是如何去編譯程序這樣的理論知識,相信更重要的是一種如何“自動計算”的思路。通過對相關編譯問題的具體分析,讓我體會最深的是一種“自動計算”的思想,同時完成編譯試驗后,更是感到了一種“自動計算”的快樂。”然而我明白自己雖然對編譯有了一定的了解,我懂得了文法的分析,學會了構造確定和非確定有限自動機,學會了LL(1)文法和LR(0)文法等,但是并沒有完全掌握,對于這些知識點的實質性和其他方面,更是認識不深。作為一名學習計算機科學與技術的學生,我明白編譯原理是軟件工程的基礎,課程的結束并不意味著學習的結束,只有通過以后的學習,才能更深入地了解編譯原理。
第五篇:編譯原理論文
編譯原理心得體會
編譯原理是計算機專業的一門重要專業課,旨在介紹編譯程序構造的一般原理和基本方法,在計算機本科教學中占有十分重要的地位。
該課程理論性與實踐性都很強,我們在學習是普遍感到內容非常抽象,不易理解,內容多且繁瑣,難以完整、全面地掌握編譯原理的有關知識,更不用說靈活運用編譯原理知識從事相關設計或應用于其他領域。雖然只有少數人從事編譯方面的工作,但是這門課在理論、技術、方法上都對我們提供了系統而有效的訓練,有利于提高軟件人員的素質和能力。
在我們學習編譯原理以前,都認為編譯原理只能應用在寫程序語言的編譯器上,覺得用處不大,學習興趣不高。而在后來的學習中,我們逐漸認識到計算機專業的學生,除了要會編寫程序語言之外,還應該了解它是如何被計算機所識別,這才是真正并且透徹地學習軟件。另外,編譯器中每一個模塊的編寫,都能對我們的編程能力的提高有很大幫助。在今后若從事軟件工程,這門課程也能夠對編寫程序有所幫助。
為了能夠系統掌握這門專業課,我們把編譯原理分為以下幾個模塊:①語言和文法;②詞法分析;③語法分析;④語義分析和中間代碼生成;⑤代碼優化和目標代碼生成。
在學習的開始,我們需要掌握什么是編譯,編譯分為哪些階段,編譯程序和解釋程序的區別等等。在做好了這些方面的準備后,開始了系統的學習。
語言和文法部分的知識包括文法基本概念及文法的二義性。基本概念有文法定義、推導、句型、句子等等。二義性文法是通過畫語法樹的方法來證明。
詞法分析中的重點是有窮自動機DFA的生成以及DFA和正規式與正規文法的關系。還要熟練掌握NFA轉換為DFA的方法及DFA的化簡。
語法分析包括自上而下和自下而上分析。自上而下分析著重掌握LL(1)文法,自下而上分析重點掌握算符優先文法和LR(0)、SLR(1)文法。
語義分析重點是其功能,中間代碼生成和語法制導翻譯定義與方法。
最后,優化分為局部優化和循環優化,重點理解一些關鍵詞,如基本塊、流圖等,要學會自己畫出程序流圖。用DAG圖進行局部優化是重點。
在學習文法時,對文法的組成,用法都較為明了,而在真正做題時卻感到十分吃力。例如給出了一個語言,要求寫出它的上下文無關文法,就感到十分棘手,所以今后在這方面要加大練習量,以熟練掌握。
而在之后的詞法分析和語法分析中,我感到在看基本原理時十分困難,通常要長時間鉆研才能夠有所了解,而一旦掌握了基本原理,做題時就感到十分順暢了。例如,在剛接觸到LR(0)文法時,我用了大量的時間去學習它的原理,掌握之后,在列LR(0)分析表和寫分析過程時,只要思路清晰,就會比較順暢,而且不會犯錯。
下面是我認為的比較有效的學習編譯原理的步驟:
1.先利用ANTLR之類的編譯器生成工具,做一個小程序(如上面提到的HTML文件轉化成純文本文件的程序),所需知識只是正則表達式的基本知識和生成工具本身的使用方法(可以看聯機幫助和網上教程(tutorial)來掌握).這樣做的好處是:
1)可以體會到編譯原理的實用性,提高學習興趣
2)入門容易,消除編譯原理學習的畏難情緒.3)獲得詞法分析器和語法分析器的感性認識,有利于加深對理論的理解.4)獲得編譯器自動生成工具(compiler compiler)的使用經驗,提高解決實際問題的能力.(實際工作很多都不是手編而是利用工具的)
2.象ANTLR之類的工具是開源(open source)的,可研究其源碼,以便必要時自己手編分析程序.3.回過頭來看編譯原理教材.這時大概會發現,很多理論很容易懂,剩下的只有上面說的幾個難點,多看幾遍,重點突破.4.結合教材所附源碼,進一步加深對教材的理解。以上就是我對這門課的心得體會。