Giáo trình Nguyên lý ngôn ngữ lập trình - Chương 5: Dịch trực tiếp cú pháp

Khi viết một chương trình bằng một ngôn ngữ lập trình nào đó, ngoài việc quan tâm

đến cấu trúc của chương trình (cú pháp – văn phạm), ta còn phải chú ý đến ý nghĩa của

chương trình. Như vậy, khi thiết kế một trình biên dịch, ta không những chú ý đến văn

phạm mà còn chú ý đến cả ngữ nghĩa. Chương 5 trình bày các cách biểu diễn ngữ

nghĩa của một chương trình. Mỗi ký hiệu văn phạm kết hợp với một tập các thuộc tính

– các thông tin. Mỗi luật sinh kết hợp với một tập các luật ngữ nghĩa – các quy tắc xác

định trị của các thuộc tính. Việc đánh giá các luật ngữ nghĩa được sử dụng để thực

hiện một công việc nào đó như tạo ra mã trung gian, lưu thông tin vào bảng ký hiệu,

xuất các thông báo lỗi, v.v. Ta sẽ thấy rõ việc đánh giá này ở các chương sau: 6, 8, 9.

Hai cách để kết hợp các luật sinh với các luật ngữ nghĩa được trình bày trong chương

là: Định nghĩa trực tiếp cú pháp và Lược đồ dịch. Ở mức quan niệm, bằng cách sử

dụng định nghĩa trực tiếp cú pháp hoặc lược đồ dịch, ta phân tích dòng thẻ từ, xây

dựng cây phân tích cú pháp và duyệt cây khi cần để đánh giá các luật ngữ nghĩa tại các

nút của cây.

pdf 20 trang kimcuc 6280
Bạn đang xem tài liệu "Giáo trình Nguyên lý ngôn ngữ lập trình - Chương 5: Dịch trực tiếp cú pháp", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Giáo trình Nguyên lý ngôn ngữ lập trình - Chương 5: Dịch trực tiếp cú pháp

Giáo trình Nguyên lý ngôn ngữ lập trình - Chương 5: Dịch trực tiếp cú pháp
CHƯƠNG V 
 DỊCH TRỰC TIẾP CÚ PHÁP 
Nội dung chính: 
Khi viết một chương trình bằng một ngôn ngữ lập trình nào đó, ngoài việc quan tâm 
đến cấu trúc của chương trình (cú pháp – văn phạm), ta còn phải chú ý đến ý nghĩa của 
chương trình. Như vậy, khi thiết kế một trình biên dịch, ta không những chú ý đến văn 
phạm mà còn chú ý đến cả ngữ nghĩa. Chương 5 trình bày các cách biểu diễn ngữ 
nghĩa của một chương trình. Mỗi ký hiệu văn phạm kết hợp với một tập các thuộc tính 
– các thông tin. Mỗi luật sinh kết hợp với một tập các luật ngữ nghĩa – các quy tắc xác 
định trị của các thuộc tính. Việc đánh giá các luật ngữ nghĩa được sử dụng để thực 
hiện một công việc nào đó như tạo ra mã trung gian, lưu thông tin vào bảng ký hiệu, 
xuất các thông báo lỗi, v.v. Ta sẽ thấy rõ việc đánh giá này ở các chương sau: 6, 8, 9. 
Hai cách để kết hợp các luật sinh với các luật ngữ nghĩa được trình bày trong chương 
là: Định nghĩa trực tiếp cú pháp và Lược đồ dịch. Ở mức quan niệm, bằng cách sử 
dụng định nghĩa trực tiếp cú pháp hoặc lược đồ dịch, ta phân tích dòng thẻ từ, xây 
dựng cây phân tích cú pháp và duyệt cây khi cần để đánh giá các luật ngữ nghĩa tại các 
nút của cây. 
Mục tiêu cần đạt: 
Sau khi học xong chương này, sinh viên phải nắm được: 
• Các cách kết hợp các luật sinh với các luật ngữ nghĩa: Định nghĩa trực tiếp cú 
pháp và Lược đồ dịch. 
• Biết cách thiết kế chương trình – bộ dịch dự đoán - thực hiện một công việc nào 
đó từ một lược đồ dịch hay từ một định nghĩa trực tiếp cú pháp xác định. 
Tài liệu tham khảo: 
 [1] Compilers : Principles, Technique and Tools - Alfred V.Aho, Jeffrey 
D.Ullman - Addison - Wesley Publishing Company, 1986. 
 [2] Modern Compiler Implementation in C - Andrew W. Appel - Cambridge 
University Press, 1997. 
I. ÐỊNH NGHĨA TRỰC TIẾP CÚ PHÁP 
 Ðịnh nghĩa trực tiếp cú pháp là sự tổng quát hóa một văn phạm phi ngữ cảnh, trong 
đó mỗi ký hiệu văn phạm kết hợp với một tập các thuộc tính. 
Cây phân tích cú pháp có trình bày giá trị các thuộc tính tại mỗi nút gọi là cây chú 
thích . 
1. Khái niệm về định nghĩa trực tiếp cú pháp 
Trong một định nghĩa trực tiếp cú pháp, mỗi luật sinh A → α kết hợp một tập luật 
ngữ nghĩa có dạng b := f (c1, c2,..., ck) trong đó f là một hàm và : 
 116
1- b là một thuộc tính tổng hợp của A và c1, c2,..., ck là các thuộc tính của các ký 
hiệu văn phạm của luật sinh. Hoặc 
2- b là một thuộc tính kế thừa của một trong các ký hiệu văn phạm trong vế phải 
của luật sinh và c1, c2,..., ck là các thuộc tính của các ký hiệu văn phạm của 
luật sinh. 
Ta nói b phụ thuộc c1, c2,..., ck. 
1. Thuộc tính tổng hợp 
• Là thuộc tính mà giá trị của nó tại mỗi nút trên cây phân tích cú pháp được tính 
từ giá trị thuộc tính tại các nút con của nó. 
• Ðịnh nghĩa trực tiếp cú pháp chỉ sử dụng các thuộc tính tổng hợp gọi là định 
nghĩa S _ thuộc tính. 
• Cây phân tích cú pháp của định nghĩa S_ thuộc tính có thể được chú thích từ 
dưới lên trên. 
Ví dụ 5.1: Xét định nghĩa trực tiếp cú pháp 
Luật sinh Luật ngữ nghĩa 
L Æ En 
E Æ E1 + T 
E Æ T 
T Æ T1 * F 
T Æ F 
F Æ (E) 
F Æ digit 
print(E.val) 
E.val := E1.val + T.val 
E.val := T.val 
T.val := T1.val * F.val 
T.val := F.val 
F.val := E.val 
F.val := digit.lexval 
Hình 5.1 - Ðịnh nghĩa trực tiếp cú pháp cho một máy tính tay đơn giản 
Định nghĩa này kết hợp một thuộc tính tổng hợp có giá trị nguyên val với từng ký 
hiệu chưa kết thúc E, T và F. Token digit có một thuộc tính tổng họp lexval với giả 
sử rằng giá trị của thuộc tính này được cung cấp bởi bộ phân tích từ vựng. Ðây là 
một định nghĩa S_thuộc tính. Với biểu thức 3 * 5 + 4n (n là ký hiệu newline) có 
cây chú thích như sau: L 
E.val = 15 T.val = 4 +
T val = 15 F.val = 4 
T.val = 3 * 
F.val = 3 
F val = 5
digit.lexval = 3 
digit.lexval = 5 
digit.lexval = 4 
E.val = 19 n 
 117
 Hình 5.2- Cây chú thích cho biểu thức 3* 5+4n 
2. Thuộc tính kế thừa 
• Là một thuộc tính mà giá trị của nó được xác định từ giá trị các thuộc tính của 
các nút cha hoặc anh em của nó. 
• Nói chung ta có thể viết một định nghĩa trực tiếp cú pháp thành một định nghĩa 
S_ thuộc tính. Nhưng trong một số trường hợp, việc sử dụng thuộc tính kế thừa 
lại thuận tiện vì tính tự nhiên của nó. 
Ví dụ 5.2: Xét định nghĩa trực tiếp cú pháp sau cho sự khai báo kiểu cho biến: 
Luật sinh Luật ngữ nghĩa 
D Æ TL 
T Æ int 
T Æ real 
L Æ L1, id 
L Æ id 
L.in := T.type 
T.type := integer 
T.type := real 
L1.in := L.in; addtype (id.entry, L.in) 
addtype (id.entry, L.in) 
Hình 5.3 - Ðịnh nghĩa trực tiếp cú pháp với thuộc tính kế thừa L.in 
type là thuộc tính tổng hợp kết hợp với ký hiệu chưa kết thúc T, giá trị của nó được 
xác định bởi từ khóa trong khai báo. Bằng cách sử dụng thuộc tính kế thừa in kết 
hợp với ký hiệu chưa kết thúc L chúng ta xác định được kiểu cho các danh biểu và 
dùng thủ tục addtype đưa kiểu này vào trong bảng ký hiệu tương ứng với danh 
biểu. 
Ví dụ 5.3: Xét phép khai báo: real id1, id2, id3. Ta có cây chú thích: 
D
T type = real
real 
 L.in = real 
L in = real
, id3
L in real
id1
,
id2
Hình 5.4- Cây phân tích cú pháp với thuộc tính kế thừa in tại mỗi nút được gán nhãnL 
 118
3. Ðồ thị phụ thuộc 
• Ðồ thị phụ thuộc là một đồ thị có hướng mô tả sự phụ thuộc giữa các thuộc tính 
tại mỗt nút của cây phân tích cú pháp. 
• Cho một cây phân tích cú pháp thì đồ thị phụ thuộc tương ứng được xây dựng 
theo giải thuật sau: 
FOR mỗi một nút n trong cây phân tích cú pháp DO 
 FOR với mỗi một thuộc tính a của ký hiệu văn phạm tại n DO 
 Xây dựng một nút trong đồ thị phụ thuộc cho a 
FOR với mỗi một nút n trên cây phân tích cú pháp DO 
 FOR với mỗi một luật ngữ nghĩa dạng b = f(c1, c2,..., ck) kết hợp với luật 
sinh được dùng tại nút n DO 
 FOR i:=1 TO k DO 
 Xây dựng một cạnh từ nút cho ci đến nút cho b 
Ví dụ 5.4: Với định nghĩa S_ thuộc tính 
 E Æ E1 + E2 E.val := E1.val + E2.val 
 Ta có đồ thị phụ thuộc: 
E 
E1 + E2 
val 
val val 
Hình 5.5- E.val được tổng hợp từ E1.val và E2.val 
Ví dụ 5.5: Dựa vào định nghĩa trực tiếp cú pháp trong ví dụ 5.2, ta có đồ thị 
phụ thuộc của khai báo real id1, id2, id3 
Hình 5.6- Ðồ thị phụ thuộc cho cây phân tích cú pháp trong hình 5.4 
D
T
real 
5 in L 4 
L
7 in ,
id3
L
9 in 
id1
,
id210 
1 entry 
8 3 entry 
 6 
 2 entry 
 119
 Chú ý: Với luật ngữ nghĩa dạng b = f( c1, c2, ..., ck) có chứa lời gọi thủ tục thì 
chúng ta tạo ra một thuộc tính tổng hợp giả. Trong ví dụ của chúng ta là nút 6, 8, 10. 
II. XÂY DỰNG CÂY CÚ PHÁP 
• Cây cú pháp (syntax - tree) là dạng rút gọn của cây phân tích cú pháp dùng để 
biểu diễn cấu trúc ngôn ngữ. 
• Trong cây cú pháp các toán tử và từ khóa không phải là nút lá mà là các nút 
trong. Ví dụ với luật sinh S ( if B then S1 else S2 được biểu diễn bởi cây 
cú pháp: 
if - then - else 
B S1 S2 
• Một kiểu rút gọn khác của cây cú pháp là chuỗi các luật sinh đơn được rút gọn 
lại. Chẳng hạn ta có: 
 + E 
4 
5 3 
được rút gọn từ 
E T + 
T 
F * T 
F 
id 
* 
id id 
1. Xây dựng cây cú pháp cho biểu thức 
Tương tự như việc dịch một biểu thức thành dạng hậu tố. 
Xây dựng cây con cho biểu thức con bằng cách tạo ra một nút cho toán hạng và 
toán tử. 
Con của nút toán tử là gốc của cây con biểu diễn cho biểu thức con toán hạng của 
toán tử đó. 
Mỗi một nút có thể cài đặt bằng một mẩu tin có nhiều trường. 
Trong nút toán tử, có một trường chỉ toán tử như là nhãn của nút, các trường còn 
lại chứa con trỏ, trỏ tới các nút toán hạng. 
Ðể xây dựng cây cú pháp cho biểu thức chúng ta sử dụng các hàm sau đây: 
 1. mknode(op, left, right): Tạo một nút toán tử có nhãn là op và hai trường chứa 
con trỏ, trỏ tới con trái left và con phải right. 
 120
 2. mkleaf(id, entry): Tạo một nút lá với nhãn là id và một trường chứa con trỏ 
entry, trỏ tới ô trong bảng ký hiệu. 
 3. mkleaf(num,val): Tạo một nút lá với nhãn là num và trường val, giá trị của số. 
Ví dụ 5.6: Ðể xây dựng cây cú pháp cho biểu thức: a - 4 + c ta dùng một dãy các 
lời gọi các hàm nói trên. 
(1): p1 := mkleaf(id, entrya) (4): p4 := mkleaf(id, entryc) 
(2): p2 := mkleaf(num,4) (5): p5 := mknode(‘+’, p3, p4) 
(3): p3 := mknode(‘-‘, p1, p2) 
Cây được xây dựng từ dưới lên 
entrya là con trỏ, trỏ tới ô của a trong bảng ký hiệu 
entryc là con trỏ, trỏ tới ô của c trong bảng ký hiệu 
 +
id - 
 id num 4
entrya 
entryc 
Hình 5.7- Cây cú pháp cho biểu thức a - 4 + c 
2. Xây dựng cây cú pháp từ định nghĩa trực tiếp cú pháp 
 Căn cứ vào các luật sinh văn phạm và luật ngữ nghĩa kết hợp mà ta phân bổ việc 
gọi các hàm mknode và mkleaf để tạo ra cây cú pháp. 
 Ví dụ 5.7: Ðịnh nghĩa trực tiếp cú pháp giúp việc xây dựng cây cú pháp cho biểu 
thức là: 
Luật sinh Luật ngữ nghĩa 
E Æ E1 + T 
E Æ E1 - T 
E Æ T 
T Æ (E) 
T Æ id 
T Æ num 
E.nptr := mknode(‘+’, E1.nptr, T.nptr) 
E.nptr := mknode(‘-’, E1.nptr, T.nptr) 
E.nptr := T.nptr 
T.nptr := E.nptr 
T. nptr := mkleaf(id, id.entry) 
T.nptr := mkleaf(num, num.val) 
 Hình 5.8 - Ðịnh nghĩa trực tiếp cú pháp để tạo cây cú pháp cho biểu thức 
 Các nút trên cây phân tích cú pháp có nhãn là các ký hiệu chưa kết thúc E và T 
sử dụng thuộc tính tổng hợp nptr để lưu con trỏ trỏ tới một nút trên cây cú pháp. 
 121
Với biểu thức a - 4 + c ta có cây phân tích cú pháp (biểu diễn bởi đường chấm) 
tronh hHình 5.9. 
 122
 E.nptr 
entrya 
E.nptr 
E.npt 
+ 
T.nptr 
- T.nptr 
num 
T.nptr 
id 
id 
-
+
 id num 4
id 
entryc 
Hình 5.9 - Xây dựng cây cú pháp cho a - 4 + c 
 Luật ngữ nghĩa cho phép tạo ra cây cú pháp. 
 Cây cú pháp có ý nghĩa về mặt cài đặt còn cây phân tích cú pháp chỉ có ý nghĩa về 
mặt logic. 
3. Ðồ thị có hướng không tuần hoàn cho biểu thức (Directed Acyclic Graph - DAG) 
 DAG cũng giống như cây cú pháp, tuy nhiên trong cây cú pháp các biểu thức con 
giống nhau được biểu diễn lặp lại còn trong DAG thì không. Trong DAG, một nút con 
có thể có nhiều “cha”. 
Ví dụ 5.8: Cho biểu thức a + a * (b - c) + (b - c) * d. Ta có cây cú pháp và DAG: 
a 
d 
+ 
+ 
* 
a - 
b c 
*
-
b c 
d 
+ 
- 
*
a 
* 
+ 
b c 
Cây cú pháp DAG 
Hình 5.10 - Cây cú pháp và DAG của một biểu thức 
 123
 Ðể xây dựng một DAG, trước khi tạo một nút phải kiểm tra xem nút đó đã tồn tại 
chưa, nếu đã tồn tại thì hàm tạo nút (mknode, mkleaf) trả về con trỏ của nút đã tồn tại, 
nếu chưa thì tạo nút mới. 
 Cài đặt DAG: 
 Người ta thường sử dụng một mảng mẩu tin , mỗi mẩu tin là một nút. Ta có thể 
tham khảo tới nút bằng chỉ số của mảng. 
 Ví dụ 5.9: 
 Lệnh gán DAG Biểu diễn 
:= 
+ 
i 10
id entry i 
num 10 
+ 1 2 
:= 1 3 
1
2
3
4
 i := i + 10 
Hình 5.11- Minh họa cài đặt DAG 
Nút 1: có nhãn là id, con trỏ trỏ tới entry i. 
Nút 2: có nhãn là num, giá trị là 10. 
Nút 3: có nhãn là +, con trái là nút 1, con phải là nút 2. 
Nút 4: có nhãn là :=, con trái là nút 1, con phải là nút 3. 
 Giải thuật: Phương pháp số giá trị (value – number) để xây dựng một nút 
trong DAG. 
 Giả sử rằng các nút được lưu trong một mảng và mỗi nút được tham khảo bởi số giá 
trị của nó. Mỗi một nút toán tử là một bộ ba 
 Input: Nhãn op, nút l và nút r. 
 Output: Một nút với 
 Phương pháp: Tìm trong mảng một nút m có nhãn là op con trái là l, con phải là r. 
Nếu tìm thấy thì trả về m, ngược lại tạo ra một nút mới n, có nhãn là op, con trái là l, 
con phải là r và trả về n. 
III. ÐÁNH GIÁ DƯỚI LÊN ÐỐI VỚI ÐỊNH NGHĨA S_THUỘC TÍNH 
1. Sử dụng Stack 
 Như đã biết, định nghĩa S_ thuộc tính chỉ chứa các thuộc tính tổng hợp do đó 
phương pháp phân tích dưới lên là phù hợp với định nghĩa trực tiếp cú pháp này. 
Phương pháp phân tích dưới lên sử dụng một STACK để lưu trữ thông tin về cây con 
đã được phân tích. Chúng ta có thể mở rộng STACK này để lưu trữ giá trị thuộc tính 
tổng hợp. STACK được cài đặt bởi một cặp mảng state và val. 
 Giả sử luật ngữ nghĩa A.a := f ( X.x, Y.y, Z.z ) kết hợp với luật sinh A → XYZ. 
Trước khi XYZ được rút gọn thành A thì val[top] = Z.z, val[top - 1] = Y.y, val[top - 2] 
 124
= X.x. Sau khi rút gọn, top bị giảm 2 đơn vị, A nằm trong state[top] và thuộc tính tổng 
hợp nằm trong val[top]. 
 Stack 
top 
Mỗi ô trong stack là một con trỏ trỏ tới 
bảng phân tích LR(1). Nếu phần tử thứ I 
của stack là ký hiệu A thì val[i] là giá trị 
thuộc tính kết hợp với A. 
 State val 
... ...
 X X.x 
 Y Y.y 
 Z Z.z 
Hình 5.12 - Stack phân tích cú pháp vào một trường lưu giữ thuộc tính tổng hợp 
2. Ví dụ 
Ví dụ 5.10: Xét định nghĩa trực tiếp cú pháp: 
Luật sinh Luật ngữ nghĩa 
L Æ En 
E Æ E1 + T 
E Æ T 
T Æ T1 * F 
T Æ F 
F Æ (E) 
F Æ digit 
print(E.val) 
E.val := E1.val + T.val 
E.val := T.val 
T.val := T1.val * F.val 
T.val := F.val 
F.val := E.val 
F.val := digit.lexval 
 Với biểu thức 3 * 5 + 4 n ta có cây chú thích: 
E.val = 19 
E.val = 15 T.val = 4 +
T.val = 15 F.val = 4 
T.val = 3 * 
F.val = 3 
F.val = 5 
digit.lexval = 3 
digit.lexval = 5 
digit.lexval = 4 
L 
n 
 125
Hình 5.13 – Cây chú thích cho biểu thức 3 * 5 + 4 n 
 Cây chú thích này có thể được đánh giá bằng một bộ phân tích cú pháp LR từ dưới 
lên trên. Chú ý rằng bộ phân tích đã nhận biết giá trị thuộc tính digit.lexval. Khi digit 
được đưa vào stack thì token digit được đưa vào state[top] và giá trị thuộc tính của nó 
được đưa vào val[top]. Chúng ta có thể sử dụng kỹ thuật trong mục VI của chương IV 
để xây dựng bộ phân tích LR. Ðể đánh giá các thuộc tính chúng ta thay đổi bộ phân 
tích cú pháp để thực hiện đoạn mã sau: 
Luật sinh Luật ngữ nghĩa 
L Æ En 
E Æ E1 + T 
E Æ T 
T Æ T1 * F 
T Æ F 
F Æ (E) 
F Æ digit 
print(val[top]) 
val[ntop] := val[top - 2] + val[top] 
val[ntop] := val[top - 2] * val[top] 
val[ntop] := val[top - 1] 
Hình 5.14- Cài đặt một máy tính tay sử dụng bộ phân tích cú pháp LR 
 Khi một luật sinh với r ký hiệu bên vế phải được rút gọn thì ntop = top - r + 1. Sau 
khi một đoạn mã thực hiện thì đặt top = ntop 
 Bảng sau trình bày quá trình thực hiện của bộ phân tích cú pháp 
Input State Val Luật sinh được dùng
 3 * 5 + 4 n 
* 5 + 4 n 
* 5 + 4 n 
 *5 + 4 n 
5 + 4 n 
+ 4 n 
+ 4 n 
+ 4 n 
+ 4 n 
4 n 
n 
n 
n 
_ 
3 
F 
T 
T* 
T * 5 
T * F 
T 
E 
E + 
E + 4 
E + F 
E + T 
_ 
3 
3 
3 
3 - 
3 - 5 
3 - 5 
15 
15 
15 - 
15 - 4 
15 - 4 
15 - 4 
F Æ digit 
T Æ F 
F Æ digit 
T Æ T * F 
E Æ T 
F Æ digit 
T Æ F 
 126
n 
E 
E n 
L 
19 
19 - 
19 
E Æ E + T 
L Æ En 
Hình 5.15- Các phép chuyển được tạo ra bởi bộ thông dịch trên chuỗi nhập 3* 5+4n 
IV. ÐỊNH NGHĨA L_THUỘC TÍNH 
1. Ðịnh nghĩa L_thuộc tính. 
 Mỗi định nghĩa trực tiếp cú pháp là một định nghĩa L thuộc tính nếu mỗi một thuộc 
tính kế thừa của Xi (1 <= i <= n) trong vế phải của luật sinh A → X1X2...Xn phụ 
thuộc chỉ vào: 
 1. Các thuộc tính của X1, X2,..., Xi - 1 
 2. Các thuộc tính kế thừa của A. 
 Ví dụ 5.11: Cho định nghĩa trực tiếp cú pháp: 
Luật sinh Luật ngữ nghĩa 
A Æ L M 
A Æ Q R 
L.i := l(A.i) 
M.i := m(L.s) A.s := f(M.s) 
R.i := r(A.i) 
Q.i := q(R.s) A.s := f(Q.r) 
Hình 5.16 - Ðịnh nghĩa trực tiếp cú pháp không phải là định nghĩa L_thuộc tính 
 Ðây không phải là một định nghĩa L_thuộc tính vì thuộc tính kế thừa Q.i phụ thuộc 
vào thuộc tính R.s của ký hiệu bên phải nó trong luật sinh. 
2. Lược đồ dịch 
Lược đồ dịch là một văn phạm phi ngữ cảnh trong đó các thuộc tính được kết hợp 
với các ký hiệu văn phạm và các hành vi ngữ nghĩa nằm trong cặp dấu { } được xen 
vào bên phải của luật sinh. 
Ví dụ 5.12: Lược đồ dịch một biểu thức trung tố với phép cộng và trừ thành dạng 
hậu tố: 
 E Æ T R 
 R Æ addop T { print ( addop.lexeme) } R1 | ε 
 T Æ num { print ( num.val) } 
Với biểu thức 9 - 5 + 2 ta có cây phân tích cú pháp (hình 5.16) 
 Ðể xây dựng một lược đồ dịch, chúng ta xét hai trường hợp sau đây: 
 Trường hợp 1: Chỉ chứa thuộc tính tổng hợp: 
 127
 Với mỗi một luật ngữ nghĩa, ta tạo một hành vi ngữ nghĩa và đặt hành vi này vào 
cuối vế phải luật sinh. 
 Ví dụ 5.13: 
 Luật sinh Luật ngữ nghĩa 
 T Æ T1 * F T.val := T1.val * F.val 
 Ta có lược đồ dịch: 
 T Æ T1 * F { T.val := T1.val * F.val} 
 Trường hợp 2: Có cả thuộc tính tổng hợp và kế thừa phải thỏa mãn 3 yêu cầu sau 
đây: 
1. Thuộc tính kế thừa của một ký hiệu trong vế phải của luật sinh phải được xác 
định trong hành vi nằm trước ký hiệu đó. 
 2. Một hành vi không được tham khảo tới thuộc tính tổng hợp của một ký hiệu 
nằm bên phải hành vi đó. 
 3. Thuộc tính tổng hợp của ký hiệu chưa kết thúc trong vế trái chỉ có thể được 
xác định sau khi tất cả các thuộc tính mà nó tham khảo đã được xác định. Hành vi xác 
định các thuộc tính này luôn đặt cuối vế phải của luật sinh. 
 Với một định nghĩa trực tiếp cú pháp L_thuộc tính ta có thể xây dựng lược đồ 
dịch thỏa mãn 3 yêu cầu nói trên. 
E 
9
{ print(‘9’) } R 
R 
R 
ε 
T 
T - { print(‘-’) } 
5 { print(‘5’) } 
+ T { print(‘+’) } 
2 { print(‘2’) } 
Hình 5.17 - Cây phân tích cú pháp của các hoạt động biểu diễn 9-5+2 
 Ví dụ 5.14: Bộ xử lý các công thức toán học – EQN - có thể xây dựng các biểu 
thức toán học từ các toán tử sub (subscripts) và sup (superscripts). Chẳng hạn: 
 input output 
 BOX sub box BOX box
 a sub {i sup 2 } 2ia
 128
 Ðể xác định chiều rộng và chiều cao của các hộp ta có định nghĩa L_thuộc tính như 
sau: 
Luật sinh Luật ngữ nghĩa 
S Æ B 
B Æ B1B2 
B Æ B1 sub B2
B Æ text 
B.ps := 10 
S.ht := B.ht 
BB1.ps := B.ps 
BB2.ps := B.ps 
B.ht := max(B1.ht, B2.ht) 
BB1.ps := B.ps 
BB2.ps := shrink(B.ps) 
B.ht := disp(B1.ht, B2.ht) 
B.ht := text.h * B.ps 
Hình 5.18 - Ðịnh nghĩa trực tiếp cú pháp xác định kích thước và chiều cao của các 
hộp 
 Trong đó: 
- Ký hiệu chưa kết thúc B biểu diễn một công thức. 
- Luật sinh B → BB biểu diễn sự kề nhau của hai hộp. 
- Luật sinh B → B sub B biểu diễn sự sắp đặt, trong đó hộp chỉ số thứ 2 có kích 
thước nhỏ hơn, nằm thấp hơn hộp thứ nhất. 
- Thuộc tính kế thừa ps (point size - kích thước điểm) phản ánh độ lớn của công 
thức. 
- Luật sinh B → text ứng với luật ngữ nghiã B.ht:= text.h * B.ps lấy chiều cao 
thực của text (h) nhân với kích thước điểm của B để có được chiều cao của 
hộp. 
- Luật sinh B → B1B2 được áp dụng thì B1, B2 kế thừa kích thước điểm của B 
bằng luật copy. Ðộ cao của B bằng giá trị lớn nhất trong độ cao của B1, B2. 
- Khi luật sinh B → B1 sub B2 được áp dụng thì hàm shrink sẽ giảm kích thước 
điểm của B2 còn 30% và hàm disp đẩy hộp B2 xuống. 
Ðây là một định nghĩa L_thuộc tính vì chỉ có duy nhất một thuộc tính kế thừa ps và 
thuộc tính này chỉ phụ thuộc vào vế trái của luật sinh. 
 Dựa vào 3 yêu cầu nói trên, ta xen các hành vi ngữ nghĩa tương ứng với luật ngữ 
nghĩa vào vế phải của mỗi luật sinh để được lược đồ dịch. 
 S Æ {B.ps := 10 } 
 B {S.ht := B.ht } 
 B Æ { B1.ps := B.ps } 
 B1 {BB2.ps := B.ps } 
 B2 {B.ht := max(B1.ht, B2.ht ) } 
 129
 B Æ {B1.ps := B.ps } 
 B1 
 sub {BB2.ps := shrink(B.ps) } 
 B2 {B.ht := disp(B1.ht, B2.ht ) } 
 B Æ text {B.ht := text.h * B.ps } 
Hình 5.19 - Lược đồ dịch được tạo ra từ hình 5.18 
Chú ý: Ðể dễ đọc mỗi ký hiệu văn phạm trong luật sinh được viết trên một dòng 
và hành vi được viết vào bên phải. 
Chẳng hạn: 
 S Æ {B.ps := 10 } B {S.ht := B.ht } 
Ðược viết thành S Æ {B.ps := 10 } 
 B {S.ht := B.ht } 
V. DỊCH TRÊN XUỐNG 
1. Loại bỏ đệ qui trái 
 Vấn đề loại bỏ đệ qui trái của một văn phạm đã được trình bày trong mục III của 
chương IV. Ở đây chúng ta giải quyết vấn đề chuyển một lược đồ dịch của văn phạm 
đệ quy trái thành một lược đồ dịch mới không còn đệ quy. 
 Giả sử, ta có lược đồ dịch dạng 
 A Æ A1 Y {A.a := g(A1.a, Y.y) } 
 A Æ X {A.a := f(X.x) } 
 Ðây là một văn phạm đệ quy trái, áp dụng giải thuật khử đệ qui trái ta được văn 
phạm không đệ quy trái 
 A Æ X R 
 R Æ Y R | ε 
 Bổ sung hành vi ngữ nghĩa cho văn phạm ta được lược đồ dịch: 
 A Æ X { R.i := f(X.x) } 
 R {A.a := R.s } 
 R Æ Y {R1.i := g(R.i, Y.y) } 
 R1 {R.s := R1.s } 
 R Æ ε {R.s := R.i } 
 Ví dụ 5.15: Xét lược đồ dịch của văn phạm đệ quy trái cho biểu thức. 
 E Æ E1 + T {E.val := E1.val + T.val } 
 E Æ E1 - T {E.val := E1.val - T.val } 
 E Æ T {E.val := T.val } 
 130
 T Æ (E) {T.val := E.val } 
 T Æ num {T.val := num.val } 
Hình 5.20 - Lược đồ dịch của một văn phạm đệ quy trái 
 Vận dụng ý kiến trên ta khử đệ quy trái để được lược đồ dịch không đệ quy trái 
 E Æ T {R.i := T.val } 
 R {E.val := R.s } 
 R Æ + 
 T {R1.i := R.i + T.val } 
 R1 {R.s := R1.s } 
 R Æ - 
 T {R1.i := R.i - T.val } 
 R1 {R.s := R1.s } 
 R Æ ε {R.s := R.i } 
 T Æ ( 
 E 
 ) {T.val := E.val } 
T Æ num { T.val := num.val } 
Hình 5.21 - Lược đồ dịch đã được chuyển đổi có văn phạm đệ quy phải 
 Chẳng hạn đánh giá biểu thức 9 - 5 + 2 E 
 T.val = 9 
Hình 5.22 - Xác định giá trị của biểu thức 9-5+2 
 Ví du 5.16: Xét lược đồ dịch xây dựng cây cú pháp cho biểu thức 
E Æ E1 + T {E.nptr := mknode(‘+’, E1.nptr, T.nptr) } 
 E Æ E1 - T {E.nptr := mknode(‘-’, E1.nptr, T.nptr) } 
 E Æ T {E.nptr := T.nptr } 
 T Æ (E) {T.nptr := E.nptr } 
 T Æ id {T.nptr := mkleaf(id, id.entry) } 
R.i = 6 
num.val = 9 
R.i = 9 
+ 
T.val = 5 
num.val = 5 
R.i = 4 
T.val = 2 
num.val = 2 
- 
ε 
 131
 T Æ num {T.nptr := mkleaf(num, num.val) } 
Áp dụng quy tắc khử đệ quy trái trên với E ≈ A, +T, -T ≈ Y và T ≈ X ta có lược đồ 
dịch 
E Æ T {R.i := T.nptr } 
 R {E.nptr := R.s } 
 R Æ + 
 T {R1.i := mknode(‘+’, R.nptr, T.nptr) } 
 R1 {R.s := R1.s } 
 R Æ - 
 T {R1.i := mknode(‘-’, R.nptr, T.nptr) } 
 R1 {R.s := R1.s } 
 R Æ ε {R.s := R.i } 
 T Æ ( 
 E 
 ) {T.nptr := E.nptr } 
 T Æ id {T.nptr := mkleaf(id, id.entry) } 
 T Æ num { T.nptr := mkleaf(num, num.val) } 
Hình 5.23 - Lược đồ dịch được chuyển đổi để xây dựng cây cú pháp 
2. Thiết kế bộ dịch dự đoán 
Giải thuật: Xây dựng bộ dịch trực tiếp cú pháp dự đoán (Predictive - Syntax -
Directed Translation) 
Input: Một lược đồ dịch cú pháp trực tiếp với văn phạm có thể phân tích dự đoán. 
Output: Mã cho bộ dịch trực tiếp cú pháp. 
Phương pháp: 
1. Với mỗi ký hiệu chưa kết thúc A, xây dựng một hàm có các tham số hình thức 
tương ứng với các thuộc tính kế thừa của A và trả về giá trị của thuộc tính tổng 
hợp của A. 
2. Mã cho ký hiệu chưa kết thúc A quyết định luật sinh nào được dùng cho ký hiệu 
nhập hiện hành. 
3. Mã kết hợp với mỗi luật sinh như sau: chúng ta xem xét token, ký hiệu chưa kết 
thúc và hành vi bên phải của luật sinh từ trái sang phải 
 i) Ðối với token X với thuộc tính tổng hợp x, lưu giá trị của x vào trong biến 
được khai báo cho X.x. Sau đó phát sinh lời gọi để hợp thức (match) token X và 
dịch chuyển đầu đọc. 
 132
 ii) Ðối với ký hiệu chưa kết thúc B, phát sinh lệnh gán C := B(b1, b2, ..., bk) với 
lời gọi hàm trong vế phải của lệnh gán, trong đó b1, b2,..., bk là các biến cho các 
thuộc tính kế thừa của B và C là biến cho thuộc tính tổng hợp của B. 
 iii) Ðối với một hành vi, chép mã vào trong bộ phân tích cú pháp, thay thế mỗi 
tham chiếu tới một thuộc tính bởi biến cho thuộc tính đó. 
Ví dụ 5.17: Xét lược đồ dịch cho việc xây dựng cây cú pháp cho biểu thức. Ta thấy 
đó là một văn phạm LL(1) nên phù hợp cho phân tích trên xuống. Với 3 ký hiệu chưa 
kết thúc E, R, T ta xây dựng 3 hàm tương ứng: 
 function E: ↑ syntax - tree - node; /* E không có thuộc tính kế thừa */ 
 function R (i : ↑ syntax - tree - node) : ↑ syntax - tree - node 
 function T : ↑ syntax - tree - node; 
 Dùng token addop biểu diễn cho + và - ta có thể kết hợp hai luật sinh thành một 
luật sinh mới. 
 R Æ addop 
 T {R1.i := mknode(addop.lexeme, R.i, T.nptr) } 
 R1 {R.s := R1.s } 
 R Æ ε {R.s := R.i } 
Ta có hàm R như sau: 
 function R(i : ↑ syntax_ tree_node) : ↑ syntax_tree_node; 
 var nptr, i1, s1, s : ↑ syntax_tree_node; 
 addoplexeme : char; 
 begin 
 if lookahead = addop then 
 begin /* luật sinh R → addop TR */ 
 addoplexeme := lexval; 
 match(addop); 
 nptr := T; 
i1 := mknode(addoplexeme, i, nptr); 
s1 := R(i1); 
s := s1; 
 end 
 else s := i; /* Luật sinh R → ε */ 
 return s; 
 end; 
Hình 5.24 - Xây dựng cây cú pháp đệ quy giảm 
 133
BÀI TẬP CHƯƠNG V 
5.1. Xây dựng một cây phân tích cú pháp chú thích cho biểu thức số học sau: 
(4 * 7+ 1) * 2 
5.2. Xây dựng một cây phân tích cú pháp và cây cú pháp cho biểu thức ((a) + (b)) theo: 
 a) Ðịnh nghĩa trực tiếp cú pháp cho biểu thức số học. 
 b) Lược đồ dịch cho biểu thức số học. 
5.3. Xây dựng một DAG cho các biểu thức sau đây: 
 a) a + a + ( a+ a + a + ( a+ a+ a+ a)) 
 b) x *( 3 *x + x * x) 
5.4. Văn phạm sau đây sinh ra các biểu thức có được khi áp dụng một toán tử số học + 
cho các hằng số nguyên và số thực. Khi 2 số nguyên được công lại, kiểu kết quả là 
kiểu nguyên, ngược lại nó là kiểu số thực. 
 E → E + T | T 
 T → num • num | num 
 a) Ðưa ra một định nghĩa trực tiếp cú pháp xác định kiểu của mỗi biểu thức con. 
 b) Mở rộng định nghĩa trực tiếp cú pháp trên để dịch các biểu thức thành ký 
pháp hậu tố và xác định các kiểu. Dùng toán tử một ngôn inttoreal để chuyển một giá 
trị nguyên thành giá trị thực tương đương mà nhờ đó cả hai toán hạng của + ở dạng 
hậu tố có cùng kiểu. 
5.5. Giả sử các khai báo sinh bởi văn phạm sau: 
 D → id L 
 L → , id L | : T 
 T → integer | real 
 a) Xây dựng một lược đồ dịch để nhập kiểu của mỗi định danh vào bảng danh 
biểu. 
 b) Xây dựng chương trình dịch dự đoán từ lược đồ dịch trên. 
 134
5.6. Cho văn phạm sinh ra các dòng text như sau: 
 S → L 
 L → L B | B 
 B → B sub F | F 
 F → { L } | text 
 a) Xây dựng một định nghĩa trực tiếp cú pháp cho văn phạm. 
 b) Chuyển định nghĩa trực tiếp cú pháp trên thành lược đồ dịch. 
 c) Loại bỏ đệ quy trái trong lược đồ dịch vừa xây dựng. 
 135

File đính kèm:

  • pdfgiao_trinh_nguyen_ly_ngon_ngu_lap_trinh_chuong_5_dich_truc_t.pdf