Bài giảng Trí tuệ nhân tạo - Chương 2: Tác tử thông minh - Lê Thanh Hương

Tác tử và môi trường

„ Một tác tử - agent được hiểu là bất cứ thứ gì cảm

nhận môi trường quanh nó thông qua các cảm biến

và á tác động trở lại ôi môi trường thông qua bộ kí h ch

hoạt.

„ Ví dụ 1: con người được xem là một tác tử

‰ Cảm biến: mắt, tai,

‰ Bộ kích hoạt: tay, chân,

„ Ví dụ 2: Người máy Aishimo

‰ Cảm biến: camera, các bộ dò đường hồng ngoại

‰ Bộ kích hoạt: mô tơ

Tác tử và môi trường

„ Hàm tác tử là ánh xạ từ tập cảm nhận trong quá

khứ tới hành động tương ứng:

4

f: P* Æ A

„ Chương trình tác tử chạy trên kiến trúc vật lý để tạo

ra hàm f

pdf 5 trang kimcuc 6560
Bạn đang xem tài liệu "Bài giảng Trí tuệ nhân tạo - Chương 2: Tác tử thông minh - Lê Thanh Hương", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Trí tuệ nhân tạo - Chương 2: Tác tử thông minh - Lê Thanh Hương

Bài giảng Trí tuệ nhân tạo - Chương 2: Tác tử thông minh - Lê Thanh Hương
1Chương 2 
Tác tử thông minh
Lê Thanh Hương
1
Viện CNTT&TT – ĐHBKHN
Nội dung
1. Tác tử và môi trường
ố ể ủ ử2. Một s đặc đi m c a tác t
3. PEAS – Những yếu tố cần xem xét khi 
thiết kế tác tử
4. Đặc điểm của môi trường
5 Phân loại tác tử
2
. 
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
2.1. Tác tử và môi trường
„ Một tác tử - agent được hiểu là bất cứ thứ gì cảm 
nhận môi trường quanh nó thông qua các cảm biến
à á độ ở l i ôi ờ hô bộ kí hv t c ng tr ạ m trư ng t ng qua c 
hoạt.
„ Ví dụ 1: con người được xem là một tác tử
‰ Cảm biến: mắt, tai, 
‰ Bộ kích hoạt: tay, chân,  
3
„ Ví dụ 2: Người máy Aishimo
‰ Cảm biến: camera, các bộ dò đường hồng ngoại
‰ Bộ kích hoạt: mô tơ
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
2.1. Tác tử và môi trường
„ Hàm tác tử là ánh xạ từ tập cảm nhận trong quá 
khứ tới hành động tương ứng:
4
f: P* Æ A
„ Chương trình tác tử chạy trên kiến trúc vật lý để tạo 
ra hàm f
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
2Chương trình tác tử dựa trên bảng điều kiện
Function TABLE-DRIVEN-AGENT(percept) returns action
static: percepts, một dãy cảm nhận, khởi đầu rỗng
table, bảng các hành động ứng với chuỗi cảm nhận
Thêm percept vào cuối dãy percepts
action Å LOOKUP(percepts, table)
Return action
5
Nhược điểm: sự bùng nổ kích thước của table
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
Ví dụ: tác tử hút bụi thông minh
„ Cảm nhận: vị trí (A 
hoặc B), trạng thái 
(sạch hoặc bẩn)
Hà h độ t ái
Dãy cảm nhận Hành động
[A, sạch]
[A, bẩn]
[B, sạch]
Qua phải
Hút bụi
Qua trái
6
„ n ng: qua r , 
qua phải, hút bụi, 
NoOp
[B, bẩn]
[A, sạch][A, sạch]
[A, sạch][A, bẩn]
Hút bụi
Qua phải
Hút bụi
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
Ví dụ: tác tử hút bụi thông minh
Funtion Reflex-Vacuum-Agent([vị trí, trạng thái]) _ _ 
returns hành_động
If trạng_thái = Bẩn then return Hút_Bụi
Else if vị_trí = A then return Qua_Phải
Else if vị_trí = B then return Qua_Trái
End Function
7
„ Liệu tác tử có hoạt động hợp lý không?
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
2.2. Đặc điểm của tác tử
„ Với mỗi dãy trạng thái cảm nhận được cùng với tri 
thức sẵn có, tác tử phải lựa chọn hành động sao 
cho tối đa hóa hàm đánh giá hiệu năng
„ Cho đích cần đạt và các tri thức sẵn có, tác tử cần:
1. Sử dụng thông tin thu được từ các quan sát mới để 
cập nhật lại tri thức của nó
2. Trên cơ sở tri thức của nó, thực thi hành động nhằm 
đạt được mục tiêu đề ra trong thế giới của nó
8
 .
„ Một tác tử là tự trị nếu hành vi được xác định bởi 
kinh nghiệm của chính bản thân nó (với khả năng 
học và thích nghi)
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
32.3. PEAS – Yếu tố xem xét khi thiết kế
„ Khi thiết kế, xây dựng một tác tử, phải xem 
xét 4 yếu tố: 
‰ Performance measure: hàm đo hiệu năng
‰ Enviroment: môi trường
‰ Actuator: bộ kích hoạt
‰ Sensor: cảm biến
9
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
2.3. PEAS: một số ví dụ
Tác tử lái xe 
tự động
Tác tử mua hàng Tác tử 
lọc thư rác
ố ấHàm đánh 
giá
độ an toàn, t c 
độ, đúng luật, 
lợi ích
giá, ch t lượng, độ 
tin cậy của đơn 
hàng
#phân loại sai
Môi trường đường, giao 
thông, người đi 
bộ, lái xe
người bán hàng, 
tác tử vận chuyển, 
khách hàng
phần mềm 
email trên 
server/client
Bộ kích hoạt bánh xe, chân trình bày hoá đơn, các thư được 
10
ga, phanh điền HĐ, gửi HĐ gãn nhãn
Bộ cảm biến camera, máy 
đo tốc độ
trang HTML, form 
giao diện với KH
nội dung thư, 
tiêu đề, thời 
gian
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
2.4. Đặc điểm của môi trường
„ Tính quan sát được: đầy đủ - bộ phận
„ Tính xác định được: trạng thái tiếp theo của môi 
ểtrường có th hoàn toàn xác định được dựa trên 
trạng thái hiện tại và hành động thực hiện bởi tác tử 
hay không?
„ Tính động: môi trường là tĩnh tại hay thay đổi trong 
khi tác tử hoạt động?
„ Tính liên tục hay rời rạc: các cảm nhận hoặc hành vi 
có được phân biệt một cách rõ ràng không?
11
„ Đơn tác tử hay đa tác tử: trong môi trường, có một 
hay nhiều tác tử cùng hoạt động?
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
2.5. Phân loại tác tử
„ Dựa vào đặc điểm của hàm tác tử, ánh xạ dãy 
cảm nhận tới hành động tương ứng chia tác tử , 
thành 4 loại:
„ Tác tử phản xạ đơn giản
„ Tác tử phản xạ có trạng thái
„ Tác tử hướng mục đích
„ Tác tử hướng lợi ích
12
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
4Tác tử phản xạ đơn giản
Agent
Envir
Sensors
What the world
is like now
Function SIMPLE-REFLEX- AGENT(percept) returns action
t ti l tậ á l ật d điề kiệ hà h độ
iro
n
m
ent
Effectors
What action I
should do nowCondition−action rules
13
s a c: ru es, p c c u ạng u n- n ng
state Å INTERPRET-INPUT(percept)
rule Å RULE-MATCH(state, rules)
action Å RULE-ACTION[rule]
Return action
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
Tác tử phản xạ có trạng thái
Sensors
State
Environm
ent
What the world
is like now
What action I
should do now
How the world evolves
What my actions do
Condition−action rules
14
Agent
t
Effectors
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
Tác tử hướng mục đích
E
Sensors
What the world
is like now
State
How the world evolves „ Một trạng thái
Các dạng đích:
Agent
E
n
vironm
ent
Effectors
What it will be like
 if I do action A
What action I
should do now
What my actions do
Goals
„ Tập các trạng thái 
thỏa mãn một số tính 
chất nào đó
„ Một phép thử áp dụng 
vào trạng thái và 
thông báo có thỏa 
đích hay không
15
„ Đích khiến tác tử phải suy luận về tương lai hoặc các trạng thái 
khác. Có thể có trường hợp không hành động nào đưa đến 
đích.
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
Tác tử hướng lợi ích
Env
Sensors
What it will be like
What the world
is like now
State
How the world evolves
What my actions do
Agent
n
vironm
ent
Effectors
 if I do action A
How happy I will be
 in such a state
What action I
should do now
Utility
16
„ Các tác tử thực hiện hành động sao cho có lợi nhất về lâu dài
„ Các tác tử muốn thực hiện hành động đem lại lợi ích lớn hơn
„ Có thể suy luận về các nhiệm vụ có nhiều đích, về sự xung đột 
giữa các đích, và về các tình huống không chắc chắn.
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
5Tác tử với khả năng học
17
Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN

File đính kèm:

  • pdfbai_giang_tri_tue_nhan_tao_chuong_2_tac_tu_thong_minh_le_tha.pdf