Bài giảng Trí tuệ nhân tạo - Chương 2: Tác tử thông minh - Lê Thanh Hương
Tác tử và môi trường
Một tác tử - agent được hiểu là bất cứ thứ gì cảm
nhận môi trường quanh nó thông qua các cảm biến
và á tác động trở lại ôi môi trường thông qua bộ kí h ch
hoạt.
Ví dụ 1: con người được xem là một tác tử
Cảm biến: mắt, tai,
Bộ kích hoạt: tay, chân,
Ví dụ 2: Người máy Aishimo
Cảm biến: camera, các bộ dò đường hồng ngoại
Bộ kích hoạt: mô tơ
Tác tử và môi trường
Hàm tác tử là ánh xạ từ tập cảm nhận trong quá
khứ tới hành động tương ứng:
4
f: P* Æ A
Chương trình tác tử chạy trên kiến trúc vật lý để tạo
ra hàm f
Bạn đang xem tài liệu "Bài giảng Trí tuệ nhân tạo - Chương 2: Tác tử thông minh - Lê Thanh Hương", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Trí tuệ nhân tạo - Chương 2: Tác tử thông minh - Lê Thanh Hương
1Chương 2 Tác tử thông minh Lê Thanh Hương 1 Viện CNTT&TT – ĐHBKHN Nội dung 1. Tác tử và môi trường ố ể ủ ử2. Một s đặc đi m c a tác t 3. PEAS – Những yếu tố cần xem xét khi thiết kế tác tử 4. Đặc điểm của môi trường 5 Phân loại tác tử 2 . Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 2.1. Tác tử và môi trường Một tác tử - agent được hiểu là bất cứ thứ gì cảm nhận môi trường quanh nó thông qua các cảm biến à á độ ở l i ôi ờ hô bộ kí hv t c ng tr ạ m trư ng t ng qua c hoạt. Ví dụ 1: con người được xem là một tác tử Cảm biến: mắt, tai, Bộ kích hoạt: tay, chân, 3 Ví dụ 2: Người máy Aishimo Cảm biến: camera, các bộ dò đường hồng ngoại Bộ kích hoạt: mô tơ Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 2.1. Tác tử và môi trường Hàm tác tử là ánh xạ từ tập cảm nhận trong quá khứ tới hành động tương ứng: 4 f: P* Æ A Chương trình tác tử chạy trên kiến trúc vật lý để tạo ra hàm f Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 2Chương trình tác tử dựa trên bảng điều kiện Function TABLE-DRIVEN-AGENT(percept) returns action static: percepts, một dãy cảm nhận, khởi đầu rỗng table, bảng các hành động ứng với chuỗi cảm nhận Thêm percept vào cuối dãy percepts action Å LOOKUP(percepts, table) Return action 5 Nhược điểm: sự bùng nổ kích thước của table Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN Ví dụ: tác tử hút bụi thông minh Cảm nhận: vị trí (A hoặc B), trạng thái (sạch hoặc bẩn) Hà h độ t ái Dãy cảm nhận Hành động [A, sạch] [A, bẩn] [B, sạch] Qua phải Hút bụi Qua trái 6 n ng: qua r , qua phải, hút bụi, NoOp [B, bẩn] [A, sạch][A, sạch] [A, sạch][A, bẩn] Hút bụi Qua phải Hút bụi Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN Ví dụ: tác tử hút bụi thông minh Funtion Reflex-Vacuum-Agent([vị trí, trạng thái]) _ _ returns hành_động If trạng_thái = Bẩn then return Hút_Bụi Else if vị_trí = A then return Qua_Phải Else if vị_trí = B then return Qua_Trái End Function 7 Liệu tác tử có hoạt động hợp lý không? Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 2.2. Đặc điểm của tác tử Với mỗi dãy trạng thái cảm nhận được cùng với tri thức sẵn có, tác tử phải lựa chọn hành động sao cho tối đa hóa hàm đánh giá hiệu năng Cho đích cần đạt và các tri thức sẵn có, tác tử cần: 1. Sử dụng thông tin thu được từ các quan sát mới để cập nhật lại tri thức của nó 2. Trên cơ sở tri thức của nó, thực thi hành động nhằm đạt được mục tiêu đề ra trong thế giới của nó 8 . Một tác tử là tự trị nếu hành vi được xác định bởi kinh nghiệm của chính bản thân nó (với khả năng học và thích nghi) Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 32.3. PEAS – Yếu tố xem xét khi thiết kế Khi thiết kế, xây dựng một tác tử, phải xem xét 4 yếu tố: Performance measure: hàm đo hiệu năng Enviroment: môi trường Actuator: bộ kích hoạt Sensor: cảm biến 9 Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 2.3. PEAS: một số ví dụ Tác tử lái xe tự động Tác tử mua hàng Tác tử lọc thư rác ố ấHàm đánh giá độ an toàn, t c độ, đúng luật, lợi ích giá, ch t lượng, độ tin cậy của đơn hàng #phân loại sai Môi trường đường, giao thông, người đi bộ, lái xe người bán hàng, tác tử vận chuyển, khách hàng phần mềm email trên server/client Bộ kích hoạt bánh xe, chân trình bày hoá đơn, các thư được 10 ga, phanh điền HĐ, gửi HĐ gãn nhãn Bộ cảm biến camera, máy đo tốc độ trang HTML, form giao diện với KH nội dung thư, tiêu đề, thời gian Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 2.4. Đặc điểm của môi trường Tính quan sát được: đầy đủ - bộ phận Tính xác định được: trạng thái tiếp theo của môi ểtrường có th hoàn toàn xác định được dựa trên trạng thái hiện tại và hành động thực hiện bởi tác tử hay không? Tính động: môi trường là tĩnh tại hay thay đổi trong khi tác tử hoạt động? Tính liên tục hay rời rạc: các cảm nhận hoặc hành vi có được phân biệt một cách rõ ràng không? 11 Đơn tác tử hay đa tác tử: trong môi trường, có một hay nhiều tác tử cùng hoạt động? Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 2.5. Phân loại tác tử Dựa vào đặc điểm của hàm tác tử, ánh xạ dãy cảm nhận tới hành động tương ứng chia tác tử , thành 4 loại: Tác tử phản xạ đơn giản Tác tử phản xạ có trạng thái Tác tử hướng mục đích Tác tử hướng lợi ích 12 Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 4Tác tử phản xạ đơn giản Agent Envir Sensors What the world is like now Function SIMPLE-REFLEX- AGENT(percept) returns action t ti l tậ á l ật d điề kiệ hà h độ iro n m ent Effectors What action I should do nowCondition−action rules 13 s a c: ru es, p c c u ạng u n- n ng state Å INTERPRET-INPUT(percept) rule Å RULE-MATCH(state, rules) action Å RULE-ACTION[rule] Return action Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN Tác tử phản xạ có trạng thái Sensors State Environm ent What the world is like now What action I should do now How the world evolves What my actions do Condition−action rules 14 Agent t Effectors Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN Tác tử hướng mục đích E Sensors What the world is like now State How the world evolves Một trạng thái Các dạng đích: Agent E n vironm ent Effectors What it will be like if I do action A What action I should do now What my actions do Goals Tập các trạng thái thỏa mãn một số tính chất nào đó Một phép thử áp dụng vào trạng thái và thông báo có thỏa đích hay không 15 Đích khiến tác tử phải suy luận về tương lai hoặc các trạng thái khác. Có thể có trường hợp không hành động nào đưa đến đích. Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN Tác tử hướng lợi ích Env Sensors What it will be like What the world is like now State How the world evolves What my actions do Agent n vironm ent Effectors if I do action A How happy I will be in such a state What action I should do now Utility 16 Các tác tử thực hiện hành động sao cho có lợi nhất về lâu dài Các tác tử muốn thực hiện hành động đem lại lợi ích lớn hơn Có thể suy luận về các nhiệm vụ có nhiều đích, về sự xung đột giữa các đích, và về các tình huống không chắc chắn. Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN 5Tác tử với khả năng học 17 Lê Thanh Hương – Viện CNTT&TT - ĐHBKHN
File đính kèm:
- bai_giang_tri_tue_nhan_tao_chuong_2_tac_tu_thong_minh_le_tha.pdf