Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

VEKİLLER-Agents Ders 2. Konular Vekiller ve Ortamları Akıllı olma (Rationality) PEAS ( Başarı Ölçüsü,Ortam, Tepkivericiler, Algılayıcılar ) Ortam türleri.

Benzer bir sunumlar


... konulu sunumlar: "VEKİLLER-Agents Ders 2. Konular Vekiller ve Ortamları Akıllı olma (Rationality) PEAS ( Başarı Ölçüsü,Ortam, Tepkivericiler, Algılayıcılar ) Ortam türleri."— Sunum transkripti:

1 VEKİLLER-Agents Ders 2

2 Konular Vekiller ve Ortamları Akıllı olma (Rationality) PEAS ( Başarı Ölçüsü,Ortam, Tepkivericiler, Algılayıcılar ) Ortam türleri Vekil türleri

3 Vekiller Vekil- Algılayıcıları ile ortam bilgilerini alan, bu bilgileri algılayan, duyan, anlayan ve tepkivericileri ile bu ortama tepki veren nesne İnsan vekil: –Algılayıcılar-gözler, kulaklar,… –Tepkivericiler -ayaklar, eller, ağız… Robot vekil: –Algılayıcılar-camera, kızılötesi bulucular,.. –Tepkivericiler- çeşitli motorlar

4 Vekilin yapısı Ortam Vekil algılar hareketler ? Algılayıcı Tepkiverici Ne Yapmalı

5 Vekillerin Tasarımı Vekil programı –Algıları hareketlere dönüştüren işlev Mimari –Programların yürütüldüğü bilgisayarlı sistem Vekil = mimari + program Vekil programını tasarlamak için bizim aşağıdakiler hakkında bilgimiz olmalıdır: –Mümkün algılamalar ve hareketler –Amaçlar ve başarı ölçümü –Vekilin işlem yapacağı ortamın türü

6 Vekiller ve Ortamları Vekil fonksiyonu, vekilin algıladığı bilgileri (p) hareketlere (A) dönüştürür: F( P)  A Vekil programı, vekilin fiziki mimarisi üzerinde F( P) ‘i üretmek içindir

7 Örnek: Süpürge vekilin dünyası Algılamalar: mekan ve içeriği, örn., [A,Kirli] Hareketler: Sol, Sağ,Süpürmek, İşlemYok

8 Vekil Programı function Vekil(algı) returns hareket bellek ← Bellek_Güncelle(bellek,algı) hareket ← En_İyi_Hareket(bellek) bellek ← Bellek_Güncelle(bellek, hareket) return hareket

9 Vekil Programları -Arama tablosu function Tablo_Tabanlı_Vekil(algı) returns hareket algılar, /*başlangıçta boş */ tablo /* algılar üzere indekslenmiş tablo, başlangıçta tam belirlenmiştir*/ algı’yı, algılar tablosunun sonuna ilave et hareket ← Tabloya_Bak(algı, tablo) return hareket

10

11 Neden arama tablosu başarısızdır Oldukça çok kayıt gerekmektedir –Satranç oynayan vekil için kayıt Tabloyu oluşturmak çok zaman alıyor Özerklik Yoktur –Vekilin tüm hareketleri önceden belirlenmiştir (kaydedilmiştir)

12 Mantıklı Vekiller –logical agent Algılaya bildiklerine ve yapa bildiklerine dayanarak “doğru şeyler yapmak” için çaba gösteren vekiller. Doğru hareket vekilin başarılılık etkenlerindendir Başarı ölçüsü: vekilin davranışının başarılılığını gösteren kıstas. E.süpürgesi vekilinin başarısı sorulan tozun miktarı ile, harcanan zamanla, tüketilen enerji ile, kopardığı gürültü ile … belirlene bilir mantıklı vekil, her bir algılama üzere mümkün hareketler içinden başarıyı en fazla yapanı seçmelidir.

13 Mantıklılık ve her şeyi başarmak Mantıklı olmak her şeyi başarmak değildir –“Her şeyi başarmak”, vekilin, tüm hareketlerinin ne ile sonuçlanacağını bildiği anlamına geliyor –Örnek: caddeyi geçerken, kafana uçağın kapısının düşeceğini önceden bilmek Mükemmelliğe gerek yoktur. –Her zaman doğru şeyler yapmak mümkün değildir –Beklenen başarı, nelerin algılandığına bağlıdır Mantıksal davranış aşağıdaki etkenlere bağlıdır –Başarı ölçüsü –Algılama tümcesi: Vekilin belirli bir anda algıladığı her şey –Ortam hakkında vekilin bildikleri –Vekilin yapa bileceği mümkün hareketler Vekilin davranışı yalnız onun kendi deneyimi, öğrenme ve uyum sağlaya bilme yeteneği ile belirlenirse, vekil özerktir

14 İdeal mantıklı vekil Her mümkün algılama tümcesi için, önceden varolan bilgilerine ve algılamalar ardışıklığına dayanarak başarı ölçüsünü en iyi yapan hareketleri gerçekleştiren vekil Yararlı bilgiler edinmek için hareketler –Böyle hareketler beklenen başarıyı maksimum yapar

15 İdeal Vekiller Algılamadan harekete doğru İdeal vekili oluşturma –Her mümkün algılama tümcesinin harekete dönüştürülmesi (haritalanması) –İdeal dönüştürme: Her algılama tümcesi için belli olan en yüksek başarı ölçüsüne uygun cevabın bulunması Belirgin tabloya her zaman gerek duyulmaz –Gereken tek şey dönüştürmenin tanımlanmasıdır –Örnek: kare kökün 15 onluk rakama dek kesinlikle hesaplanması için büyük tablo yerine küçücük bir program yeterlidir

16 Eğer vekilin tüm hareketleri yalnız önceden kaydedilmiş bilgilere dayanırsa, bu vekil özerklikten yoksundur. Vekilin özerklik davranışı onun deneyimi ile belirlenmelidir –Bazı başlangıç bilgiler ve öğrenme yeteneği gerekmektedir Özerk olmayan vekiller esneklikten yoksundur İdeal Vekiller Özerklik

17 Vekilin Nitelendirilmesi Başarı bileşenleri:-PEAS –Başarı ölçüsü -Performance measure –Ortam- Environment –Tepkivericiler-Actuators –Algılayıcılar- Sensors

18 PEAS. Örnek: Taksi süren vekil Mantıklı vekillerin tasarımı için PEAS bileşenleri belirlenmelidir Şimdiki durumu bilmek için algıların kullanılması –Araba nerededir? Şu anki sürat kaçtır? Hareket koşulları nasıldır? Zıt amaçların varlığı ; Farklı ortamların varlığı Vekil türü AlgılayıcılarHareketlerHedeflerOrtam Taksi sürü- cüsü Görme,hız ölçme, yolölçme,duy ma Seyir, pedala basma, frenleme, korna çalma, müşteri ile konuşma Güvenlik, hızlı olmak, yasalara uymak, rahatlık, kazanç Yol, diğer araçlar, yayalar, müşteriler

19 _PEAS(Örnekler) -devamı Vekilin türüAlgılamalarHareketlerAmaçlarOrtam Tıbbi teşhislerbelirtiler, bulgular, hastanın cevapları Sorular, muayeneler, davranışlar Hastanın iyileşmesi, maliyetin düşürülmesi Hasta, hastane Uydu görüntülerinin çözümlenmesi Pikseller, renkler Resimlerin sınıflandırılması Sınıflandırma nın doğru yapılması Uydulardan görüntüler Parçaları seçen robot ParçalarParçaların ayrılması ve çeşitlendirilmesi Parçaların düzgün yerine koyulması Nakletme bandı Etkileşimli İngilizce öğreticisi KelimelerAlıştırmalar, önermeler Öğrenci puanının en yüksek olması Öğrenciler kümesi

20 Ortam Türleri Tam gözlem-kısmı gözlem : –Zamanın verilmiş diliminde vekilin algılayıcıları tarafından ortamın tüm durumunun gözlemlenmesi mümkün mü? Belirgin-tahmini –Belirgin ortam -ortamın sonraki durumu tümüyle şimdiki duruma ve vekilin hareketlerine bağlıdır. –Tam erişilebilirlik durumunda belirsizlik yoktur; ortam belirgindir Epizodik - ardışık –Vekilin yaşamı atomik epizotlara (parçalara) bölüne bilir. Epizottaki hareketin seçimi, yalnız epizodun kendisine bağlıdır. –Epizot önceki epizotlara bağlı değil

21 Ortam Türleri (devamı) Statik- dinamik –Vekilin karar oluşturduğu (düşündüğü) süreç içinde ortam değişirse bu dinamik ortamdır, değişmezse statik ortamdır Statik ortamlarda vekilin aralık görüntüleri kaydetmesine gerek yoktur –Yarım dinamik: ortam değişmez, ama vekilin başarısı değişe bilir Ayrık-sürekli –algılamalar ve ya hareketler sayıla bilirse (ayrık ise) ortam ayrık, sayılamıyorsa süreklidir –Satranç ortamı ayrıktır, çünkü her hamlede sınırlı sayıda hareketler var. Tek vekil -çoklu vekil: Tek vekil ortamda kendi başına faaliyette bulunuyor. Çoklu vekiller işbirliği yapıyorlar. Çok zor ortamlar –Erişile bilmezlik, epizodik olmayan, dinamik, sürekli Gerçek ortamlar çoğunlukla öyle karmaşıktır ki, onlara belirli olmayan (non-deterministic) ortam gibi bakılmalıdır

22 Ortam Türlerine Örnekler OrtamTam Gözlem BelirginEpizodikStatikayrık Satranç (saatle)EEHY.din.E Satranç (saatsiz)EEHEE PokerHHHEE TavlaEHHEE Taksi sürmeHHHHH

23 Sonraki sayfalar bilgi amaçlıdır

24 Vekil Türleri Basit tepki vekili Model tabanlı vekil Amaca yönelik vekil Faydaya yönelik vekil

25 Basit tepki vekilleri (1) Koşul-hareket kuralları Örnek: Eğer öndeki araba frenlediyse, o zaman frenlemeği başlat ortam Vekil algılayıcılar Şimdi dünya nasıldır Şimdi hangi hareketi yapmalıyım tepkivericiler Koşul-hareket kuralları Vekilin hareketi yalnız şimdiki algılamalara bağlıdır, eski algılamalar dikkate alınmaz

26 Basit tepki vekilleri (2) function Basit_Tepki_Vekili(algı) returns hareket static: kurallar /* koşul-hareket kuralları kümesi durum ← Girişi_Yorumla(algı) kural ← Kural_Karşılaştır(durum, kurallar) hareket ← Kural_Hareket[kural] return hareket Uygulama alanı kısıtlıdır

27 Durum Model tabanlı Vekiller Hareketi seçmek için iç durum bellekte tutuluyor –Algılayıcılar tüm dünya durumuna erişimi sağlayamıyor Ortam Vekil Algılayıcılar Dünya şimdi nasıldır şimdi hangi hareketi yapmalıyım Tepkivericiler Koşul-hareket kuralları hareketler Eğer vekilin gözlemleri tam değilse, dünyanın, şu an göremediği kısmı hakkında bilgilerin saklanması ( eski algılara bağlı olan bazı durumların tutulması ) çok etkili ola bilir;

28 Model Tabanlı Vekiller (2) function Model_Tabanlı_Vekil(algı) returns hareket static: durum, mevcut dünyanın durumunu tanımlar kurallar, koşul-hareket kuralları kümesi durum ← Durum_Güncelle(durum, hareket, algı) kural ← Kural_Karşılaştır(durum, kurallar) hareket ← Kural_Hareket[kural] durum ← Durum_Güncelle(durum, hareket) return hareket Durum-güncelleme- yeni dünya durumları oluşturuluyor dünya oluşumları bellekte tutuluyor

29 Amaca yönelik Vekiller Amaç bilgisi –Hangi durumlar arzu edilendir? –Örnek: müşterinin adrese ulaşması Mümkün hareketleri sonuçları ile birleştirmek –Bazı zamanlarda tek hareket, bazı zamanlarda hareketler ardışıklığı Geleceği dikkate almak –Ne olacak? –Beni mutlu edecek bir şeyler olacak mı? Koşul-hareket kurallarından daha esnek –Ortam değiştikte bilgilerin güncellenmesi daha kolaydır –Örnek: yağmurda frenleme

30 Amaca yönelik vekiller durum ortam vekil algılayıcılar Dünya şimdi nasıldır Şimdi hangi hareketi yapmalıyım tepkivericiler Amaçlar Dünya nasıl değişiyor Menim hareketlerim nasıl olmalıdır hareketi yapmış olsam ne olacak

31 Yarara yönelik vekiller Amaçlara farklı yollarla ulaşıla biliyor –Bu yollardan hangisi daha arzu edilendir? Dünya durumlarının faydası –Amaca ulaştıkta vekil ne kadar mutlu olacak? –Durumu gerçek sayıya dönüştürmeli Amaca dayalı vekilin yapamadığı mantıklı kararlara izin veriyor –Yalnız birisine ulaşmak mümkün olan zıt amaçlar –Kesin olarak hiç birisine ulaşılamayacak birkaç amaç Her mantıklı vekilin fayda fonksiyonu vardır –Belirgin fayda fonksiyonunun kullanılması –Bazı hallarda yalnız amaçların verilmesi daha iyi sonuçlar doğura biler

32 Yarara yönelik vekiller durum ORTAM Vekil algılayıcılar Dünya şimdi nasıldır Şimdi hangi hareketi yapmalıyım Tepkiverici Ben bu hareketi yapsam dünya nasıl olacak Bu durumda ben ne kadar mutlu olacağım Fayda hareketler

33 Öğrenen vekiller ORTAM Vekil algılayıcılar Tepkiverici değerlendirme Öğrenme öğesi icracı Sorun üreticisi Öğrenme amacı Geri dönüşüm icra standardı değişimler bilgi

34 Öğrenen vekiller Değerlendirme- şu anki durumun değerlendirilmesi (başarı standardına uygun olarak) Öğrenme öğesi- başarıyı iyileştirmek için Sorun çözücü- yeni deneyimlere götüren hareketlerin önerilmesi icracı- dış hareketleri seçmek için (bilgi ve prosedürler)


"VEKİLLER-Agents Ders 2. Konular Vekiller ve Ortamları Akıllı olma (Rationality) PEAS ( Başarı Ölçüsü,Ortam, Tepkivericiler, Algılayıcılar ) Ortam türleri." indir ppt

Benzer bir sunumlar


Google Reklamları