BİL 4112 YAPAY ZEKA
Agents (Etmenler / Vekiller)
Konular Etmenler ve Ortamları Akla yatkın / makul olma (Rationality) PEAS ( Başarı Ölçüsü,Ortam, Tepkivericiler, Algılayıcılar ) Ortam türleri Vekil türleri
Etmenler (Vekiller / Ajanlar) Etmen: Algılayıcıları ile ortam bilgilerini alan, bu bilgileri algılayan, duyan, anlayan ve tepkivericileri ile bu ortama tepki veren nesne İnsan etmen: –Algılayıcılar-gözler, kulaklar,… –Tepkivericiler -ayaklar, eller, ağız… Robot etmen: –Algılayıcılar-kamera, kızılötesi bulucular,.. –Tepkivericiler- çeşitli motorlar
Etmen (Vekilin) yapısı Ortam Vekil algılar hareketler ? Algılayıcı Tepkiverici Ne Yapmalı
Etmenlerin Tasarımı Etmen programı –Algıları hareketlere dönüştüren işlev Mimari –Programların yürütüldüğü bilgisayarlı sistem Etmen = mimari + program Etmen programını tasarlamak için bizim aşağıdakiler hakkında bilgimiz olmalıdır: –Mümkün algılamalar ve hareketler –Amaçlar ve başarı ölçümü –Vekilin işlem yapacağı ortamın türü
Etmenler ve Ortamları Etmen fonksiyonu, vekilin algıladığı bilgileri (p) hareketlere (A) dönüştürür: F( P) A Etmen programı, etmenin fiziki mimarisi üzerinde F( P) ‘i üretmek içindir
Örnek: Süpürge vekilin dünyası Algılamalar: mekan ve içeriği, örn., [A,Kirli] Hareketler: Sol, Sağ,Süpürmek, İşlemYok
Etmen Programı function Vekil(algı) returns hareket bellek ← Bellek_Güncelle(bellek,algı) hareket ← En_İyi_Hareket(bellek) bellek ← Bellek_Güncelle(bellek, hareket) return hareket
Etmen Programları - Arama tablosu function Tablo_Tabanlı_Vekil(algı) returns hareket algılar, /*başlangıçta boş */ tablo /* algılar üzere indekslenmiş tablo, başlangıçta tam belirlenmiştir*/ algı’yı, algılar tablosunun sonuna ilave et hareket ← Tabloya_Bak(algı, tablo) return hareket
Neden arama tablosu başarısızdır? Oldukça çok kayıt gerekmektedir –Satranç oynayan etmen için kayıt Tabloyu oluşturmak çok zaman alıyor Özerklik Yoktur –Etmenin tüm hareketleri önceden belirlenmiştir (kaydedilmiştir)
Mantıksal Etmenler (logical agents) Algılayabildiklerine ve yapabildiklerine dayanarak “doğru şeyler yapmak” için çaba gösteren etmenler. Doğru hareket vekilin başarılılık etkeninden biridir Başarı ölçüsü: vekilin davranışının başarılılığını gösteren kıstas. E.süpürgesi vekilinin başarısı sorulan tozun miktarı ile, harcanan zamanla, tüketilen enerji ile, kopardığı gürültü ile … belirlenebilir mantıklı etmen, her bir algılama üzere mümkün hareketler içinden başarıyı en fazla yapanı seçmelidir.
Mantıklılık ve her şeyi başarmak Mantıklı olmak, her şeyi başarmak değildir –“Her şeyi başarmak”, vekilin, tüm hareketlerinin ne ile sonuçlanacağını bildiği anlamına geliyor –Örnek: caddeyi geçerken, kafana uçağın kapısının düşeceğini önceden bilmek Mükemmelliğe gerek yoktur. –Her zaman doğru şeyler yapmak mümkün değildir –Beklenen başarı, nelerin algılandığına bağlıdır Mantıksal davranış aşağıdaki etkenlere bağlıdır –Başarı ölçüsü –Algılama tümcesi: Vekilin belirli bir anda algıladığı her şey –Ortam hakkında vekilin bildikleri –Vekilin yapabileceği olası hareketler Etmenin davranışı yalnız onun kendi deneyimi, öğrenme ve uyum sağlaya bilme yeteneği ile belirlenirse, vekil özerktir
İdeal mantıksal etmen Her mümkün algılama tümcesi için, önceden varolan bilgilerine ve algılamalar ardışıklığına dayanarak başarı ölçüsünü en iyi yapan hareketleri gerçekleştiren vekil Yararlı bilgiler edinmek için hareketler –Böyle hareketler beklenen başarıyı maksimum yapar
İdeal Etmenler - Algılamadan harekete doğru İdeal etmeni oluşturma –Her mümkün algılama tümcesinin harekete dönüştürülmesi (haritalanması) –İdeal dönüştürme: Her algılama tümcesi için belli olan en yüksek başarı ölçüsüne uygun cevabın bulunması Belirgin tabloya her zaman gerek duyulmaz –Gereken tek şey dönüştürmenin tanımlanmasıdır –Örnek: kare kökün 15 onluk rakama dek kesinlikle hesaplanması için büyük tablo yerine kısa bir program yeterlidir
Eğer etmenin tüm hareketleri yalnız önceden kaydedilmiş bilgilere dayanırsa, bu vekil özerklikten yoksundur. Etmenin özerklik davranışı onun deneyimi ile belirlenmelidir –Bazı başlangıç bilgiler ve öğrenme yeteneği gerekmektedir Özerk olmayan etmenler, esneklikten yoksundur İdeal Etmenler - Özerklik
Etmenin Nitelendirilmesi Başarı bileşenleri: BOTA (İng. PEAS) –Başarı ölçüsü -Performance measure –Ortam- Environment –Tepkivericiler-Actuators –Algılayıcılar- Sensors
PEAS. Örnek: Taksi süren etmen Mantıklı etmenlerin tasarımı için PEAS bileşenleri belirlenmelidir Şimdiki durumu bilmek için algıların kullanılması –Araba nerededir? Şu anki hızı kaçtır? Hareket koşulları nasıldır? Zıt amaçların varlığı ; Farklı ortamların varlığı Vekil türü AlgılayıcılarHareketlerHedefler (Başarı ölçüleri) Ortam Taksi sürü- cüsü Görme,hız ölçme, yol ölçme,duyma Seyir, pedala basma, frenleme, korna çalma, müşteri ile konuşma Güvenlik, hızlı olmak, yasalara uymak, rahatlık, kazanç Yol, diğer araçlar, yayalar, müşteriler
PEAS(Örnekler) - devamı Vekilin türüAlgılamalarHareketlerAmaçlar / Başarı Ö. Ortam Tıbbi tanılayıcıbelirtiler, bulgular, hastanın cevapları Sorular, muayeneler, davranışlar Hastanın iyileşmesi, maliyetin düşürülmesi Hasta, hastane Uydu görüntülerinin çözümlenmesi Pikseller, renkler Resimlerin sınıflandırılması Sınıflandırma nın doğru yapılması Uydulardan görüntüler Parçaları seçen robot ParçalarParçaların ayrılması ve çeşitlendirilmesi Parçaların düzgün yerine koyulması Nakletme bandı Etkileşimli İngilizce öğreticisi KelimelerAlıştırmalar, önermeler Öğrenci puanının en yüksek olması Öğrenciler kümesi
Ortam Türleri Tam gözlem - kısmı gözlem : –Zamanın verilmiş diliminde vekilin algılayıcıları tarafından ortamın tüm durumunun gözlemlenmesi mümkün mü? Belirgin - tahmini –Belirgin ortam -ortamın sonraki durumu tümüyle şimdiki duruma ve vekilin hareketlerine bağlıdır. –Tam erişilebilirlik durumunda belirsizlik yoktur; ortam belirgindir Epizodik – Sıralı –Vekilin yaşamı atomik parçalara (episodes) bölünebilir. –Parçadaki hareketin seçimi, yalnız parçanın kendisine bağlıdır. –Parça, önceki parçalara bağlı değil, yani sıralı / ardışık değildir. –Satranç oyunu, vb ise; etmenler sıralı ya da bir sıraya bağlı (önceki hamleye bağlı) olmak zorundadır. Ya da, başka bir deyişle, etmenin hamlesi / kararı, uzun vadede ilerideki tüm karar / hamleleri etkilemektedir, yani parça özelliği göstermez.
Ortam Türleri (devamı) Statik - dinamik –Etmenin karar oluşturduğu (düşündüğü) süreç içinde ortam değişirse bu dinamik ortamdır, değişmezse statik ortamdır Statik ortamlarda vekilin aralık görüntüleri kaydetmesine gerek yoktur –Yarı dinamik: ortam değişmez, ama vekilin başarısı değişebilir Ayrık - sürekli –algılamalar veya hareketler sayılabilirse (ayrık ise) ortam ayrık, sayılamıyorsa süreklidir –Satranç ortamı ayrıktır, çünkü her hamlede sınırlı sayıda hareketler var. Tek vekil - çoklu vekil: Tek vekil ortamda kendi başına faaliyette bulunuyor. Çoklu vekiller işbirliği yapıyorlar. Çok zor ortamlar –Erişilebilmezlik, ardışık olmayan, dinamik, sürekli Gerçek ortamlar çoğunlukla öyle karmaşıktır ki, onlara belirli olmayan (non-deterministic) ortam gibi bakılmalıdır
Ortam Türlerine Örnekler OrtamTam Gözlem Belirgin (Deterministic) EpizodikStatikAyrık (Discrete) Satranç (saatle)EEHY.din.E Satranç (saatsiz)EEHEE PokerHHHEE TavlaEHHEE Taksi sürmeHHHHH
Etmen Türleri Basit tepki etmeni Model tabanlı etmen Amaca yönelik etmen Faydaya yönelik etmen
Basit tepki etmenleri (1) Koşul-hareket kuralları Örnek: Eğer öndeki araba frenlediyse, o zaman frenlemeyi başlat ortam etmen algılayıcılar Şimdi dünya nasıldır Şimdi hangi hareketi yapmalıyım tepkivericiler Koşul-hareket kuralları Vekilin hareketi yalnız şimdiki algılamalara bağlıdır, eski algılamalar dikkate alınmaz
Basit tepki etmenleri (2) function Basit_Tepki_Vekili(algı) returns hareket static: kurallar /* koşul-hareket kuralları kümesi durum ← Girişi_Yorumla(algı) kural ← Kural_Karşılaştır(durum, kurallar) hareket ← Kural_Hareket[kural] return hareket Uygulama alanı kısıtlıdır
Durum Model tabanlı etmenler Hareketi seçmek için iç durum bellekte tutuluyor –Algılayıcılar tüm dünya durumuna erişimi sağlayamıyor Ortam etmen Algılayıcılar Dünya şimdi nasıldır şimdi hangi hareketi yapmalıyım Tepkivericiler Koşul-hareket kuralları hareketler Eğer etmenin gözlemleri tam değilse, dünyanın, şu an göremediği kısmı hakkında bilgilerin saklanması ( eski algılara bağlı olan bazı durumların tutulması ) çok etkili olabilir;
Model Tabanlı etmenler (2) function Model_Tabanlı_Vekil(algı) returns hareket static: durum, mevcut dünyanın durumunu tanımlar kurallar, koşul-hareket kuralları kümesi durum ← Durum_Güncelle(durum, hareket, algı) kural ← Kural_Karşılaştır(durum, kurallar) hareket ← Kural_Hareket[kural] durum ← Durum_Güncelle(durum, hareket) return hareket Durum-güncelleme- yeni dünya durumları oluşturuluyor dünya oluşumları bellekte tutuluyor
Amaca yönelik etmenler Amaç bilgisi –Hangi durumlar arzu edilendir? –Örnek: müşterinin adrese ulaşması Mümkün hareketleri sonuçları ile birleştirmek –Bazı zamanlarda tek hareket, bazı zamanlarda hareketler ardışıklığı Geleceği dikkate almak –Ne olacak? –Beni mutlu edecek bir şeyler olacak mı? Koşul-hareket kurallarından daha esnek –Ortam değiştikte bilgilerin güncellenmesi daha kolaydır –Örnek: yağmurda frenleme
Amaca yönelik etmenler durum ortam etmen algılayıcılar Dünya şimdi nasıldır Şimdi hangi hareketi yapmalıyım tepkivericiler Amaçlar Dünya nasıl değişiyor Benim hareketlerim nasıl olmalıdır hareketi yapmış olsam ne olacak
Yarara yönelik etmenler Amaçlara farklı yollarla ulaşılabiliyor –Bu yollardan hangisi daha arzu edilendir? Dünya durumlarının faydası –Amaca ulaştıkta etmen ne kadar mutlu olacak? –Durumu gerçek sayıya dönüştürmeli Amaca dayalı etmenin yapamadığı mantıklı kararlara izin veriyor –Yalnız birisine ulaşmak mümkün olan zıt amaçlar –Kesin olarak hiç birisine ulaşılamayacak birkaç amaç Her mantıklı etmenin fayda fonksiyonu vardır –Belirgin fayda fonksiyonunun kullanılması –Bazı hallarda yalnız amaçların verilmesi daha iyi sonuçlar doğura biler
Yarara yönelik etmenler durum ORTAM etmen algılayıcılar Dünya şimdi nasıldır Şimdi hangi hareketi yapmalıyım Tepkiverici Ben bu hareketi yapsam dünya nasıl olacak Bu durumda ben ne kadar mutlu olacağım Fayda hareketler
Öğrenen etmenler ORTAM etmen algılayıcılar Tepkiverici değerlendirme Öğrenme öğesi gerçekleştirici Sorun üreticisi Öğrenme amacı Geri dönüşüm icra standardı değişimler bilgi
Öğrenen etmenler Değerlendirme- şu anki durumun değerlendirilmesi (başarı standardına uygun olarak) Öğrenme öğesi- başarıyı iyileştirmek için Sorun çözücü- yeni deneyimlere götüren hareketlerin önerilmesi icracı- dış hareketleri seçmek için (bilgi ve prosedürler)