Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

MIT563 Yapay Zeka ve Makine Öğrenmesi Y. Doç. Yuriy Mishchenko.

Benzer bir sunumlar


... konulu sunumlar: "MIT563 Yapay Zeka ve Makine Öğrenmesi Y. Doç. Yuriy Mishchenko."— Sunum transkripti:

1 MIT563 Yapay Zeka ve Makine Öğrenmesi Y. Doç. Yuriy Mishchenko

2 Ders planı • Anomali tespiti sorunu (Anomaly estimation problem) • Tavsiye etme sorunu (Recommender systems problem)

3 Genel kavramları • Anomali tespiti ve tavsiye etme, modern makine öğrenmesi sorunlarından birilerdir • Anomali tespiti, kalite kontrolü, sahtekarlık algılama (fraud detection, yanı kredi kartlarıyla ilgili), vb sistemlerinde kullanılır; ana amacı: sıradışı olayları yakalamak • Tavsiye etme sistemleri, birçok e-komerse sisteminde (hepsiburada vb) müşterilere tavsiye etmek için kullanılır

4 Anomali tespiti sorunu • Anomali tespiti sorunu – Olağandışı olayları farketmek • Ne için uygulanabilir: – Kredi kartı ile ilgili olağandışı kullanıcı davranmayı farketmek için, sahtekarlık (fraud) yakalamak – Üretmede kötü parçalar bulmak (kalite kontrolü, cihazın onarıma ihtiyacı belirleme, vb) – Otomatik ayarlamada insan operatörün dikkatini çekmek

5 Anomali tespiti sorunu • Genel yaklaşım: – “Normal” durumlar için bir model oluşturulur – Bu model, olasılık modeli olmalıdır • Bu model girdi-çıktı bir model değil, belli bir girdi için olabilir farklı çıktılar için onların olasılıklarını verir – Bu model, bu şekilde “normal” ve olağandışı durumlarını ve onların olasılıklarını belirliyor – Böyle bir model, genel makine öğrenme metodları kullanarak oluşturur

6 Anomali tespiti sorunu • Yeni bir durum için, bu model kullanarak bu durum “normal” olması olasılığı belirtilir • Durum “normal” modeline uygun değilse, yanı “normal” durumda olasılığı çok fazla düşükse, böyle olayları anomali olarak veriliyor

7 Anomali tespiti sorunu • “Normal” model olarak sıkça normal dağılım modeli kullanılır: – Normal dağılımı, istatistiğin en önemli dağılımlarından biridir; bu dağılımın ana özelliği, “çan şekline” sahip olmasıdır

8 Anomali tespiti sorunu • Normal dağılım aşağıdaki nedenlerle önemlidir: – Bir olayın sonucu birçok bağımsız rasgele faktörlerle belirtilirse, bu olayın sonuçları normal dağılım şekilde olmalıdır (Merkezi Limit Teoremi, Central Limit Theorem)

9 Anomali tespiti sorunu • Örnek olarak, bir olayın sonucu birçok bağımsız rasgele faktörlerin toplamı şeklinde olursa... • Bu sonuclar normal dağılım şeklinde gerçekleştirilecektir (her zaman - altfaktörlerin detaylı doğası fark etmez!!!)

10 Anomali tespiti sorunu • Bu nedenle, normal dağılım birçok gerçek durumda görülebilir • Anomali tespiti için, “normal” durumların modeli bu şekilde belirtilebilir

11 Anomali tespiti sorunu • Normal dağılımın olasılıkları bu şekilde tanımlanır:

12 Anomali tespiti sorunu • Normal dağılımı iki parametreyle belirlenir– ortalaması (merkez nokstası), , ve varyansı yada standart sapması (dağılım genişliği), 

13 Anomali tespiti sorunu • Ortalama değeri , çan şeklinin merkez/orta pozisyonunu belirtiyor

14 Anomali tespiti sorunu • Varyans , çan şeklinin genişliğini belirtiyor 22

15 Anomali tespiti sorunu Normal dağılımı önemli özelliği; • Sonuçların... – %68’i ortalamasından 2  aralığı içinde bulunur – %95’i ortalamasından 4  aralığı içinde bulunur – %99,9’i ortalamasından 6  aralığı içinde bulunur

16 Anomali tespiti sorunu • Anomali tespiti sorunu: – “Normal” durumlarının örnekleri kullanarak ortalaması  ve varyans  değerleri tahmin edilebilir

17 Anomali tespiti sorunu • “Normal” durumların dağılımı oluşturulabilir – Bu model dağılıma göre, bütün durumların “normal” olabilmek olasılığı tahmin edilebilir

18 Anomali tespiti sorunu • Eğer yeni bir olay ortalamasından 3  ’dan daha uzaktaysa, bu olayın “normal” olması olasılığı çok düşüktür (1000 ‘de bir ‘den daha düşük)...

19 Anomali tespiti sorunu • Bu olay “anomali” olarak kaydedilebilir anomali

20 Anomali tespiti sorunu • Anomali tespiti: – “Normal” örnekleri kullanarak, “normal” durumlarının olasılık modeli oluşturulur • “Anomali” örnekleri varsa, bu örnekler kullanarak bir “threshold” (eşik) parametresini de belirtilir – Yoksa, “threshold” farklı açıdan seçilir, örneğin, normal durumlarının anomali olarak en fazla %0.1 olaylarda kaydedilmesi (demek - hata yapılması olasılığı en fazla %0.1)

21 Anomali tespiti sorunu • Anomali tespiti: – “threshold” parametresini kullanarak, normal bölge dışarı olan olaylar (demek ki “normal” olması olasılığı “thershold”’den daha düşük) anomali olarak kaydedilir p p A NOMALI

22 Anomali tespiti sorunu • Anomali tespiti önceki makine öğrenme sorunlarından farkı: – Genellikle,“normal” örnekleri çok ve “anomali” örnekleri az (yada hiç) var – önceki makine öğrenme sorunlarında genellikle ikisi de yeterli sayıda vardı – “Normal” durumların tek türü, “anomali” durumların çok türü olabilir: normal dışında her şey anomalidir – önceki makine öğrenme sorunlarında genellikle iki durum türü vardı – Durum modeli oluşturmak için sadece “normal” örnekleri kullanılır, “anomali” örnekleri yada kullanılmaz yada “eşik” için kullanılır – önceki makine öğrenme sorunlarında genellikle bütün örnekler kullanılmalıydı

23 Tavsiye etme sorunu • Tavsiye etme sorunu: – Bir müşteri için, onun tarafından önceden satın alındığı yada arandığı ürünlere göre yeni ürünleri tavsiye etmek – Büyük e-komerse sistemlerinde, hepsiburada vb, müşterilere tavsiye etmek için kullanılır – Büyük ticaret uygulamaları var

24 Tavsiye etme sorunu • Tavsiye etme sorunu, genel makine öğrenme yaklaşımı kullanarak çözülebilir: – Bütün ürünler için özellik vektörleri belirlenir, örneğin: • Evde kullanım değeri; 0-5 yıldız rating, • Eğlence değeri; 0-5 yılzıd rating, • Kalite değeri; 0-5 yıldız rating, • Fiyat değeri; 0-5 yıldız rating, • Markası ünlülük, vb

25 Tavsiye etme sorunu • Bu özellikleri kullanarak ve müşteriler için var olan bilgi kullanarak müşterilerin tercih modeli oluşturulur – Yeni x-özellikli ürünün beğenilmesi “ratingi”, h  (x) =  0 +  T  x – En basit - lineer model de olabilir – Yeni ürün için, müşterinin olabilecek 0-5 yıldızlı “rating”i tahmin ediyor

26 Tavsiye etme sorunu • Bu model, müşteri tarafından önceden izlenmiş yada satın alınmış ürünler kullanarak bulunabilir, onun teta-parametrelerini bulabilir – Model teta-parametrelerine bağlı bir uygunluk maliyetinin minimumu azaltılması gerekiyor • Oluşturulmuş modeller, müşterilere yeni ürünler tavsiye etmek için kullanılabilir

27 Tavsiye etme sorunu Modeller, maliyet azaltarak buluyoruz;

28 Tavsiye etme sorunu Tavsiye etme modelinin uygunluk maliyeti: • y i,j i. ürün için j. müşterin 0-5 yıldızlı “rating” (değerlendirme) • x i, i. ürünün var olan “özellik” vektörüdür •  j, j. müşterin var olan tercih modelidir

29 Tavsiye etme sorunu • Bu yaklaşıma göre, önce var olan müşterilerin ratingleri - y i,j - ve bir şekilde önceden var olan ürünlerin özellikleri - x i – için uygun müşteri terçih modelleri -  j - bulunabilir

30 Tavsiye etme sorunu • Bukadar mı ???

31 Tavsiye etme sorunu • Bu yaklaşımın ana sorunu, binlerce ürünler için özellikleri belirleme gerekliliği • Gerçek durumda, bu çok zor ve çok pahalı bir iş olabilir

32 Tavsiye etme sorunu • Normalde var olan durum: – Farklı müşteriler tarafından farklı ürünler için sisteminde birçok rating zaten var, ürünlerin özellikleri ama hiç yok – Tavsiye etmek için, diğer kullanıcılar tarafından verilmiş ratingler kullanarak hem ürünlerin özellikleri hem de müşterilerin tercihleri belirlemek istiyoruz

33 Tavsiye etme sorunu • Yaklaşım: – Bir rasgele şekilde atanmış  j modelleri kullanılır – Bu rasgele  j modellerini kullanarak, ürünlerin x i özellikleri için model maliyet azaltarak optimal değerleri bulunur – Bu ürün özelliklerini kullanarak model maliyeti azaltarak müşteriler için yeni  j modelleri bulunur – Bu şekilde devam edilir...

34 Tavsiye etme sorunu • Rasgele  j tercih modellerini kullanarak ürün x i özellikleri bulunur varsayılmış maliyeti azaltarak bulunur

35 Tavsiye etme sorunu • Bu ürün özelliklerini kullanarak müşteri tercih  j modelleri bulunur önceki geçiş maliyeti azaltarak bulunur

36 Tavsiye etme sorunu • Son geçişten müşteri  j modellerini kullanarak ürün x i özellikleri tekrar bulunur önceki geçiş maliyeti azaltarak bulunur

37 Tavsiye etme sorunu • Önceki geçişten x i özelliklerini kullanarak müşteri tercih  j modelleri tekrar bulunur önceki geçiş maliyeti azaltarak bulunur

38 Tavsiye etme sorunu Yakınsamaya kadar tekrarlanır

39 Tavsiye etme sorunu • Tavsiye etme özel matematiksel şekli – Matematiksel şekilde, değerlendirme (rating) matris tanımlıyoruz: Y=(y i,j | j. müşteri tarafından i. ürünün değerlendirilmesi - ratingi ), – Bu anlamda, tavsiye etme sorununda değerlendirme matrisin özel faktör gösterimi buluyoruz, daha kesin olarak - Y=X  T

40 Tavsiye etme sorunu • Bu gösterimde - Y=X  T - – X, ürünlerin özellik matrisi, yada bütün ürünler için özellik vektörleri, X=(x 1,x 2,...,x m ) – , müşterilerin tercih matrisi, yada bütün müşterilerin tercih modellerinin teta- parametreleri,  =(  1,  2,...,  m )

41 Tavsiye etme sorunu • Bu ölçüde, rating matrisi - Y- bilinir biri • Buna göre, Y=X  T ilişkisinde olan X ve  matrislerini bulmak gerekiyor • Bu soruna “low rank matrix factorization” denir, bu bir matematiksel bir özel sorun

42 Tavsiye etme sorunu • Yanı, bir Y matrisi için Y=X  T belirli boyutta olan matris faktörleştirilmesi bulmak – “low rank matrix factorization”‘dir • Matematikte özel bir alan ve hem bu sorunun özellikleri hem de çözüm yaklaşımları var • Bu ölçüde, bu matematiksel sorunun çözümleri tavsiye etme sorununda ticarette kullanılabilir

43 Tavsiye etme sorunu • Özel konu: “soğuk başlangıç” (cold start) sorunu; – Yeni müşteriler için, önceden tercih örnekleri bulunmayabilir (aslında hiç yok normalde) – Bu durumda, yeni müşteriler için bir “genel” model kullanılmalıdır – Böyle genel bir model olarak  =0 modeli atamak mantıklıdır – Ama, bu modele göre bütün ürünlere Y=X   T =0 ratingleri atanır – bu kötü ve mantıklı değil

44 Tavsiye etme sorunu • Bu sorunu çözmek için, Y rating matrisinden ortalama değerleri genellikle çıkartılır – yani ortalama rating 0 olsun diye diyoruz, bütün rating’ler bu sıfır noktasına göre yapılsın • “Genel” ratingler, bu anlamda, sıfır oluyor, istediğimiz gibi • “Genel” model olarak (yanı yeni müşteriler için)  =0 model de kullanılabilir

45 Tavsiye etme sorunu • Matematiksel, sıfır-ortalamalı ratingler bu şekilde tanımlıyoruz: • Yeni müşteriler için,  j  0 kullanılabilir, ve ratingleri ortalama tavsiye etme anlamında gelir (yanı Y’  0 ratingler ortalama tercih anlamındadır)

46 F INITO


"MIT563 Yapay Zeka ve Makine Öğrenmesi Y. Doç. Yuriy Mishchenko." indir ppt

Benzer bir sunumlar


Google Reklamları