MIT503 Veri Yapıları ve algoritmalar Sıralama algoritmaları Y. Doç. Dr. Yuriy Mishchenko
Algoritma geliştirme Ders planı Sıralama algoritmaları ve böl-ve-fethet yöntemi Naif sıralama – seçme sıralama, ekleme sıralama, kabarcık sıralama Hızlı sıralama (quicksort), birleşme sıralama (mergesort), hipsort (heapsort) Özel tamsayı sıralama – sayım sıralama, kova sıralama, radix sıralama
Sıralama sorunu Sıralama sorunu hatırlatma Bir sayısal dizi var, N uzunluğunda O dizideki sayıların sıralanmış olmasını istiyoruz 15 2 11 13 7 5 6 9 2 6 5 7 9 11 13 15
Naif sıralama Naif sıralama algoritmaları Seçme sıralama Ekleme sıralama Kabarcık sıralama
Seçme sıralama Ana fikri Çıktı dizisinin birinci pozisyonu için verilen dizideki en küçük sayıyı bulup çıktının 1. pozısyonuna koyuyoruz Çıktı dizisinin ikinci pozisyonu için verilen dizideki en küçük kalan sayıyı bulup çıktının 2. pozısyonuna koyuyoruz Üçüncü pozısyon için, verilen dizideki en küçük kalan sayısını bulup tekrar çıktının 3. pozısyonuna koyuyoruz v.b.
Seçme sıralama Seçme sıralama en küçük 15 2 11 13 7 5 6 9 x birinci buraya bakın yeni en küçük 2 15 11 13 7 5 6 9 x ikinci yeni en küçük 2 13 15 11 7 5 6 9 x üçüncü yeni en küçük 2 15 5 13 11 7 6 9 x dördüncü
Seçme sıralama Seçme sıralama sözde kodu sonuç:=boş dizi başlangıç p:=giriş dizi p boş değil iken a:=p’deki min nesne seçin; sonuç:=(sonuç, a); p’den a’yı çıkartın; döngü sonu yaz sonuç başlangıç a:=p’den min nesne seçin Sonuca a’yı ekleyin p’dan a’yı çıkartın yok p’de kalan nesneler var? var bitiş yaz p
Seçme sıralama Seçme sıralamada, bütün kalan diziyi tekrar tekrar incelememiz lazım İlk pozısyon için, N sayı incelememiz lazim İkinci pozısyon için, N-1 sayı incelememiz lazim Üçüncü pozısyon için, N-2 sayı incelememiz lazim vb Toplam, N(N-1)/2=O(N2) operasyon yapıyoruz
Ekleme sıralama Ana fikri Sonucu sıralanmış şekilde baştan oluşturuyoruz Bunun için, verilen diziden bir sayı alırken o sayıyı her zaman sonuca doğru bir pozisyona ekliyoruz (ama bunun için ikiye bölme kullanmıyoruz) Doğru pozisyonu bulmak için bütün var olan çıktı dizisini tekrar tekrar incelememiz lazım
Ekleme sıralama Naif sıralama: ekleme sıralama 15 2 11 13 7 5 6 9 x girdi sonuç 15 x 15 2 11 13 7 5 6 9 x girdi sonuç 2 15 x 15 2 11 13 7 5 6 9 x girdi sonuç 2 13 15 x 15 2 11 13 7 5 6 9 x girdi sonuç 2 11 15 13 x
Ekleme sıralama Seçme sıralama sonuç:=boş dizi başlangıç p:=giriş dizi p boş değil iken a:=p’den birinci nesne alin i:=0 döngü // doğru pozisiyonu bul i:=i+1 döngü (sonuç[i]>a) iken a, sonucun i-1 pozisiyonuna ekleyin p’den a’yı çıkartın döngü sonu yaz sonuç a:=p’den ilk nesne seçin i=i+1 sonuç[i]>a evet hair a, sonucun i-1 pozisiyonuna ekle p’dan a’yı çıkartın yok var p’de nesneler var? bitiş yaz p
Ekleme sıralama Ekleme sıralamada, doğru pozisyonu bulmak için bütün çıktı dızısını incelememiz gerekiyor Bu nedenle, bu algoritma için ortalama N(N-1)/2=O(N2) operasyon gerekiyor Girdi olarak neredeyse sıralanmış dizi varsa, çok hızlı algoritma olabilir (bu durumda daha avantajlı algoritmadır)
Kabarcık sıralama Kabarcık sıralama, çok popüler algoritmadır ve her zaman “algoritmalar” derslerinde verilir Ana fikri Diziyi inceliyoruz Bir yanlış sırada çift varsa, yani soldaki sayı sağdaki sayı’dan daha büyükse, çiftteki sayıların pozısyonlarını değiştiriyoruz Sonra var olan diziyi tekrar inceliyoruz, bu şekilde devam ediyoruz
Kabarcık sıralama Naif sıralama: kabarcık sıralama 15 2 11 13 7 5 6 9 x girdi 2 15 11 13 7 5 6 9 x girdi 2 13 11 15 7 5 6 9 x girdi 2 13 15 11 7 5 6 9 x girdi 2 11 15 13 7 5 6 9 x girdi 2 11 7 13 15 5 6 9 x girdi
Kabarcık sıralama Naif sıralama: kabarcık sıralama kabarcık – üstüne gidiyor Naif sıralama: kabarcık sıralama 15 2 11 13 7 5 6 9 x girdi 2 15 11 13 7 5 6 9 x girdi 2 13 11 15 7 5 6 9 x girdi 2 13 15 11 7 5 6 9 x girdi 2 11 15 13 7 5 6 9 x girdi 2 11 7 13 15 5 6 9 x girdi
p[i] ve p[i+1] değiştirin Kabarcık sıralama başlangıç Kabarcık sıralama p:=giriş_dizi döngü i:=0 p[i]<p[i+1] iken i=i+1; eğer p[i], p’nin sonunda ise döngüden çıkın; // hiç yanlış sırada // çift bulunmadı p[i] ve p[i+1] değiştirin döngü sonu yaz p i=0 i=i+1 p[i]<p[i+1] evet hair evet p’nin sonunda? hair p[i] ve p[i+1] değiştirin yaz p bitiş
Kabarcık sıralama Kabarcık sıralama, ortalama tekrar O(N2) operasyon gerekiyor Girdi olarak neredeyse sıralanmış dizi varsa, tekrar onu hızlı sıralayabilir ve avantajlı algoritmadır
Naif sıralama: özet Naif sıralama algoritmalar Seçme sıralama – O(N2) Ekleme sıralama – O(N2) Kabarcık sıralama – O(N2) Naif sıralama algoritmalarının hepsi O(N2) dır
Böl-ve-fethet sıralama Hızlı sıralama algoritmaları Hızlı sıralama (quicksort) Birleşme sıralama (mergesort)
Hızlı sıralama (quicksort) Ana fikri Naif sıralama algoritması var, O(N2) algoritmasıdır Dizide bir sayı seçelim ( “pivot” denir), A A’dan küçük sayıların hepsini sola koyalım, büyükleri sağa koyalım Soldaki ve sağdaki sayılar ayrı olarak sıralayalım, sonra şöyle sıralanmış altdizileri birleştirelim (kolay çünkü soldakiler hepsi <A ve sağdakiler hepsi >A – yan yana konulması yeterlidir!)
Hızlı sıralama (quicksort) Ana fikri Sol dizi sadece A’dan daha küçük sayıları ve sağ dizi sadece A’dan daha büyük sayıları içerdiği için sol sıralanmış dizi solda sağ sıralanmış dizi sağda koyup hemen sıralanmış sonucu alıyoruz Pivot olarak genellikle dizinin ortasındanki sayı seçilir
Hızlı sıralama (quicksort) Zaman analizi: Eğer altdizilerin sıralama naif olarak yapılırsa, toplam ortalama sıralama zamanı 2(N/2)2 + 1 ≈ N2/2 Yani zaten bu iki kat daha hızlı (ilginç değil mi)!
Hızlı sıralama (quicksort) Zaman analizi: Dolayısıyla, altdizileri sıralamak için aynı ikiye bölme yöntemi kullanalım, ve sayre Sonuçta bu ikiye bölme yaklaşımı sona kadar kullanılırsa ortalama sıralama zamanı O(N log N) olmaktadır Bu daha sonra konuşacağımız genel böl-ve-fethet algoritma yaklaşımının örneği dir
quicksort Quicksort sıralama ... bölme sol/sağdaki sıralama toplama 15 2 11 13 7 5 6 9 x girdi pivot bölme sol dizi sağ dizi 2 6 5 7 15 13 11 9 x yeni sıralayın; tekrar quicksort kullanın ... yeni sıralayın; tekrar quicksort kullanın sol/sağdaki sıralama 2 6 5 7 9 11 13 15 x toplama 2 6 5 7 9 11 13 15 x sıralanmış çıktı
quicksort quicksort p:=giriş dizi başlangıç A:=p[orta] sol_dizi=boş dizi sağ_dizi=boş dizi döngü i=0’dan p’nin boyutuna kadar eğer p[i]<A ise p[i] sol_diziye ekleyin aksi halde p[i] sağ_diziye ekleyin eğer sonu döngü sonu sol_dizi:=quicksort(sol_dizi); sağ_dizi:=quicksort(sağ_dizi); p:=(sol_dizi, sağ_dizi) yaz p seç A; sol=boş; sağ=boş; i=0; i++<boyut(p) hair evet p[i]<A hair p->sağ evet p->sol sol=quicksort(sol); sağ=quicksort(sağ); [sol;sağ] bitiş
quicksort Quicksort sıralama için ortalama olarak O(N log N) zamandır gerekiyor FAKAT, kötü pivot seçtiği ile O(N2) zamana düşebilir
mergesort Ana fikri Naif sıralama algoritması var, O(N2) algoritmasıdır Quicksort’e benzeyen, ama sol ve sağ diziler için orijinal dizisini ortasından bölüyoruz, yani “pivot” kullanılmıyor Sol ve sağ parçaları ayrı ayrı sıralanır, ama daha sonra biraz (çok az) daha karmaşık şekilde geri birleştirilir
mergesort Ana fikri Sol ve sağdaki dizilerde hem küçük hem büyük sayılar olabilir Dolayısıyla sol ve sağ dizilerin birleştirmek için yan yana koymak yeterli değildir Fakat şu lineer-zaman yaklaşım kullanılabilir
mergesort Mergesort toplama algoritması: Sağ ve sol altdizisinde soldan sağa giderken iki altdizisinden daha büyük olanı sonuç diziye ekliyoruz
mergesort 2 7 15 18 30 5 11 13 17 23 Daha küçük İşaretçi
mergesort Daha küçük Soldan sağa ilerliyor 2 7 15 18 30 5 11 13 17 23
mergesort 2 7 15 18 30 5 11 13 17 23 Daha küçük 2 5
mergesort 2 7 15 18 30 5 11 13 17 23 Daha küçük 2 5 7
mergesort 2 7 15 18 30 5 11 13 17 23 Daha küçük 2 5 7 11
mergesort Daha küçük Sonuç sıralanmış şekilde toplanır 2 7 15 18 30 5 11 13 17 23 Daha küçük 2 5 7 11 13 Sonuç sıralanmış şekilde toplanır
mergesort 2 7 15 18 30 5 11 13 17 23 Daha küçük 2 5 7 11 13 15
mergesort 2 7 15 18 30 5 11 13 17 23 2 5 7 11 13 15 17 18 23 30
mergesort Quicksort sıralamanın tek adımla zaman kazanması şudur Altsıralama zamanı – 2(N/2)2 Birleştirme zamanı N Toplam zamanı 2(N/2)2 +N Yani, çok iyi
mergesort Quicksort sıralama yeni O(N log N) zamanda yapılabilir, fakat burada en kötü durumun zamanı da O(N2) zamandır ! Mergesort sıralama, ortalama ve en kötü durumunda O(N log N) operasyon gerekiyor Bu şekilde mergesoft optimal sıralama algoritmasıdır
heapsort Bir daha O(N log N) önemli sıralama algoritması var – heapsort (hipsort) algoritması Heapsort, böl-ve-fethet algoritması değildir, aslında “ekleme sıralama” algoritmalarından biridir
heapsort Naif ekleme sıralamasında vakit gereksinimi O(N2) idi, ama... Ekleme operasyonunu daha akıllı şekilde yapacaksak daha verimli algoritma sağlanabilir Ekleme ikiye bölme algoritması yada arama ağaçları kullanarak yapılırsa ... Ekleme işlemi O(log N) zamandır gerekir ve ... Dizi sıralama O(N log N) zamanda yapılacaktır
Sıralama Algoritmaları (Böl-ve-Fethet) Naif sıralama algoritmaları Seçme sıralama – O(N2) Ekleme sıralama – O(N2) Kabarcık sıralama – O(N2) Böl-ve-fethet sıralama algoritmaları Quicksort sıralama – O(N log N) Mergesort sıralama – O(N log N) Sıralanmış veri yapıları algoritmaları Heapsort sıralama – O(N log N)
Özel sıralama konuları Tamsayı sayım, kova ve radix özel sıralama algoritmaları var O(N) (yani lineer) zaman algoritmalardır Veritabanları için önemli algoritmalardır Veritabanlarının indeksleri çoğunlukla tamsayılar olduğu için, bu algortima çok avantajlı gelir
Sayım sıralama Ana fikri Sayım sıralamada, orijinal dizideki tamsayılar sıralı şekilde incelenir ve o sayıların kaç kez karşılandığı takip edilir Tüm dizi incelenince, bunlardan sonuç sıralanmış dizi oluşturulur
Sayım sıralama Sayım sıralama 15 2 7 13 5 6 9 inceleme Karşılandığı sayı: "2" – 2 kez; "5" – 1 kez; "6" – 1 kez; "7" – 2 kez; "9" – 1 kez; "13" – 1 kez; "15" – 1 kez; Sonuç == (2,2,5,6,7,7,9,13,15) Bitti !
Sayım sıralama Sayım sıralama algoritması sayım:=boş dizi; // sayıların sayımları döngü i=0’dan p’nin uzunluguna kadar sayım[p[i]]:=sayım[p[i]]+1; // bütün sayılar için karşılandığı kezi not et döngü sonu sonuç:=boş dizi; // sonuç döngü {"k" sayım’daki var olan indeksler için, en küçükten en büyüğe kadar} “k” sayı sonuç'a “sayım[k]” defa ekle; yaz p
Kova sıralama Kova sıralama, sayım sıralamaya benzeyen bir yaklaşım Dizide N sayı varsa, dizinin sayı aralığını N altaralığı/kovaya bölüyoruz, sonra ... Sayım sıralamada gibi, dizi sırayla inceliyoruz ve sayılar karşılık gelen kovaya ekliyoruz Kovalardaki sayıları ayrı ayrı sıralanır ve kovaların sırasına göre sonuca birleştirilir özet
Kova sıralama Ortalama, kovalar tek sayı içeriyor olacak (yani N sayı N kovaya bölünür), bu nedenle kova sıralama ortalama O(N) vakit gerekmektedir özet
Kova sıralama Kova sıralama n:=p’nin boyutu kova:=n boş diziler; // n tane “kova” hazırlayın, kovaların hepsi // min(p) ve max(p) aralığının bir parçasıdır döngü i=0’dan n’ya kadar k:=p[i]’nin kovası // sayıları karşılık gelen kovalara dağıtın p[i]->kova[k] // p[i] sayıyı karşılık gelen kovaya koyun döngü sonu döngü k=0’dan n’ya kadar kova[k]:=sırala(kova[k]) // kovadaki sayıları sıralayın sonuç:=boş dizi kova[k] -> sonuç // kovaları, sırasına göre sonuca toplayın yaz sonuç
Radix sıralama Radix sıralama (basamak sıralaması) da bir tamsayı sıralama algoritmasıdır Radix sıralamada, tamsayılar birkaç geçişte önce birinci basamaklarına göre sıralanıyor, sonra ikinci basamaklarına göre sıralanıyor, VB Her bir geçiş sayım sıralama kullanarak yapılıyor – lineer zamanda özet
Radix sıralama Radix sıralama O(KN) vakit gerekiyor, eğer K tamsayıların maksimum uzunluğu özet
Radix sıralama İki tür var: “en anlamlı basamağa göre” ve “en anlamsız basamağa göre” türüleri var, bunlar tabi ya ilk yada son basamakla başlayan radix sıralama algoritmalardır özet
ilave sıralama konuları: radix sıralama 15 02 11 13 07 05 06 09 girdi 02 07 05 06 09 15 13 11 Birinci geçiş 02 06 05 07 09 11 13 15 İkinci geçiş birinci bölüm ikinci bölüm
Özet Naif sıralama algoritmaları Böl-ve-fethet sıralama algoritmaları Seçme sıralama – O(N2) Ekleme sıralama – O(N2) Kabarcık sıralama – O(N2) Böl-ve-fethet sıralama algoritmaları Quicksort sıralama – O(N log N) Mergesort sıralama – O(N log N) Heapsort sıralama algoritması İkiye bölme ekleme sıralama algoritması O(N log N)
Özet Tamsayı sıralama algoritmaları Sayım sıralama Kova sıralama Radix sıralama Tamsayılar O(N) zamanda sıralanabilir Veritabanları düzenlemesi için önemli avantajıdır
Böl-ve-fethet yaklaşımı Böl-ve-fethet yaklaşımı, bügün gördüğümüz algoritma geliştirme bir esas genel yöntemidir
Böl-ve-fethet yaklaşımı Böl-ve-fethet yaklaşımı, “kötü” yada “süperlineer zaman” bir algoritma varsa, uygulanabilir Sorun birkaç altsorununa bölünür ve altsorunları ayrı ayrı "süperlineer zaman" yaklaşım yapılır Bu algoritmanın süperlineer olduğundan dolayı böyle strateji ile avantaj kazanılır
Böl-ve-fethet yaklaşımı Böl-ve-fethet’in ana fikri: Bir sorun için bir algoritma var Bu algoritma “kötü”, yani “N” büyüklüğınde olan sorunlar için N2 yada daha çok zaman gerektiriyor (örneğin–naif sıralama) Böyle durumlarda, süperlineer zaman algoritmanın var olduğunu diyoruz
Böl-ve-fethet yaklaşımı Böl-ve-fethet’in ana fikri: N büyüklüğünde olan sorundan birkaç yeni benzer daha küçük (örneğin 2 N/2-altdizi sıralanması) altsorununu yapıyoruz ve bunları orijinal algoritmayı kullanıyoruz
Böl-ve-fethet yaklaşımı Böl-ve-fethet yaklaşımının kullanılabilmesi için şöyle koşullar doğru olması lazım: Problem çözme algoritma süperlineer olması lazım; Orijinal problem altproblemlerine bölünebilmesi lazım; Altproglemler orijnal probleme benziyor olması, yani aynı algoritma ile yapılabilmesi lazım; Orijnal problemin çözümü altproblemlerinin çözümlerinden verimli olarak bulunabilmesi lazım.
Böl-ve-fethet yaklaşımı Baze önemli kavramlar: Problem çözme zaman gereksinimi, büyük N boyutta olan problemler için gereken çözme zamanı süperlineer, Ta(N)=O(Nk) Altsonuçları birleştirme zaman gereksinimi, büyük N boyutta olan problemler için altsonuçları sonuca birleştirmek için gereken zaman – Tt(N)=O(N) (genellikle lineer)
Böl-ve-fethet yaklaşımı Toplam vakit gereksinimi bu durumda şöyledir – 2*Ta(N/2)+Tt(N) EĞER Ta(N/2)+ Ta(N/2)+Tt(N) < Ta(N) İSE, böl-ve-fethet yaklaşımı avantajlı görünüyor
Böl-ve-fethet yaklaşımı Böl-ve-fethet yöntemin ünlü uygulamaları: Hızlı Fourier Dönüşümü Pratik uygulamalarda çok kullanılan, zaman sinyalinin frekansları hesaplama algoritmasıdır (frekans-dönüşümü) Naif algoritma O(N2) zamandır Böl-ve-fethet algoritma O(N log N) zamandır Sıralam Sıralama naif algoritması O(N2) zamandır