Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Doç.Dr. Ahmet ÖZMEN Sakarya Üniversitesi Bilgisayar Mühendisliği Bölümü.

Benzer bir sunumlar


... konulu sunumlar: "Doç.Dr. Ahmet ÖZMEN Sakarya Üniversitesi Bilgisayar Mühendisliği Bölümü."— Sunum transkripti:

1 Doç.Dr. Ahmet ÖZMEN Sakarya Üniversitesi Bilgisayar Mühendisliği Bölümü

2 Ders Planı Özet (Ön bellek ile ilgili 4 temel soru) Blok tanımlama Blok yerleştirme (replacement) Blok yazma politikası Ön bellek miss sebeplerinin sınıflandırılması AMAT hesabı Örnekler 2

3 Özet 3 Soru 1: Veri bloğu üst seviyede nereye konulabilir? Blok yerleştirme (placement) Soru 2: Aranan blok üst seviyede değilse, nasıl bulunacak? Blok tanımlama Soru 3: Miss durumunda hangi blok değiştirilecek? Üzerine yazılacak blok seçimi (blok re-placement) Soru 4: Yazma işlemi nasıl yapılacak? Yazma stratejisi

4 Blok tanımlama 4 Her blok bellekte konumunu belirleyen bir adres etiketi “tag” barındırır. Aranılan adres içindeki kısım ile etiket eşleşirse “hit” oluşur. Karşılaştırma donanımda yapılır. Ön bellek bloğu tamamen boş ise ne olacak? Bu durum “valid bit” ile belirlenir (blok boşsa 0)

5 Blok tanımlama (devam) 5 Associative ön bellek: Index yok, “tag” = “blok adres” Set associative: Associativity artarsa index için ayrılan bit sayısı azalır, “tag” artar

6 Direk-map ön bellek tasarımı 6

7 7

8 Set-asociative ön bellek tasarımı 8 Temel fikir: Ön belleği kümelere ayır Blok set içinde herhangi bir yerde olabilir Avantaj: Yüksek hit oranı Dezavantaj: Fazla “tag” biti Fazla donanım Yüksek erişim süresi

9 Fully associative ön bellek tasarımı 9 Temel fikir: Küme boyutu 1 blok. Her blok için bir karşılaştırıcı devre gerekiyor Adres kod çözücü yok Aşırı derecede donanım gerektirdiği için, pratik olarak sadece küçük ön-belleklerde kullanılabilir

10 Ön bellek içindeki bit’lerin miktarı bitlik zahiri adres olduğunu düşünelim. 64 Kbyte veri tutabilecek bir direk-map ön bellek ve bir word blok boyutu verildiğinde, toplam kaç bitlik bellek gerekirdi. 2. Aynı ön bellek eğer 4-way set associative ön bellek olarak tasarlanmak istenseydi, toplamda kaç bitlik bir belleğe ihtiyaç olurdu? 3. Her bir blok içinde 8-word barındıran 64 Kbyte’lık direk- map bir ön bellek için (32 bitlik zahiri adres ) toplam kaç bitlik bir bellek gerekirdi?

11 Ön bellek içindeki bit’lerin miktarı Soru: 2. Soru:

12 Ön bellek içindeki bit’lerin miktarı Soru: Associativity artarsa => ön bellekteki bit sayısı artar Blok boyutu artarsa => ön bellekteki bit sayısı azalır

13 Blok replacement (tekrar) 13 Miss durumunda veri ana bellekten okunması gerekiyor Yeni gelen veri nereye konmalı? Direk map ön bellek: sabit bir bölgeye gidiyor (hep aynı yere) Set-associative, fully associative: Küme içinde herhangi bir yere Optimal algoritma: Gelecekte ihtiyaç olmayacak veriyi kaldır (geleceği bilmek gerekiyor!) LRU: Yakın zamanda kullanılmayanı kaldır (gerçeklenmesi zor!) FIFO: Önce gelen, önce gider (kümeyi dairesel bir kuyruk gibi düşünmek ve kuyruğun en önündekini atmak) Random: Rastgele seçim (en kolay gerçeklenebilir yöntem)

14 Yazma stratejisi 14 Yazma durumunda ne olacak? Write through: Belleğe yaz, iş bitinceye kadar işlemciyi beklet. Write buffer: Yazılacak veriyi bir buffer’a koy. CPU bekleme yapmadan işine devam edebilir Write back: Belleğe yazma işini, blok ön bellekten kaldırılıncaya (replace) kadar geciktir. Özel durumlar: DMA kullanılıyorsa, Çoklu işlemcili sistemlerde birçok ön bellek arasında “tutarlılığın” sağlanması.

15 Yazma stratejisi (write-through) 15 CPU tarafından yazma komutu icra edildiğinde; hem ön bellek ve hem de ana bellek güncellenir Ana bellek ile ön-bellek daima tutarlı WT stratejisinde genelde write-buffer kullanılır, bu şekilde alt seviye bellek (ana bellek) beklenmez.

16 Write back 16 İşlemci tarafından yazmalar, sadece ön bellek satırını günceller Güncellenen satır sadece ön-bellekten kaldırılması gerektiği zaman (yeni gelen için yer arandığında seçilenin bu olması durumunda) bir alt düzey belleğe yazılır. Her satır için «dirty bit» olması gerekir, öyle ki; blok modifiye edildiğinde set edilmeli Böylece ön-bellek satırının güncel olmadığı anlaşılır Bellek her zaman güncel değil Tekrarlanan yazmaların her seferinde alt seviyeye yazılması gerekmiyor

17 Store miss 17 Write allocate: Yazılacak blok ön belleğe getirilir Bloktaki word güncellenir Blok gelecekte de kullanılabilir No-write allocate: Ana bellek güncellenir Ön bellek güncellenmez, kopya varsa iptal edilir

18 Ön bellek temelleri (özet, tekrar) 18 Ön bellek: CPU ile ana bellek arasında geçici bellek katmanıdır. Zamanda lokallik prensibinden hareketle toplam bellek erişimini hızlandırır Ön bellek kümelere bölünmüştür; her küme içinde ana bellekteki verilerin bir kısmını barındırır Ön bellek parametreleri: Ön bellek boyutu, blok boyutu, associativity 3 tür ön bellek (w/n blok): Direk map: n küme, her kümede 1 blok var Fully associative: 1 küme, bu kümede n adet blok var Set associative: n/m küme, her kümede m blok var

19 Ön bellek temelleri (özet, tekrar) 19

20 Ön bellek performansının arttırılması 20 Ön belleğin ve bellek erişim performansının arttırılması: Ön bellek performansı: 1. Miss oranın azaltılması ile, 2. Miss cezasının azaltılması ile veya, 3. Hit zamanın azaltılması ile; arttırılabilir.

21 Miss’lerin sınıflandırılması 21 Zorunlu (compulsory): Ön belleğe ilk erişimde blok yoktur ve getirilmek zorundadır. Buna «cold start misses» de denir. Bellek boyutu sonsuz bile olsa, bu tür miss olur Kapasite: Program icrası sırasında ihtiyaç duyulan tüm blokları ön-bellek barındıramıyorsa oluşan miss’lere «kapasite miss» denir. Çakışma (conflict): Eğer blok yerleştirme algoritması direk- map ya da set-associative ise (zorunlu ve kapasite miss’lerinin yanında bir de) çakışma miss’leri oluşur.

22 3 miss sebebi 22

23 3 miss sebebi (%100 içinde) 23

24 Miss oranı nasıl azaltılır? 3 C’ler: Compulsory, capacity, conflict Tüm durumlarda ön bellek boyutu değişmesin Aşağıdaki durumları değerlendirelim: 1) Blok boyutu değiştirilirse: Hangi «C» bu durumdan etkilenir? 2) Associativity değiştirilirse: Hangi «C» bu durumdan etkilenir? 3) Derleyici değiştirilirse: Hangi «C» bu durumdan etkilenir? 24

25 1. Blok boyutu değiştirilirse? 25 Lokallik prensibinden; daha büyük blok, kullanılacak kısımları bulundurma şansını arttırır.

26 1 Blok boyutu değiştirilirse? 26 Blok boyutunun arttırılması miss oranını azaltır: Yerllik (lokallik) avantajı artıyor Zorunlu (Compulsary) misleri azaltıyor Ancak; Miss cezası artabilir (daha çok veri getirilmeli) Hit zamanı artabilir (ön bellekten daha fazla veri okunmalı ve büyük mux kullanılmalı) Conflict miss’ler nedeniyle toplam miss oranı artabilir Blok boyutunun arttırılması yardım edebilir fakat abartılmamalıdır. Blok boyutunun arttırılması genelde miss oranını azaltır, fakat miss cezası artar

27 2 Yüksek associativity 27 Associativity’nin arttırılması çakışma (conflict) miss’lerinin azalmasına yardımcı olur. 2:1 kuralı: N boyutundaki direk-map ön belleğin miss oranı, yaklaşık yarı boyuttaki 2-way set associative ön belleğin miss oranına eşittir. Örneğin; 32 Kbyte direk map bir önbelleğin miss oranı, yaklaşık 16 Kbyte 2-way set associative ön belleğin miss oranına eşittir. Yüksek associativitenin dezavantajları: Çok fazla sayıda karşılaştırma yapılması gerekli N to 1 mux gerekli Hit zamanını arttırabilir

28 AMAT vs Associativity 28 Kırmızı yerlerde associativity ile AMAT iyileşmemiş

29 Multilevel ön bellek 29 Eğer direk-map bir ön bellek %95 hit oranına sahipse ve hit zamanı 4 ns, miss cezası ise 100 ns ise AMAT nedir? AMAT = Hit time + miss oranı X miss cezası = x 100 = 9 ns. Eğer, hit zamanı 20 ns olan ve hit oranı %50 olan bir L2 ön bellek ilave edilse, yeni AMAT ne olur? AMAT = Hit zamanı L1 + miss oranı L1 X (Hit zamanı L2 +miss oranı L2 X miss cezası L2 ) = X ( X 100) = 7.5 ns

30 Örnek: 30 Hit zamanı 5 ns ve miss cezası 100 ns olan ön bellek 2-way set associative olsun. Hit oranı %97 olduğuna göre AMAT ? AMAT = Hit zamanı + miss oranı X miss cezası = X 100 = 8 ns. Bir işlemci 200 MHz ‘de çalışıyor (5 ns saat çevrim süresi) ve ideal CPI = 1.1 olsun (hiç miss olmadığı zaman). Komutların dağılımı (instruction mix): %50 ALU, %30 ld/st, %20 kontrol (dallanma) buna göre, %10 bellek verileri 50 çevrim miss cezası alıyor, Komutların %1’i aynı miss cezasını alıyor kabul edin. Buna göre AMAT?

31 Örnek: 31 CPI = ideal CPI + ortalama komut başına stalls (boş çevrimler) CPI = 1.1 (cycle/inst) + [0.30(veriBellekKomut) X 0.10 (miss/veriBellekKomut) X 50 (çevrim/miss)] + [ 1 (komutBellek/komut) X 0.01 (miss / komutBellekKomut) X 50 (çevrim/miss)] = = ( ) = 3.1 çevrim/komut AMAT = (1/1.3) X [ X 50] + (0.3/1.3) X [1+0.1X50] = 2.54

32 Tümleşik & Ayrık ön bellek 32 Örnek: 16 Kb I&D: ins. miss oranı = %0,64, data miss oranı = % Kb tümleşik, miss rate = %1.99 L2 görmezden gelinirse hangisi daha iyidir? %33 data işlemi olsun => %75 erişimkomutlardan (1.0 /1.33) Hit zamanı = 1, miss cezası = 50 Not: tümleşik ön bellek için data hit 1 stall (sadece tek portu var)

33 Tümleşik & Ayrık ön bellek 33


"Doç.Dr. Ahmet ÖZMEN Sakarya Üniversitesi Bilgisayar Mühendisliği Bölümü." indir ppt

Benzer bir sunumlar


Google Reklamları