Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Normalleştirme Veri Tabanı Yönetimi Ders 6. İlişkisel veri tabanı tasarlanması aşamasında verinin tekrarlanmasını, kaybını veya yetersizliğini önlemek.

Benzer bir sunumlar


... konulu sunumlar: "Normalleştirme Veri Tabanı Yönetimi Ders 6. İlişkisel veri tabanı tasarlanması aşamasında verinin tekrarlanmasını, kaybını veya yetersizliğini önlemek."— Sunum transkripti:

1 Normalleştirme Veri Tabanı Yönetimi Ders 6

2 İlişkisel veri tabanı tasarlanması aşamasında verinin tekrarlanmasını, kaybını veya yetersizliğini önlemek için normalleştirme (normalization) işlemi uygulanır. Normalleştirme, aynı zamanda “ilk taslak” veri tabanı tasarımının üzerinde revizyonlar yapmanın yolu, taslağı son haline yaklaştırmanın yöntemlerden birisidir. Normalleştirmenin altyapısı da, ilişkisel modelin altyapısı gibi matematikseldir. Temel alınan kavram, işlevsel bağımlılık (functional dependency) (bak slayt 6) denilen bir kavramdır.slayt 6 Veri Modelini Normalleştirmek

3 Sadece bu öğe bile normalleştirme ile uğraşmak için yeterli bir sebeptir. Eğer veri gereksiz yere tekrarlanıyorsa, bu değişik kopyalar, kopyalardan habersiz olan uygulama kodları yüzünden bir süre sonra birbirinden farklı değerleri taşımaya başlayabilirler. Bu, doğruluk ve tutarlılık açısından çok kötü bir sonuçtur. Bu gibi durumlarda ilişkisel veri tabanı yönetim sisteminin otomatik bütünlük (automatic integrity) mekanizmaları bile işe yaramaz. Düzeltmenin, uygulama seviyesinde yapılması gerekir. Fakat bu da uygulama programlarını daha karmaşıklaştıracak, dolayısıyla bakımını zorlaştıracaktır. Normalleştirmenin Amaçları - 1 Veri bütünlüğünü sağlamak

4 Normalleştirme, genelde bilinen ve takip edilen “ilişkisel model, verinin içeriğine göre kurulmalı, uygulamaya göre değil” kavramını bir adım daha öne alır. Bu sayede veri modeli, üzerinde onu kullanan uygulama değişse bile daha tutarlı, sabit ve değişmez olarak kalacaktır. Uygulama programının gereksinimlerinin veri tabanının mantıksal modeli üzerinde herhangi bir etkisi olmamalıdır. Uygulama, mantıksal model üzerinde değil, fiziksel model üzerinde etki yapar. Normalleştirmenin Amaçları - 2 Uygulamadan bağımsızlık

5 Saklama ihtiyaçlarını en aza indirgemek ve arama süresini azaltmak. Yabancı anahtarların haricinde, tamamıyla normalleştirilmiş bir veri tabanı gereksiz (kopyalanmış) veri miktarını en aza indirecektir. Kopyalanma miktarı azaldığı için, saklama yerine olan ihtiyaç ta azalır. Bu sayede, veri tabanı motorunun arama süresi azalacaktır. Normalleştirmenin Amaçları - 3 Performansı arttırmak

6 R bir ilişki şeması, X ve Y nitelik kümeleri ise R’nin alt kümeleri olsun (X  R, Y  R). Eğer X nitelik kümesinin değerleri Y nitelik kümesinin değerlerini belirliyorsa (X’in her bir değeri Y’nin bir değerine karşılık geliyorsa); “Y niteliği X niteliğine işlevsel bağımlıdır” denir ve “X  Y” şeklinde gösterilir. X’ten bir nitelik çıkarıldığı halde bu bağımlılık hâlâ geçerli ise kısmi bağımlılık (partial dependency) söz konusudur. İşlevsel Bağımlılık

7 DAĞITIM (müşteri_no, şehir_kodu, şehir_adı, parti_no, miktar) 1.müşteri_no  şehir_kodu, şehir_adı 2.(müşteri_no, parti_no)  miktar 3.şehir_adı  şehir_kodu (geçişli bağımlılık) İlk ikisi anahtara göre bağımlı, üçüncüsü geçişli bağımlı (transitive dependent). Bir müşteriye birden fazla parti ürün gönderilebildiği için ikincisinde iki nitelik bir anahtar oluşturuyor. İşlevsel Bağımlılık

8 Normalleştirme Aşamaları Birinci Normal Form İkinci Normal Form Üçüncü Normal Form Boyce-Codd Normal Formu Dördüncü Normal Form …

9 Normal Olmayan Form İlişkisel veri tabanı modelinin temel kuralına göre bütün niteliklerin aldığı değerler atomik (tek ve basit) olmalıdır. Aşağıdaki DAĞITIM tablosu bu kurala uymamaktadır, bu yüzden normal değildir. müşteri_noşehir_koduşehir_adıparti_nomiktar 134İstanbul1,2,3,4,6300,200,400,200,100 26Ankara1,2300,400 36Ankara2200 434İstanbul2,4,5200,300,400

10 Birinci Normal Form Uygulandığında: müşteri_noşehir_koduşehir_adıparti_nomiktar 134İstanbul1300 134İstanbul2200 134İstanbul3400 134İstanbul4200 134İstanbul6100 26Ankara1300 26Ankara2400 36Ankara2200 434İstanbul2200 434İstanbul4300 434İstanbul5400

11 Birinci normal formdaki bir tablo bazı alanlarda tekrarlı verilere sahiptir. Örneğimizde şehir_kodu ve şehir_adı alanlarında her müşteri için tekrarlı veriler vardır. Bu tekrarlar ekleme, silme ve güncelleme işlemlerinde sorunlara neden olacaktır. Birinci Normal Formun Sorunları

12 Başka bir müşterinin bilgilerinin (müşteri_no, şehir_kodu, şehir_adı) girilmesi için mutlaka o müşteriye bir dağıtım işleminin yapılması (parti_no ve miktar değerlerinin girilmiş olması) gerekiyor. Satır Ekleme Sorunu müşteri_noşehir_koduşehir_adıparti_nomiktar 134İstanbul1300 …………… 434İstanbul5400 535İzmir

13 Bir müşteriye tek bir dağıtım yapıldıysa (örn. 3 no’lu müşteri), o dağıtım işlemi iptal edildiğinde, sadece parti_no ve miktarı değil, o dağıtımın yapıldığı müşteri hakkındaki diğer bilgiler de (müşteri_no, şehir_kodu, şehir_adı) yok olur. Satır Silme Sorunu müşteri_noşehir_koduşehir_adıparti_nomiktar 134İstanbul1300 134İstanbul2200 …………… 36Ankara2200 ……………

14 1 numaralı müşteri Ankara’ya taşınırsa, bu müşteri ile ilgili tüm satırların güncelleştirilmesi gerekecektir. Eğer tablo çok büyük ise, sadece bir müşteri ile ilgili küçük bir değişiklik bile binlerce kaydın güncelleştirilmesini gerektirebilir. Güncelleme Sorunu müşteri_noşehir_koduşehir_adıparti_nomiktar 134İstanbul1300 134İstanbul2200 134İstanbul3400 134İstanbul4200 ……………

15 Birinci normal formdaki sorunlardan (en azından güncelleme sorunundan) kurtulmak için nitelikler arasındaki işlevsel bağımlılıktan yararlanılarak birinci normal form (1NF) tablolarının birden fazla tabloya dönüştürülmesi sonucunda ikinci normal forma (2NF) ulaşılır. İkinci normal formda, ilişkisel tablonun her bir anahtar olmayan sütunu birincil anahtara kısmi bağımlı değil, tam işlevsel bağımlı olmalıdır. İkinci Normal Form

16 şehir_kodu ve şehir_adı nitelikleri (müşteri_no, parti_no) birleşik anahtarının sadece müşteri_no niteliği üzerinde tam işlevsel bağımlıdır. O halde şehir_kodu ve şehir_adı nitelikleri müşteri_no ile beraber ayrı bir tablo oluşturmalıdır. –DAĞITIM(müşteri_no, şehir_kodu, şehir_adı, parti_no, miktar) –ŞEHİRLER(müşteri_no, şehir_kodu, şehir_adı) –MİKTARLAR(müşteri_no, parti_no, miktar) İkinci Normal Form

17 İkinci Normal Form Uygulandığında: müşteri_noparti_nomiktar 11300 12200 13400 14200 16100 21300 22400 32200 42 44300 45400 müşteri_noşehir_koduşehir_adı 134İstanbul 26Ankara 36 434İstanbul ŞEHİRLER MİKTARLAR

18 Birinci normal formdaki güncelleme sorununu ikinci normal forma dönüştürme ile ortadan kaldırmış olsak ta, ikinci normal formda da ekleme ve silme sorunları olabilmektedir. İkinci Normal Formun Sorunları

19 ŞEHİRLER tablosuna yeni bir müşteri kaydı girilmediği sürece yeni bir şehir tanımı yapılamaz. İzmir ilini tabloya dahil edebilmek için İzmir’de bulunan bir müşteriye ihtiyaç vardır. Satır Ekleme Sorunu müşteri_noşehir_koduşehir_adı 134İstanbul 26Ankara 36 434İstanbul 35İzmir

20 Tablodan bir müşteri silindiğinde, eğer o şehirdeki tek müşteri ise, şehir_kodu ve şehir_adı bilgileri de yok olacaktır. Satır Silme Sorunu müşteri_noşehir_koduşehir_adı 134İstanbul 26Ankara 36 434İstanbul 535İzmir

21 Birinci normal formdaki sorunlardan kurtulmak için nitelikler arasındaki kısmi işlevsel bağımlılıkları ortadan kaldırmıştık. İkinci normal formdaki sorunlardan kurtulmak için de nitelikler arasındaki geçişli işlevsel bağımlılıkları ortadan kaldırmamız gerekir. Örneğimizde “şehir_adı  şehir_kodu” işlevsel bağımlılığının geçişli olduğunu belirtmiştik (bak slayt 7). Bir anahtara bağlı olmayan bu bağımlılığı ayrı bir tabloya dönüştürerek üçüncü normal formu (3NF) elde edebiliriz. slayt 7 Üçüncü Normal Form

22 Üçüncü Normal Form Uygulandığında: müşteri_noparti_nomiktar 11300 12200 13400 14200 16100 21300 22400 32200 42 44300 45400 şehir_koduşehir_adı 6Ankara 34İstanbul 35İzmir ŞEHİRLERMİKTARLAR müşteri_noşehir_kodu 134 26 36 4 535 MÜŞTERİLER

23 Boyce-Codd Normal Formu ÖğrNoBölümDanışman 123FizikA. ERCAN 123KimyaM. AKINCI 456BiyolojiK. SÖNMEZ 789FizikA. ERCAN 999KimyaB. ÖZKAN Her belirleyicinin bir anahtar oluşu halidir. Örnek olarak aşağıdaki ilişkiyi düşünelim: ÖĞRENCİ(ÖğrNo, Bölüm, Danışman) ÖĞRENCİ

24 Boyce-Codd Normal Formu ÖğrNoBölümDanışman 123FizikA. ERCAN 123KimyaM. AKINCI 456BiyolojiK. SÖNMEZ 789FizikA. ERCAN 999KimyaB. ÖZKAN 1NF ? 2NF ? 3NF ? EVET (bütün niteliklerin aldığı değerler atomik) EVET (kısmi bağımlılık yok) EVET (geçişli bağımlılık yok)

25 Boyce-Codd Normal Formu ÖğrNoBölümDanışman 123FizikA. ERCAN 123KimyaM. AKINCI 456BiyolojiK. SÖNMEZ 789FizikA. ERCAN 999KimyaB. ÖZKAN Her üç normal formu da sağlıyor. Sorun var mı? EVET 1.456 numaralı öğrenci silinirse Biyoloji ve K.SÖNMEZ yok olacak 2.Bir öğrenci Matematik bölümüne kayıt olana kadar bu bölüm var olmayacak.

26 Çözüm: Belirleyicileri anahtar yap Birincil Anahtar: –(ÖğrNo, Bölüm) Aday Anahtar: –(ÖğrNo, Danışman) İşlevsel Bağımlılıklar: –(ÖğrNo, Bölüm)  Danışman –Danışman  Bölüm ÖğrNoBölümDanışman 123FizikA. ERCAN 123KimyaM. AKINCI 456BiyolojiK. SÖNMEZ 789FizikA. ERCAN 999KimyaB. ÖZKAN Belirleyiciler

27 Boyce-Codd Normal Formu (BCNF) Uygulandığında: ÖĞRENCİ ÖğrNoBölümDanışman 123FizikA. ERCAN 123KimyaM. AKINCI 456BiyolojiK. SÖNMEZ 789FizikA. ERCAN 999KimyaB. ÖZKAN ÖĞRENCİ_DANIŞMAN ÖğrNoDanışman 123A. ERCAN 123M. AKINCI 456K. SÖNMEZ 789A. ERCAN 999B. ÖZKAN DANIŞMAN_BÖLÜM DanışmanBölüm A. ERCANFizik M. AKINCIKimya K. SÖNMEZBiyoloji B. ÖZKANKimya

28 NF: Normal olmayan form 1NF: Bütün alan değerleri atomik ise R 1NF’de 2NF: R 1NF’de ise ve anahtar olmayan tüm nitelikler anahtara tam bağımlı ise R 2NF’de 3NF: R 2NF’de ise ve anahtar olmayan tüm nitelikler anahtara geçişsiz bağımlı ise R 3NF’de BCNF: Her belirleyici bir aday anahtar ise R BCNF’de Belirleyici: Başka bir niteliğin tam işlevsel bağımlı olduğu nitelik Özet

29 Bazı durumlarda BCNF’daki bir ilişkide de sorunlar görülebilmektedir. Örneğin; ÖĞRENCİ(ÖğrNo, Bölüm, Spor) Dördüncü Normal Form ÖĞRENCİ ÖğrNoBölümSpor 123FizikKayak 123KimyaKayak 123FizikTenis 123KimyaTenis 999KimyaTenis

30 Burada bir öğrenci birden çok bölüme kayıt olabilmekte ve birden çok spor etkinliğine katılabilmektedir. Bu nedenle ÖğrNo ile Bölüm ve ÖğrNo ile Spor arasındaki ilişkiler birer işlevsel bağımlılık değil çok- değerli bağımlılık (multivalued dependency) halindedir. Dördüncü Normal Form ÖĞRENCİ ÖğrNoBölümSpor 123FizikKayak 123KimyaKayak 123FizikTenis 123KimyaTenis 999KimyaTenis ÖğrNo  Bölüm ÖğrNo  Spor çok-değerli bağımlılık

31 123 numaralı öğrencinin bir bölüme daha kayıt olması yada bir spor etkinliğine daha katılması halinde iki kayıt daha ilave edilmelidir. Bu gibi yineleme sorunlarını ortadan kaldırmak için ÖĞRENCİ ilişkisi ikiye ayrılırak dördüncü normal form (4NF) oluşturulur. Dördüncü Normal Form ÖĞRENCİ_BÖLÜM ÖğrNoBölüm 123Fizik 123Kimya 999Biyoloji ÖĞRENCİ_SPOR ÖğrNoSpor 123Kayak 123Tenis 999Yüzme

32 Örnek 1 Ö.NOÖ.ADÖ.SOYADDERS_NODERS_ADIVIZEFINALH.NOH.ADH.SOYAD 2001001AhmetSolmaz202Matematik 2706011ÖzlemUÇAR 2001001AhmetSolmaz203Fizik 2804011ÖzlemUÇAR 2001001AhmetSolmaz204 Bilgisayar Mühendisliğine Giriş 2 60453AydınCARUS 2001001AhmetSolmaz205 Atatürk İlkeleri ve İnkılap Tarihi 2 90959ZekiDURMUŞ 2001001AhmetSolmaz206Türk Dili 2707512NebahatYILDIZ 2001005SeyhanGülmez202Matematik 2809511ÖzlemUÇAR 2001005SeyhanGülmez203Fizik 2807011ÖzlemUÇAR 2001005SeyhanGülmez204 Bilgisayar Mühendisliğine Giriş 2 60703AydınCARUS 2001002SelimSolmaz702Veri Tabanı Yönetimi60506AltanMESUT 2001003AhmetVardar702Veri Tabanı Yönetimi60 6AltanMESUT 2001004SezaiKantar702Veri Tabanı Yönetimi65556AltanMESUT

33 Verilen şema 1. Normal Formda (atomik değerler) –OKUL (Ö.No, Ö.Ad, Ö.Soyad, Ders_No, Ders_Adı, Vize, Final, H.No, H.Ad, H.Soyad) 2. NF’ye geçerken kısmi bağımlılıklar ortadan kaldırılır –NOTLAR(Ö.No, Ders_No, Vize, Final) –ÖĞRENCİLER(Ö.No, Ö.Ad, Ö.Soyad) –DERSLER(Ders_No, Ders_Adı, H.No, H.Ad, H.Soyad) 3. NF’ye geçerken geçişli bağımlılıklar ortadan kaldırılır –NOTLAR(Ö.No, Ders_No, Vize, Final) –ÖĞRENCİLER(Ö.No, Ö.Ad, Ö.Soyad) –DERSLER(Ders_No, Ders_Adı, H.No) –HOCALAR(H.No, H.Ad, H.Soyad)

34 Örnek 2 UrunNoUrunAdParcaNoParcaAdMiktarUreticiNoUreticiAdUreticiSehirUreticiTel 10026201 Pavilion DV2620ET 1 Intel Core 2 Duo T5450 1100HPSeattle123456789 10026201 Pavilion DV2620ET 2 Kingston 512MB DDR2 2100HPSeattle123456789 10026201 Pavilion DV2620ET 3 Samsung 160GB HDD 1100HPSeattle123456789 10026201 Pavilion DV2620ET 4 Nvidia GeForce 8400M 1100HPSeattle123456789 10026501 Pavilion DV2650ET 1 Intel Core 2 Duo T7500 1100HPSeattle123456789 10026501 Pavilion DV2650ET 2 Kingston 1024MB DDR2 2100HPSeattle123456789 10026501 Pavilion DV2650ET 3 Samsung 160GB HDD 1100HPSeattle123456789 10026501 Pavilion DV2650ET 4 Nvidia GeForce 8400M 1100HPSeattle123456789 10220012 Satellite A200- 1N2 1 Intel Core 2 Duo T5250 1102ToshibaTokyo335678912 10220012 Satellite A200- 1N2 2 Samsung 1024MB DDR2 2102ToshibaTokyo335678912 10220012 Satellite A200- 1N2 3 Maxtor 120GB HDD 1102ToshibaTokyo335678912 10220012 Satellite A200- 1N2 4Intel GMA X31001102ToshibaTokyo335678912

35 Verilen şema 1. Normal Formda (atomik değerler) –Urun_Parca (UrunNo, UrunAd, ParcaNo, ParcaAd, Miktar, UreticiNo, UreticiAd, UreticiSehir, UreticiTel) 1NF → 2NF (kısmi bağımlılıklar giderilir) –Urun_Parca (UrunNo, ParcaNo, ParcaAd, Miktar) –Urunler (UrunNo, UrunAd, UreticiNo, UreticiAd, UreticiSehir, UreticiTel) 2NF → 3NF (geçişli bağımlılıklar giderilir) –Urun_Parca (UrunNo, ParcaNo, ParcaAd, Miktar) –Urunler (UrunNo, UrunAd, UreticiNo) –Ureticiler (UreticiNo, UreticiAd, UreticiSehir, UreticiTel)

36 Örnek 3 SiparisNoTarihUrunAdUrunNoAdetMusNoMusAdMusSoyad 123.11.2007Nokia 6300574631875AliKorkmaz 123.11.2007Kingston 2 GB USB736242875AliKorkmaz 223.11.2007Samsung D600723521932SelinAtasoy 324.11.2007Nokia 5070712241123KamilSönmez 424.11.2007Philips DVP 5160/12908761452MetinKaplan 525.11.2007 Samsung Digimax S850981231786KemalDurukan 625.11.2007Sinbo SBS-4414 Baskül354652932SelinAtasoy 725.11.2007Canon Powershot A560952931875AliKorkmaz 725.11.2007Kingston 2 GB SD372851875AliKorkmaz 826.11.2007Nokia 6300574631321EceÇağlayan

37 Verilen şema 1. Normal Formda (atomik değerler) –SIPARIS (SiparisNo, Tarih, UrunAd, UrunNo, Adet, MusNo, MusAd, MusSoyad) 1NF → 2NF (kısmi bağımlılıklar giderilir) –SIPARIS_URUN (SiparisNo, UrunNo, Adet) –SIPARIS_MUSTERI (SiparisNo, Tarih, MusNo, MusAd, MusSoyad) –URUN (UrunNo, UrunAd) 2NF → 3NF (geçişli bağımlılıklar giderilir) –SIPARIS_URUN (SiparisNo, UrunNo, Adet) –SIPARIS_ MUSTERI (SiparisNo, Tarih, MusNo) –MUSTERILER (MusNo, MusAd, MusSoyad) –URUN (UrunNo, UrunAd)


"Normalleştirme Veri Tabanı Yönetimi Ders 6. İlişkisel veri tabanı tasarlanması aşamasında verinin tekrarlanmasını, kaybını veya yetersizliğini önlemek." indir ppt

Benzer bir sunumlar


Google Reklamları