Deniz TAŞKIN Nurşen SUÇSUZ SIKIŞTIRILMIŞ ORTAMDA ÇERÇEVE TİPİNE DAYALI GERÇEK ZAMANLI SAHNE DEĞİŞİMİ BELİRLEME Deniz TAŞKIN Nurşen SUÇSUZ
Önceki Çalışmalar Multimedya Dosyalarında Index Yapısı (TV Tree) Çokluortam Veritabanlarında Genişletilmiş Hashing Kullanımı Çoklu ortam veri tabanlarında R Tree kullanımı Histogram Tabanlı Nesne Çıkarımı
Çalışmalarımız Nesneler Arasındaki Uzaysal İlişkiler Üzerine Bir Uygulama Sıkıştırılmış Ortamda Çerçeve Tipine Dayalı Gerçek Zamanlı Sahne Değişimi Belirleme TUVDBS Video Veritabanı Yönetim Sistemi
SIKIŞTIRILMIŞ ORTAMDA ÇERÇEVE TİPİNE DAYALI GERÇEK ZAMANLI SAHNE DEĞİŞİMİ BELİRLEME
Sorun Bir video veri tabanı sistemi kullanıcıya aradığını en kısa sürede ve doğru şekilde geri verebilmelidir. Bu hiçbir gereksinime gerek olmadan bir operatörün videoları bire bir izleyerek anahtar kelimeler çıkarması ve veri tabanına eklemesi yoluyla kolayca gerçekleştirilebilir. Operatör video görüntüsünü işlemek için video üzerinde durdurma, geri-ileri alma, devam etme gibi işlemler yapmak zorundadır. Kullanıcı anahtar kelimeleri girerek kolayca aradığı video görüntüsüne hızlı ve doğru bir şekilde ulaşabilir. Fakat hiçbir otomasyon içermeyen bu sistem, operatör gereksinimi ve uzun video işleme süresi nedeniyle hiçbir zaman tercih edilmeyecektir. Zira bir sahnenin kendisini takip eden sahneden ayrılabilmesi için operatör işlemlerinin sıkça gerçekleştirilmesi gerekmektedir. Operatör işlemleri
Amaç Video veritabanı yöntemi sistemi, kullanıcı arayüzü biriminde operatör işlemlerini minimuma indirgeme ve zaman tasarrufu
Geleneksel yöntem 2 dakikalık video görüntüsünde 4000 çerçeve bulunmakta. Her bir çerçeve için: 1- Çerçeve kaydet(), 2- Renkli Histogram çıkar() 3- Bir önceki histogram ile karşılaştır() 4- Yorumla()
Mpeg Birbirine yakın piksellerin akan görüntüde büyük oranda değişmemesi özelliğini kullanır.
RGB-YUV Dönüşümü
RGB-YUV Dönüşümü Y = + 0.299R + 0.587G + 0.114B U = + 0.492(B - Y) = - 0.147R - 0.289G + 0.436B V = + 0.877(R - Y) = + 0.615R - 0.515G - 0.100B
Çerçeve yapısı MPEG şifrelemesi 3 tip çerçeve oluşturur I-Çerçevesi “Intracoded” (Arakodlanmış) Tam bir video resmi Gösterilebilmesi için başka bir resme ihtiyaç yok En çok veriyi kapsar P-Çerçevesi “Forward Predicted” (İleri yönde tahmin edilebilir) Bir önceki çerçevedeki farklılıkları şifreler Gösterilebilmesi için bir önceki çerçeveye ihtiyaç duyar B-Çerçevesi “Bidirectionally Predicted” (İki yönde tahmin edilebilir) Bir önceki yada daha sonraki çerçevedeki farklılıkları şifreler I çerçevesindeki verinin en az %25ini içerir Gösterilebilmesi için bir önceki yada sonraki çerçeveye ihtiyaç duyar
Çerçeve yapısı
Çerçeve yapısı
Çerçeve Tipleri
Video tabakaları Dilim Resim Makro blok Video sıralaması Blok Resim grupları (GOP) 8 piksel
Picture Header Her picture bir picture header ile başlar. Her picture header ise picture_start_code içerir. 32 bitlik bu kod; hex : 00 00 01 00 binary: 0000 0000 0000 0000 0000 0001 0000 0000
Uygulama Yazılımı Çalışma dahilinde geliştirdiğimiz uygulama yazılımı vs.net 2003 platformunda tasarlanmıştır. Tüm video dosyası belleğe okunarak ayıklayıcı birim (parser) tarafından analiz edilir. Bellek Okuma Ayıklayıcı Birim
Sonuç Sayısal video görüntülerinin büyük bir oranı MPEG video sıkıştırma metodu kullanılarak saklanmaktadır. Mpeg video sıkıştırma metodu standartlaşmıştır ve gerçek zamanlı olarak dahi çalışabilmektedir. Mpeg biçiminde sıkıştırılmış dosya, video görüntüleri hakkında değerli bilgiler içermektedir. Video işleme metotlarını kullanmak yerine bu bilgileri kullanmak işlemci zamanı açısından çok büyük bir kazanç sağlamaktadır.
Teşekkürler