Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

AccessIT Projesi Dijitalleştirme Uzaktan Eğitim Programı Ders Özeti

Benzer bir sunumlar


... konulu sunumlar: "AccessIT Projesi Dijitalleştirme Uzaktan Eğitim Programı Ders Özeti"— Sunum transkripti:

1 AccessIT Projesi Dijitalleştirme Uzaktan Eğitim Programı Ders Özeti
ODTÜ Kütüphanesi Hizmetiçi Eğitim Seminerleri Hazırlayan ve Sunan: Hale Uysal Tarih: 24 Şubat 2011 Bu sunum, 10 Ocak – 11 Şubat 2011 tarihleri arasında Hacettepe Üniversitesi aracılığı ile alınan 8 dersin özetini kapsamaktadır ve ODTÜ Kütüphane personelinden, bu eğitime katılamayan kütüphanecileri bilgilendirmek amacı ile hazırlanmıştır. Sunumda yer alan tüm bilgiler, adresinde yer alan uzaktan eğitim modülünden alınmıştır.

2 ACCESSIT nedir? Accelerate the Circulation of Culture through Exchange of Skills in Information Technology ya da Bilgi Teknolojilerinin Değişen Yetenekleri Çerçevesinde Kültür Dolaşımının Hızlandırılması AccessIT AB Projesi Hakkında Bu Proje, 2009 Aralık ayında Hacettepe Üniversitesi’nin de Türkiye adına yürütücü ortak (partner) olarak dahil olduğu ve Avrupa Birliği Eğitim ve Kültür Programı altında kabul edilen ACCESSIT Projesi kapsamında Türkiye’de yürütülecek faaliyetlere altyapı hazırlamak, bu faaliyetleri yapılandırmak ve gerçekleştirmek amacıyla oluşturulmuştur. ACCESSIT Projesinin diğer ortakları; İngiltere’den MDR Partner, Yunanistan’dan Veria Halk Kütüphanesi, Polonya’dan Instytut Chemii Bıoorganıcznej ve Sırbistan’dan Belgrad Şehir Kütüphanesidir. Bu proje ile eğitim ve teknolojik altyapı sağlanarak Türk kültürünü yansıtan kaynağın, EUROPEANA (Avrupa Dijital Kütüphanesi) standartlarına uygun biçimde metadata alanları oluşturularak dijitalleştirilmesi ve EUROPEANA Avrupa Dijital Kütüphanesine aktarılması hedeflenmektedir.

3 Hangi Dersleri Gördük? Dijitalleştirmeye giriş
Dijitalleştirme ekipman ve yazılımı Dijital kütüphanelerin temelleri Dijital koleksiyonlar oluşturma Dijital nesneleri tanımlama Kültürel miras nesnelerinin dijital versiyonlarını hazırlama Nesneleri online olarak yayınlama Dijital kütüphane değerlendirme ve izleme

4 Neden Dijitalleştirme?
Bazı örnekler: Henry III Fine Rolls Projesi Discover Domesday Avustralya Gazeteleri Dijitalleştirme Programı Büyük Savaş Arşivi *

5 Henry III Fine Rolls Projesi
Henry III Fine Rolls Project Milli Arşivler ve London King's College tarafından geliştirilmiştir. "Fine rolls (Hassas rulolar), İngiliz kraliyet baş mahkemesi tarafından derlenmiş, hayatta kalmış en eski rulolardır yılından, birbirini takip eden sırada hayatta kalmıştır ve Kew’deki Milli Arşivler’de saklanmaktadır. Henry III’ün hüküm sürdüğü ( ) yıllara ait elli altı rulo mevcuttur, parşömen üzerine Latince yazılmıştır [...] İngiltere tarihi açısından Henry’in hüküm sürdüğü erken dönemde Magna Carta’nın kurulması ile parlamenter devlet arasındaki döneme ait hayati değere sahip bir kaynaktır." [kaynak] 1. Rulolar modern İngilizceye tercüme edilmiştir, 2. Tarama özelliği oluşturularak kullanıcıların kişi, yer ve konu taraması yapmaları sağlanmıştır, 3. Orijinal Latince içerik üzerinde çalışma olanağı sunmak için taranmış görüntüler sunulmuştur, 4. Uygun indeksler içeren çeviriler bir kitaplar seti olarak yayımlanmıştır  [kaynak].

6 Discover Domesday Discover Domesday İngiliz Milli Arşivi'nin bir projesidir. "Domesday en meşhur ve en eski hayatta kalmış kamu kayıtlarıdır. Kralın ve baş kiracılarının elinde bulunan bütün toprakların ayrıntılı araştırması ve değerininin yanı sıra 11'inci yüz yıl İngiltere'sinde toprakla ilgili bütün kaynakları içerir. İngiltere’de 19'uncu yüz yıl nüfus sayımlarına kadar buna benzer bir şey yoktur." [kaynak] Domesday kitabı İngiltere'nin favori hazinesi olarak seçilmiş ama onu Ulusal Arşiv Müzesinde sergilenirken nüfusun yüzde birinden azı görmüştür. Milli Arşiv bu kitabı çevrimiçi sunarak okul çocukları, şecere meraklıları ve uzman araştırmacılar dahil daha çok kişinin ilgisini çekeceğini ummuştur. Domesday kitabı şimdi çevrimiçi ve ücretsiz sunulmaktadır; kullanıcılar verilen başlıklarla kolayca tarayabilir ve modern çevirisini okuyabilirler. Buna ek olarak okul çocukları için oyun ve sınav dahil, çeşitli eğitim materyalleri de geliştirilmiştir [kaynak].

7 Avustralya Gazeteleri Dijitalleştirme Programı
Australian Newspapers Digitisation Program Avustralya Milli Kütüphanesinin bir projesidir. Programın temel hedefleri; Avustralya gazetelerine erişimi arttırmak, yılları arasında yayımlanmış Avustralya gazetelerine ücretsiz çevrimiçi erişim sağlayacak milli bir hizmet oluşturmak. Eski gazetelerin genellikle saf kalitede asitli kağıda basıldığı düşünülecek olursa; uzun dönemde bu materyalleri korumanın tek yolu dijital ortama aktarıp mikrofilme almaktır.

8 Büyük Savaş Arşivi The Great War Archive  Oxford Üniversitesi tarafından geliştirilen Oxford’un Birinci Dünya Savaşı Şiir Arşivi’nin bir yan projesidir. GWA, aile fotoğrafları, günlükler, mektuplar, savaş zamanından kalma eserler gibi halkın elinde bulunan materyalleri bir araya toplamayı hedeflemekdeydi. Proje çalışanları (çeşitli iletişim kanallarını kullanarak) halkın materyalleri getirmelerini ve ailelerinin yaşadıkları ile ilgili kuşaklardır anlatılan hikayeleri kaydetmelerini istedi. Projenin yürütüldüğü 16 hafta boyunca 6500 malzeme toplandı. “Projede çeşitli savaş alanlarından askerlere ait benzersiz, yayınlanmamış 42 adet günlük, 63 hatıra, 255 yayınlanmamış mektup, 700’den fazla fotoğraf, çeşitli kitapçık, yerel asker toplama posterleri, nadir nesnelerin görüntüleri (orijinal meçhul asker mezar taşı tasarımı gibi) ile benzeri materyal toplandı" [kaynak]. Şimdiye kadar görülmemiş bu materyaller akademik kurumlarda çalışan araştırmacılar, şecere çalışanlarına, yerel tarihçilere ve sadece ilgisini çektiği için bu konuyla ilgilenenlere yeni araştırma yolları sağlamaktadır. Sonuç olarak, kendi aileleri ve toplulukları içinde tarihlerinin izini süren kamuoyu tarafından projeye düzenli olarak başvurulmaktadır." [kaynak].

9 Neden dijitalleştirme?
Bilinmeyen veya az kullanılan koleksiyonlara daha iyi erişim sağlar. Görsel bir koleksiyon için daha iyi tarama ve erişim olanakları sunar. Gelişmiş indeksleme veya bazı dijital görsel iyileştirmeler sayesinde orijinal çalışmaların daha iyi anlaşılmasını sağlar (...)

10 Neden dijitalleştirme? (...)
Eğitim ve öğrenimde kullanmaya uygun kaynaklar yaratır. Halkın kültürel mirası tanıma, öğrenme ve anlayışını geliştirir. Dijital formatta gelecek için koleksiyonları koruma olanağı verir (...)

11 Neden dijitalleştirme? (...)
Sonuç olarak dijital medya; daha fazlasını görmeye, daha fazlasını öğrenmeye, daha fazlasını yapmaya izin verir.

12 Dijitalleştirme neden zor?
Bazen bu iş için birden fazla doğru araç olabilir. Elinizdeki aracı kullanarak nasıl dijitalleştirme yapacağınızı bilmeniz gerekir. Unutmayın eski/değerli nesnelerle uğraşıyorsunuz (dikkatli olun!) (...)

13 Dijitalleştirme neden zor? (...)
Bu, o nesneyi dijitalleştirmek için son şans olabilir, tarama sürecinde ve sonrasında kaliteyi garantileyin. Metin içeren dijital görüntüyü dijital metne çevirmek gerçekten uğraştırıcı bir iş olabilir ama bunu yapmaya değer. Dijital kütüphaneler kullanıcılar için oluşturulur, online olarak yayımlamak için format seçerken bunu aklınızda tutun.

14 Dijitalleştirme İş Akışı
Dijitalleştirme için nesneyi seç Nesnenin metadatasını hazırla Dijitalleştirmeyi gerçekleştirmek için doğru ekipmanı seç Nesneyi tara (scan) Grafik yazılımı kullanarak taranmış görüntüyü düzenle Dijital nesnenin web üzerinde sunulacak versiyonunu hazırla Dijital ana kopyayı emniyete al Nesneyi dijital kütüphanede yayımla

15 Dijitalleştirme sürecini etkileyebilecek bazı önemli faktörler
Genelde telif ve Entelektüel Mülkiyet Hakları (Intellectual Property Rights - IPR) Mevcut dijital versiyonların bulunması Dijitalleştirmenin yüksek maliyeti

16 Dijitalleştirmede dış kaynak kullanımı ne zaman bir çözümdür?
Dış kaynak kullanımının olası nedenleri: kısa sürede büyük bir işin yapılacak olması özel malzemelerin aşırı maliyeti beceri veya deneyim eksikliği nedeniyle kurum içinde ihtiyaç duyulan kaliteyi sunamama projenin yer, alt yapı veya personel gibi mecburiyetleri çok büyük miktardaki gazete veya mikrofilm tarama, metni yeniden daktilo etme veya XML işaretleme gibi işler yapılmak zorunda olunması Dış kaynak kullanımı dijitalleştirme maliyetini gerçek anlamda düşürebilir ve stratejik avantaj sağlayabilir. Projenin yer, alt yapı veya personel gibi mecburiyetleri kurum içinde dijitalleştirmeyi engelleyebilir. Çok büyük miktardaki gazete veya mikrofilm tarama, metni yeniden daktilo etme veya XML işaretleme gibi işler için başka ülkelerdeki bürolardan (daha düşük personel ücreti fiyatlarına yansımaktadır) yararlanılabilir.

17 Dijitalleştirmede dış kaynak kullanımı ne zaman bir çözümdür? (devam)
Dış kaynak kullanmaya karar vermeden önce yanıtlanması gereken sorular: temel becerileriniz üzerine yeniden yoğunlaşabilecek ve toplam maliyeti düşürmek için firmanın uzmanlığını kullanabilecek misiniz? kendi beceriniz gelişecek ve projeyi tamamlama kapasiteniz iyileşecek mi? başka türlü maliyetini karşılayamayacağınız, anahtar teknolojilere ve ekipmana daha çok erişiminiz olacak mı? eskimenin (eski donanım/teknoloji/taşıyıcılarla uğraşırken ortaya çıkan sorunlar) getireceği risk ve maliyetini düşürebildiniz mi? insan kaynakları açısından ölçek ekonomilerini arttırdınız mı? yetenekli personele erişiminiz arttı mı? dış kaynak kullanımı harcamaları, masrafları ve genel giderler üzerindeki kontrolünüzü artırdı mı?"

18 Dijitalleştirmede dış kaynak kullanımı ne zaman bir çözümdür? (devam)
Sizi dışarıdan bir firmayı görevlendirmekten alıkoyacak nedenleri de aklınızda tutmanız gerekir: koleksiyonu taşımak zordur veya kurum dışına taşınamaz koleksiyon kötü düzenlenmiştir, envanteri yapılmamıştır veya materyal düzeyinde kataloglanmamıştır ve sürecin bir parçası olarak yeniden iyi bir şekilde düzenlenmesi gerekmektedir dijitalleştirmenin uzun bir sürede, oldukça küçük bir miktarlarda aşamalı olarak yapılması gerekmektedir orijinaller üzerinde çalışılırken, bunlar dış kaynak kullanımı yapılacak ortamda yeterince korunamayacaklardır dijitalleştirme görev ve hedefleri çok karmaşık ve çeşitlidir işin miktarı çok küçüktür *

19 Dijitalleştirmede dış kaynak kullanımının avantajları
Pahalı ekipman satın alıp bakımını yapmak için para bulmak zorunda değilsiniz. Yeni personel almanız veya mevcut personeli eğitmeniz gerekmez. Projeyi yürütmek için kurum içinde insanlar ve makinalar için büyük alanlar açmanız gerekmez. Dijitalleştirme konusunda derin bilgiler edinmeniz gerekmez. Eğer yüklenici, işten tasarruf sağlayan teknolojilere sahipse, kurum içi dijitalleştirmeden daha ucuza gelebilir. Daha yüksek kaliteli ekipman ve çok deneyime sahipse, yüklenici daha kaliteli bir sonuç elde edebilir. * * Pahalı ekipman satın alıp bakımını yapmak için para bulmak zorunda değilsiniz - üstlenici firma ekipman ana maliyetinden sorumludur * Yeni personel almanız veya mevcut personeli eğitmeniz gerekmez - üstlenici firma işletimcileri kiralamak ve eğitmekten sorumludur.  * Projeyi yürütmek için kurum içinde insanlar ve makinalar için büyük alanlar açmanız gerekmez. * Dijitalleştirme konusunda derin bilgiler edinmeniz gerekmez (ama sonuçların kalitesini kontrol etmek için biraz bilgi gerekir). * Eğer yüklenici işten tasarruf sağlayan teknolojilere sahipse ve iyi ölçek ekonomileri elde edebilecekse, kurum içi dijitalleştirmeden daha ucuza gelebilir. * Daha yüksek kaliteli ekipman ve çok deneyime sahipse, yüklenici daha kaliteli bir sonuç elde edebilir. * Maliyet ve zaman konusunu iyi tayin etmelisiniz, böylece yüklenici iş akışını iyi anlayacak ve sizinle buna göre anlaşma yapacaktır.

20 Dijitalleştirmede dış kaynak kullanımının dezavantajları
Dijitalleştirme ve (metin, görüntü) alma konularında kurumsal bilgi veya kapasite geliştiremezsiniz. Tatmin edici derecede kaliteli dijital içerik sunmak için dışarıdan insanlarla çalışmanın getirdiği riskler vardır. Baştan sona dışarıdan bir yüklenici ile iş yapabilmesi için kurum içinde birinin dijitalleştirme sürecini iyi anlaması gerekecektir . Yüklenici sizin zaman çerçevenize uyamayabilir. Yüklenici, kurum içinde dijitalleştirmenin maliyetinden daha fazlasını sizden isteyebilir. Faturayı imzalamadan önce, yüklenicinin yaptığı işin kalitesinden emin olmak için kendi dahili kalite kontrol denetiminizi yapmanız gerekir.  Eğer dışarıya çıkmalarına izin veriliyorsa, değerli materyaller için taşıma ve sigorta işlerini ayarlamanız gerekir. Eğer materyaliniz kurum dışına çıkacaksa, bunun bazı riskleri olabilir * * Dijitalleştirme ve (metin, görüntü) alma konularında kurumsal bilgi veya kapasite geliştirmezsiniz. (Dijitalleştirme giderek çok daha fazla önem kazınırken, kendi dijital becerilerinizi geliştirmek istemeniz çok muhtemeldir, o halde neden bugün başlamayasınız?) * Tatmin edici derecede kaliteli dijital içerik sunmak için dışarıdan insanlarla çalışmanın getirdiği riskler vardır. * Baştan sona dışarıdan bir yüklenici ile iş yapabilmesi için kurum içinde birinin dijitalleştirme sürecini iyi anlaması gerekecektir. (Bu; teknik terminolojiyi, kabul edilen teknik şartnameyi ve kalite kontrol ölçümlerini anlamayı içerir.) * Yüklenici sizin zaman çerçevenize uyamayabilir. * Yüklenici, kurum içinde dijitalleştirmenin maliyetinden daha fazlasını sizden isteyebilir. * Faturayı imzalamadan önce, yüklenicinin yaptığı işin kalitesinden emin olmak için kendi dahili kalite kontrol denetiminizi yapmanız gerekir.  * Eğer dışarıya çıkmalarına izin veriliyorsa, değerli materyaller için taşıma ve sigorta işlerini ayarlamanız gerekir. * Eğer materyaliniz kurum dışına çıkacaksa, bunun bazı riskleri olabilir.

21 Dışarıdan dijitalleştirme hizmeti kullanıldığında dikkat edilmesi gereken 7 önemli kural
Açık/net sözleşmeler hazırlayın Önceki çalışmalarına bakarak bir hizmet sağlayıcı seçin Neyin dijitalleştirileceğini açık şekilde belirtin Dış kaynak kullanımında diğerleri ile iş birliğini düşünün Bütün iş bitmeden önce mutlaka örnekler görün, kalite güvencesi yöntemi geliştirin ve yapılan işi kontrol etmek için zaman ayırın. Metadatayı unutmayın Kısmi dış kaynak kullanamını düşünün Açık/net sözleşmeler hazırlayın Kurumunuzun yüklenici ile açık ve net bir sözleşme yaptığından emin olun. Zaman çerçevesi, maliyetler ve beklentiler açıkça belirtilmiş olmalıdır. Eğer dijitalleştirme işi daha önce iş yapıp memnun kaldığınız ve iyi ilişkiler geliştiğiniz bir kurumlarla yapılacaksa, sadece bir 'centilmenlik anlaşmasına' güvenmeyin.  Önceki çalışmalarına bakarak bir hizmet sağlayıcı seçin Bir yüklenici seçerken, yaptıkları işlerden örnekler ve önceki müşterilerinin listesini isteyin. Önceki müşterilerinden birkaçıyla görüşün ve deneyimlerini öğrenin. En ucuzun en iyi olmak zorunda olmadığını unutmayın; karar verirken sadece fiyat ve zaman faktörünü temel almayın.  Neyin dijitalleştirileceğini açık şekilde belirtin Eğer materyalin türü ve aralığı başlangıçta tartışılmamışsa, final maliyet tahmin edilenden çok daha fazla olabilir. Örneğin, benzer boyutlardaki fotoğraf koleksiyonunun taranması kolayca yapılabilir ama büyük boyutlu veya kaplanmış fotoğrafların dijital olarak fotoğraflanması kolay olmayabilir. Dış kaynak kullanımında diğerleri ile iş birliğini düşünün  Genellikle dış kaynağa ne kadar çok iş verirseniz oran o kadar ucuzlar. Bazı şartlarda, gönderilecek materyalin sayısını artırmak için başka kurumlarla birlikte çalışmak karlı olabilir. Ancak bunun dikkatle yönetilmesi gerekir ve bütün katılımcıların dijitalleştirme için ortak stantartlar üzerinde anlaşması gerekir.  Kalite güvencesi Bütün iş bitmeden önce mutlaka örnekler görün, kalite güvencesi yöntemi geliştirin ve yapılan işi kontrol etmek için zaman ayırın.  Metadata'yı unutmayın Metadata üzerinde biraz düşünmeniz gerekir, özellikle teknik olarak metadata. Yükleniciye bunu da kaydettirecek misiniz? Eğer metadata dijitalleştirme sırasında yapılmayacaksa, daha sonra üretmek zor olabilir. Diğer tür metadata işini de (örneğin metin transkripsiyonu) dış kaynak kullanımıyla yaptırmayı düşünebilirsiniz. Kısmi dış kaynak kullanamını düşünün Ya hep ya hiç durumu söz konusu değildir. Sadece dijital yakalama işi veya metadata girişi için dış kaynak kullanabilirsiniz. Bu genellikle az miktarda hassas materyaller olduğunda genel olarak yapılmaktadır.

22 Nesnenin metadatasını hazırlama
Metadata; genel anlamda veri hakkında veri demektir ve hem dijital hem de dijital olmayan kaynaklara uygulanabilir. Pek çok farklı metadata türü vardır. Bunların her biri farklı bir amaca hizmet etmektedir. Ancak hepsinin ortak özelliği; iyi tanımlanmış yapısıdır.

23 Nesnenin metadatasını hazırlama
Metadata çok çeşitli uygulamaları desteklemek için kullanılabilir: kaynak keşfi kaynak yönetimi uzun dönemli koruma Bir dijitalleştirme projesi sırasında, kaynakların çeşitli sınıflarını tanımlayan metadata sağlamak gerekebilir: dijitalleştirilecek fiziksel nesneler dijitalleştirme sürecinde oluşturulmuş dijital nesneler dijitalleştirme sonucu orijinalden türetilmiş bütün nesneler yukarıdakilerden herhangi birinin koleksiyonları

24 Metadata şu şekilde alanlara ayrılabilir:
Kullanıldıkları yerlere göre: müzeler arşivler kütüphaneler (...) *

25 Metadata şu şekilde alanlara ayrılabilir: (...)
Metadata tarafından desteklenmesi beklenen işlevlere göre: tanımlayıcı metadata dijital nesnenin keşfi ve yorumlanması için kullanılır. İdari (yönetimsel) metadata dijital nesneyi yönetmek, oluşturulmasıyla ilgili daha fazla bilgi vermek ve kullanımı ile ilgili kısıtlamaları belirtmek için kullanılır. korumaya yönelik metadata uzun süreli korumayı desteklemek içindir. yapısal metadata birleşik bir nesnenin parçaları arasındaki mantıksal veya fiziksel ilişkiyi tanımlar. koleksiyon düzeyinde tanımlama koleksiyonlar, etrafında farklı türde dijital hizmetler yapılandırılabilecek elemanlar bütünü olarak görülür. Tanımlanmaları gerekir, böylece kullanıcı, koleksiyonun önemli özelliklerini keşfedebilir. Bunlar kapsam, format, sahiplik bilgisi ve erişim kısıtlamalarını içerir. Tanımlama, ayrıca koleksiyonları dijital hizmetlerle bütünleştimeye izin verir * Metadata standartları, o standardın desteklediği işlevlere göre sınıflandırılabilir  [kaynak]: tanımlayıcı metadata dijital nesnenin keşfi ve yorumlanması için kullanılır örnekler: Dublin Core Metadata Element Set, DCMES Metadata Object Description Schema, MODS Categories for the Description of Works of Arts, CDWA Visual Resources Association Core, VRE SEPIA Data Element Set, SEPIADES Public Broadcasting Metadata Dictionary, PB Core MPEG-7 yönetimsel metadata dijital nesneyi yönetme ve oluşturulması hakkında daha fazla bilgi vermek ve varsa kullanımına ilişkin kısıtlamaları bildirmek için kullanılır. Bazen şu bölümlere ayrılır: koruyucu metadata uzun-dönemli korumayı destekleme amaçlı PREMIS veri sözlüğü kaynak metadata dijital kaynağın üretildiği nesneyi tanımlama dijital köken metadata oluşturulmasından bu yana dijital nesneye yapılan işlemlerin tarihini tanımlar haklar metadata telif hakları, kullanım kısıtlamaları ve kaynak kullanımı ile ilgili şartları veren lisans anlaşmalarını tanımlama yapısal metadata birleşik bir nesnenin bölümleri arasındaki mantıksal veya fiziksel ilişkileri tanımlar Metadata Encoding and Transmission Schema, METS

26 Kontrollü sözlük nedir?
Bir metadata tanımı oluştururken kullanılabilecek kelime veya terimlerin listesidir. en önemli yararlarından biri; o giriş veya konunun daima aynı şeyi göstermesidir. kelime listeleri, kavramlar dizini (thesauri), konu başlıkları (SHs), otorite (authority) listeleri ve sınıflama şemaları Kelime listeleri önceden tanımlanmış kelimelerin listesidir, bu kelimelerin bütün liste kapsamında iyi tanımlanmış ve açık olması gerekir. Kelime listeleri kavramlar hiyerarşisine sahip değildir (kavramın başka kavramla ilgisini göstermez). Kelime listeleri, bir metadata kaydında kullanılması gereken kelimenin formunu belirlemede ve o alan için olası değerlerin sayısını sınırlamak için yararlıdır, örneğin Gazeteler (Newspapers) yerine Gazete (Newspaper) kullanmak. Kavramlar dizini (Thesaurus) bir hiyerarşik yapıda öğeleri (kelimeler veya terimler) sıralar, genel ve daha belirgin terimlere erişirsiniz, örneğin; ev (dar terim) bir tür bina (geniş terim). Genellikle ilgili terimler, eş anlamlılar ve tercih edilen terimler hakkında da bilgi bulursunuz. Konu başlıkları da ilgili terimlerin hiyerarşik sırasını sunar, kavramlar dizinine çok benzer görünebilir ama farklı çalışır. Kavramlar dizini bir kelime veya terimi seçmeye izin verir, konu başlıkları ise daha ayrıntılı bir kavram ifade etmek üzere birleştirilebilirler. Library of Congress Subject Headings (LCSH) en yaygın kullanılan konu başlıklarıdır; konu başlığı içerir. Sınıflama kontrollü sözlüğün bir diğer şeklidir, daha çok kaynakları organize etmek için oluşturulmuştur. Geleneksel bir kütüphanede nesneler, kitap raflarında onları daha kolay bulabilmek için sınıflanmıştır. Kütüphanedeki her bir materyal birden fazla konu başlıkları kullanılarak tanımlanmıştır ama sadece bir kategori verilmistir. Dijital çağın başlamasıyla birlikte sınıflama ile konu başlığı arasındaki fark daha bulanık hale gelmiştir. “Sınıflama genellikle hiyerarşiktir: geniş konu alanları ile başlar ve daha sonra giderek daha dar konulara bölünür. Bu şekliyle kavramlar dizinine benzer ama sınıflamalar kendi yapıları içinde çok daha katıdır. Bir kavramlar teriminin birden fazla geniş terime sahip olması mümkünken, sınıflama şeması kendi konu alanı içinde sadece bir şekilde alt bölümlere ayrılır. Bu nedenle sınıflamalar tek bir ‘dünya görüşü’ sunar, bu yapı kullanıcıyı hiç memnun etmeyecektir ve kavram terimlerinin aksine sınıflama şemaları kullandıkları sayı ve kodlarla yapılarını ortaya koyarlar.

27 Kontrollü sözlükler genellikle şu bilgileri doldurmak için kullanılır:
dijital kaynağın konusu; örneğin ikinci dünya savaşı kaynağın türü; örneğin gazete kaynağın dili, örneğin ger (Almanca) yaratıcı, şehir, yer, etkinliklerin isimleri içeriğin kullanıcı hakları; örneğin Creative Commons att-nc-sa

28 Kontrollü sözlük nasıl seçilir?
Sözlükleri değerlendirirken bir kaç noktayı hatırlamanız gerekir: kullanıcılarınızı belirlemeye çalışın – verilen sözlükten bir kaç kelime alın ve kullanıcılarınız için anlamlı olup olmayacağını düşünün. sizinkine benzeyen koleksiyonlar tarafından kullanılan sözlükleri belirleyin. sözlük standartları hakkında bilgi veren rehberler vardır, bunlardan birine bakabilirsiniz. seçtiğiniz sözlük herkes için ücretsiz mi? Bazı kontrollü sözlükler ancak lisans ücreti ödendikten sonra kullanılabilir.

29 Folksonomi nedir? Bu sözcük Thomas Vander Wal tarafından türetilmiştir, iki kelimenin birleşiminden oluşur: folk ve taxonomy (arkadaş ve sınıflandırma). Folksonomi ayrıca ortak etiketleme veya sosyal indeksleme olarak da bilinir. Sosyal indeksleme kullanıcıların kaynağı nasıl algıladıklarını belirtmelerine izin verir. Mevcut bütün ilgili gruplara özel metadata hazırlamak olanaksız olduğundan yararlı bir seçenek olabilir.

30 Karşılıklı çalışabilirlik nedir?
JISC Digital Media’ya göre; “koleksiyonunuzun diğer koleksiyonlarla birlikte çalışma yeteneğidir; ya ortak kaynak keşif hizmetleri üzerinden ya da kendi metadatanızı diğer koleksiyonlara sağlayarak”. Metadata standartları, iki farklı web sitesinin/koleksiyonun birlikte çalışmasına izin veren bir çeşit ortak dildir. İki koleksiyon arasındaki bütünleşmeyi en üst düzeyde temin etmek için her iki hizmetin aynı metadata şemasını, aynı kontrollü sözlükleri, tarih ve isimler gibi şeyler için aynı kodlama kurallarını kullanması gerekir *

31 Metadata nerede saklanır?
Ayrı bir metin dosyasında Dijital nesnenin içinde Bir veritabanında Metadata, dijital nesnenin içine konulabilir ama ayrıca da depolanabilir. Bazen dosya formatı sınırlamaları nedeniyle metadatayı bir dosyanın içinde depolamak olanaksızdır. Metadatayı tanımlanan veri ile birlikte depolamak bir kaç avantaj sağlar (dijital nesnenin kendi içindedir ve başka ek kaynaklar gerektirmez) ama riskli de olabilir. Bir görüntü dosyasında depolanan metadata çok kolayca silinebilir, bu kazara olabilir veya grafik ileri işleme için kullanılan yazılımın kapasitesinin yetersiz olmasından olabilir (grafik editörlerin hepsi metadata desteklemezler). Genellikle metadata bu iş için adanmış bir veritabanında depolanır – bir metadata arşivinde veya ayrı bir metin veya XML dosyasında depolanır ve dijital nesneyle birlikte dağıtılır. Bütün önemli dijital kütüphane sistemleri bu tür bir metadata için kayıt defteri (registry) sağlar, bunlardan bazıları kullanıcı bir dosyayı indirdiğinde metadatayı otomatik olarak dijital dosyanın içine koyma yeteneğine sahiptir.

32 İyi metadata şunları sağlar:
Nesneler gelecekte de yaşayacak ve erişilebilir olacaktır. Metadata, özellikle nesne içinde depolanan bilgiye uygun içerik vermelidir,  Kullanıcılar dijital kütüphanede bir kaynağı bulabilecektir, Dijital koleksiyonu yönetmek daha kolay olacaktır, Dijital koleksiyon diğer benzer koleksiyonlarla birlikte kullanılabilir.

33 İyi metadata oluşturmaya yarayacak bazı ilkeler
NISO tarafından yayımlanan “İyi dijital koleksiyonlar oluşturmak için bir rehberlik sistemi” [kaynak] adlı kaynağa göre iyi metadata; koleksiyondaki materyaller, koleksiyonun kullanıcıları ve koleksiyonun şimdiki ve gelecekteki kullanımları açısından uygun standartlarla uyumludur. karşılıklı çalışabilirliği destekler. nesneleri tanımlamak ve ilgili nesneleri biraraya getirmek için otorite kontrolü ve içerik standartları kullanır. dijital nesnenin kullanım şartları hakkında açık ifadeler içerir. koleksiyonlardaki nesnelerin uzun süreli iyileştirilmesi ve korunmasını destekler. kayıtlarının kendileri de nesnelerdir, o nedenle iyi nesne özellikleri içermelidir; otorite, güvenilirlik, arşivlenebilirlik, devamlılık ve eşsiz tanımlama gibi *

34 En önemli metadata standartları
Dublin Core Metadata Element Set (DCMES) DCMES [kaynak] 1995’de Dublin, Ohio’da yapılan bir çalışma sonucu ortaya çıkmıştır. "Dublin Core’un orijinal hedefi; yazarların kendi web kaynaklarını tanımlamak için kullanabilecekleri bir dizi öğeler tanımlamaktı. Orijinalde 13 öğe vardı, daha sonra günümüzdeki 15 öğeye genişletildi; bunlar: Başlık (Title), Yaratıcı/yazar (Creator), Konu (Subject), Tanımlama (Description), Yayıncı (Publisher), Katkıda bulunan (Contributor), Tarih (Date), Tür (Type), Format (Format), Tanımlayıcı (Identifier), Kaynak (Source), Dil (Language), İlişki (Relation), Kapsam (Coverage) ve Haklar (Rights). DC Terimleri 55 öğe içerir (DCMES öğeleri de dahil). Bütün öğeler tekrarlanabilir. 2003’ten beri DCMES bir ISO standartıdır * Dublin Core metadata şemasının arkasındaki temel kurallardan biri bire-bir kuralıdır, bu kural verilen o metadata kaydının sadece bir nesne hakkında bilgi içermesi gerektiğidir. Çeşitli konu alanlarında Dublin Core'un yoğun olarak uygulanması nedeniyle bu kural bazı pratik nedenlerden dolayı göz ardı edilir (bilginin duplikasyonundan kaçınmak için) “Öğe ayarları bir öğenin anlamını daha dar veya daha belirgin yapar. Ayarlanmış bir öğe, yetersiz bir öğenin anlamını paylaşır ama daha sınırlı bir kapsamla. Dublin Core öğelerinin nitelikleri için rehber ilke Dumb-Down Principle olarak bilinir, [kaynak] belirli bir öğe ayar terimini anlamayan bir uygulama, niteleyiciyi göz ardı etmeli ve metadata değeri niteliksiz (daha geniş) öğe imiş gibi davranmalıdır. Bu bazı belirginliklerin kaybolmasıyla sonuçlanabilirken, kalan öğe değeri (niteleyici olmadan) kaynak keşfi için doğru ve yararlı olarak devam etmelidir.”  [kaynak] DC Terimleri: Orijinal DCMES öğeleri koyu renkli verilmiştir. Title (Başlık) Creator (Yaratıcı) Alternative Description (Tanım) Subject (Konu) TableOfContent (İçindekiler) Abstract (Öz) Date (Tarih) Contributor (Katkıda bulunan) Publisher (Yayıncı) DateAccepted (KabulEdildiğiTarih) Created (Oluşturulduğu) Available (Mevcut) Issued (Basım) DateSubmitted (SunulduğuTarih) DateCopyRighted (TelifHakkıTarihi) Valid (Geçerli) Modified (Düzeltme) Format (Biçim) Type (Tür) Identifier (Tanımlayıcı) Medium (Materyal) Extent (Boyut/uzunluk) Source (Kaynak) BibliographicCitation (BibliyografikAtıf) Language (Dil) Relation (İlgi)    HasPart HasFormat ConformsTo IsFormatOf HasVersion IsReplacedBy IsReferencedBy IsPartOf IsVersionOf IsRequiredBy Requires Replaces References Coverage (Kapsam) Spatial Righets (Haklar) RightsHolder (HaklarSahibi) Temporal License (Lisans) AccessRights (ErişimHakları) AccuralPolicy AccuralPeriodicity AccuralMethod Audience Provenance Mediator EducationLevel InstructionalMethod DC Terimleri bazı kontrollü sözlüklerin kullanımını önerir : Library of Congress Classification (LCC), Internet Assigned Numbers Authority (ITM) tarafından oluşturulan medya türleri seti, Dewey Decimal Classification (DDC), Medical Subject Headings (MeSH), Library of Congress Subject Headings (LCSH), Universal Decimal Classification (UDC). Getty Thesaurus of Geographic Names (TGN), National Library of Medicine Classification (NLM), ve söz dizimi (syntax) kodlama şemaları (sadece en önemlileri); DCMI Point - DCMI Point Encoding Scheme'sına göre coğrafik koordinatlarına göre tanımlanmış yer noktaları seti. DCMI Period – DCMI Period Encoding Schema'sına göre  tanımlanmış zaman aralığı seti ISO , ISO ve ISO , isim, ülke ve dil kodları içerir URI – Uniform Resource Identifiers belirtmek icin sözdizimi RFC1766, RFC3066 ve RFC4646 – dil belirten etiketler seti W3CDTF – Tarih ve Zaman formatı özellikleri.

35 En önemli metadata standartları (devam)
Categories for the Description of Works of Arts (CDWA) CDWA [kaynak] müze sergileri gibi kültürel nesneleri tanımlama aracı olarak oluşturulmuştur. 1990’larda “Art Information Task Force” tarafından başlatılmıştır. 512 kategoriden oluşur; kullanılması gereken en az 35 temel etiket belirtir. 2005’te, CDWA kullanılarak oluşturulan metadata kayıtlarının XML serileştirilmesine izin veren CDWA Lite geliştirilmiştir. Bütün öğeler tekrarlanabilir. CDWA’nın ana bölümleri şunları içerir: Object work type, Title, Display creator, Indexing creator, Display measurement, Indexing measurement, Display material/technique, Indexing material/technique, Display State/Edition, Style, Culture, Display Creation Date, Indexing Dates, Location/Repository, Subject, Classifications, Description, Inscriptions, Related works, Rights to work, Record, Resource.

36 En önemli metadata standartları (devam)
Metadata Object Description Schema (MODS); Doğrudan MARC 21’den türetilmiştir ve MARC tanımlarını sadeleştirmek için geliştirilmiştir. MODS, XML’e dahil edilir; o nedenle MODS ile uyumlu bütün metatadata kayıtları aynı zamanda XML ile de uyumludur. MODS özellikle dijital kaynakların zengin tanımını yapmayla ilgilenir.

37 En önemli metadata standartları (devam)
Lightweight Information Describing Objects (LIDO) LIDO mevcut müze şemaları üzerine oluşturulmuştur, özellikle bir ISO standardı olan CIDOC CRM ile. LIDO ayrıca CDWA Lite ve museumdat standartları ile uyumludur. LIDO bir harmanlama şemasıdır ve koleksiyon yönetimi için kullanılmamalıdır. Daha çok kurumların online koleksiyonlarının veritabanı ve portalları için zengin metadata sunmak üzere oluşturulmuştur. LIDO kaydı 7 alana ayrılır: Nesne tanımlama – nesne hakkında temel bilgi Nesne sınıflama – nesnenin türü hakkında bilgi İlişki – nesnenin şunlarla ilişkisi: konu ve diğer nesneler Olay – nesnenin yer aldığı olaylar: Oluşturma, satın alma, sergi, vb. Haklar – hizmet ortamına harmanlanan nesne, metadata ve dijital vekil ile ilgili haklar konusunda bilgi. Kayıt – kayıt hakkında temel bilgi Kaynak – hizmet ortamına (örneğin Europeana) sağlanan dijital kaynak hakkında temel bilgi.

38 En önemli metadata standartları (devam)
General International Standard Archival Description (ISAD ) ve Encoded Archival Description (EAD) ISAD [kaynak] arşiv materyalinin biçim veya amacına aldırmadan uygulanabilecek arşive ait tanımlama için genel kurallar belirtir. 26 öğeden oluşur, bir arşiv girişi için eksiksiz tanımlama oluşturmak üzere kullanılabilir. EAD [kaynak] standartlaştırılmış XML şemasıdır, arşiv erişim araçlarından veriyi artırmak için geliştirilmiştir. Erişim araçları genel metadata kaydından biraz farklıdır; daha uzundur, daha açıklayıcı ama oldukça yapısaldır.

39 En önemli metadata standartları (devam)
Metadata encoding and transmission standard (METS) METS, tanımlayıcı bir metadata standartı değildir; daha çok karmaşık dijital kütüphane nesneleri için standart bir veri yapısı sağlamak üzere tasarlanmıştır. XML tabanlı bir şemadır, şunlar hakkında bilgiler içeren bir doküman oluşturmaya izin verir: nesne yapısı, örneğin uygun sırada bir kitaptaki sayfaların listesi birleşik tanımlayıcı (örneğin bir DCMES veya MODS metadata kaydı) ve yönetimsel (örneğin dijitalleştirme süreci hakkında bilgi) metadata  nesnenin içeriğini veren dosyalara linkler; ayrıca içeriği bir METS kaydının içine koymak mümkündür.

40 Metadata nasıl oluşturulur?
Gerekenleri belirleme Koleksiyonunuzun amacı nedir? Koleksiyonu kimler kullanacak? Ne kadar büyük olacak? Metadata hazırlamak için ne kadar zamanınız var? Alandaki en iyi uygulamayı araştırın Diğer kurumlar tarafından oluşturulmuş benzer dijital koleksiyonları araştırın. Sorular sorun: Bu neden bu şekilde yapıldı? Neden bu değil de diğer standart kullanıldı?, gibi.

41 Metadata nasıl oluşturulur? (devam)
Bir metadata şeması ve ek kaynaklar (örneğin kontrollü sözlük) seçin/oluşturun İhtiyaçlara/gereken şeylere bir bakın, diğerlerinin getirdiği çözümlere bakın, olası metadata standartlarını ve kontrollü sözlük veya konu başlığı gibi ek kaynakları araştırın. Uygulama profili veya mevcut metadata standardı için uzantı oluşturmayı düşünebilirsiniz. Seçilen metadata araçlarının nasıl kullanılacağını öğrenin Muhtemelen kullanırken öğreneceksiniz ama olanak varken seçeceğiniz şema konusunda deneyimi olan diğer uzmanların bilgisine başvurmak önemlidir. Seçilen şemayla başkası çalışacaksa, nasıl kullanılması gerektiğini anlatın, birlikte dahili metadata oluşturma rehberleri hazırlayabilirsiniz.                                                                   Metadata oluşturun veya transfer edin (import).

42 Metadata nasıl oluşturulur? (devam)
Metadata oluşturma Bir kaynağı tanımlama için ne kadar zaman harcayabileceğinize karar verin. Çalışmanızın konusu olacak nesneyi inceleyin, bilgi kaynaklarını belirleyin, gerekli bilgiyi toplayın. Verilen nesnenin tanımını hazırlayın. Tanımı metadata kayıt defteri/dosyalar/dijital kütüphane içinde depolayın. Metadata transfer etme  Eğer verilen nesnenin tanımı başkası tarafından hazırlanmışsa onu kullanmaya çalışın. Metadatayı mevcut kütüphane kataloğundan veya diğer başka kaynaktan transfer edebilirsiniz. Transfer ettiğiniz tanımın sizin beklentilerinizle ve seçtiğiniz metadata şeması ile tam olarak uyumlu olup olmadığını kontrol etmeyi unutmayın.

43 Metadata nasıl oluşturulur? (devam)
Metadata kalitesini değerlendirin Eğer transfer edilen tanım fiziksel nesneye ait ise, yanlış kavramlardan kaçınmak için tanımı gözden geçirin. Doğruluk kriterleri belirleyin, eğer mümkünse harici bir doğrulayıcı (validator) ile metadatayı doğrulayın. Zaman içinde metadatayı uyarlayın  Koleksiyonunuzun kullanıcılarının kimler olacağı ortaya çıktığında, kaynakların kullanımını artırmak için metadatanızı uygun şekilde uyarlamak gerekebilir. Europeana gibi daha geniş kapsamlı girişimlere katılmak için de metadatayı uyarlamak gerekebilir *

44 Hangi metadata şeması bizim için daha uygundur?
Marie R. Kennedy tarafından formüle edilen sorular: Koleksiyonu kimler kullanacak? Koleksiyon katalogcusu kim? Ne kadar zamanınız/paranız var? Koleksiyonunuza nasıl erişim sağlanacak? Koleksiyonunuzun diğer koleksiyonlarla ilgisi nasıldır? Koleksiyonunuzun kapsamı nedir? Metadatanız harmanlanacak mı? * Bu aşamayı anlatırken Marie R Kennedy tarafından formüle edilen 9 soruya baş vuracağız. Bahsedilen 9 soru ihtiyaçları belirlemeye yardımcı olur, bu sayede koleksiyon geliştiriciler yeni oluşturulacak koleksiyon açısından en kullanışlı metadata araç ve standartlarının hangisi olduğuna daha bilinçli karar verebilir. Bu aşamada soruların hepsi ilgili değildir, ilgisiz olanlar göz ardı edilecektir, 9 sorunun tam listesini incelemek için; [kaynak]. Koleksiyonu kimler kullanacak? Sıradan bir İnternet kullanıcısı mı yoksa uzman bir tarihçi mi? Bu birkaç şeyi belirler: tanımlamada kullanılacak dil, kontrollü sözlükler kullanmak yararlı ise tanımlayıcı metadata ne kadar ayrıntılı olmalıdır? Bazen koleksiyonun kullanıcısının kim olacağını belirlemek zordur, böyle bir durumda mümkün olduğunca çok giriş noktası (entry points) sağlamanız gerekir, örneğin caddelerin güncel adı yanında eski adlarını da kullanmak gibi. Koleksiyon katalogcusu kimdir? Katalogcunun konu bilgisi var mı, yok mu? Karmaşık metadata şemasını doldurabilecek mi? Bir metadata kaydı bölümlenebilir ve bir kerede bir kaç kişi tarafından geliştirilebilir. Bu kişilerden bazıları konu bilgisine sahip olabilir, diğerleri metadata şemasını ayrıntılı olarak bilebilir ve verilen metadatayı uygun şekilde doldurmaya yardımcı olabilir. Ne kadar zamanınız/paranız var? Nesnenin tanımı ne kadar zengin olursa kullanıcıların koleksiyonu kullanma şansı o kadar yüksek olacaktır. Zengin metadata hazırlamak için şunlara sahip olmak gerekir: doğru metadata şeması, bu şemayı kullanabilecek katalogcular ve muhtemelen konu uzmanlığı yararlı olacaktır. Bütün bunlara sahip olmak oldukça pahalı bir yükümlülük gibi gelebilir. Soru, bütün bunları yapmaya zamanınız var mı? Koleksiyonunuza nasıl erişim sağlanacak? Burada en önemli konu, dijital kaynaklarınıza erişim vermek için kullanılacak  dijital kütüphane sisteminin kapasitesidir. Karmaşık metadata şemalarını destekler mi? Hangi arama kapasitelerine sahip? Eğer kullanıcılar tanımlamanızın bütün zenginliğini kullanamayacaksa, o zaman böyle zengin bir metadata hazırlamaya değer mi sorusu ortaya çıkar. Koleksiyonunuzun diğer koleksiyonlarla ilgisi nasıldır? Bu soru daha çok karşılıklı çalışabilirlik konuları açısından önemlidir. Eğer benzer bir koleksiyon belirlediyseniz, büyük olasılıkla o koleksiyondan bir kaynağa referans vermek isteyebilirsiniz. Nesnenin tanımında ilgili kaynakları gösterdiğinizde, kullanıcılar ek bilgi sahibi olma şansı elde edecektir. Büyük ihtimalle, harmanlama (harvesting - aşağıdaki maddeye bakın) sayesinde her iki koleksiyon da aynı tarama ara yüzü ile taranacaktır. Böyle bir durumda bazı terimler ve tarihler gibi genel kodlar konusunda ortak anlayış geliştirmek önemlidir. Eğer kütüphanenizin bir OPAC sistemi varsa, bir fiziksel nesnenin OPAC kaydı ile dijital kütüphanedeki dijital yeniden-üretimi arasında bağlantı vermek genel bir uygulamadır. Koleksiyonunuzun kapsamı nedir? Kapsamı belirleyerek bazı ilgisiz metadata standartlarını çıkarabilirsiniz. Sizin kaynak türlerinize uygun metadata standartı mevcut mu? Sizin hedeflerinize uyan kontrollü sözlükler var mı? Eğer benzer kapsamlı koleksiyon mevcutsa, o koleksiyonları geliştirenler tarafından uygulanan çözümlere bakmak yararlı olabilir. Benzer metadata araçlarını (şema, kontrollü sözlükler) seçmek size zaman ve para tasarrufu sağlayabilir. Fakat her dijitalleştirme projesi farklı olduğundan, onların yaptığı hatalardan kaçınmak için bulgularını kendi başınıza değerlendirmeniz gerekir. Metadatanız harmanlanacak mı? Harmanlama (harvesting), bu işe özel bilgisayar programı tarafından web kaynaklarının toplanması işidir. Bu tür bir bilgisayar programı (bazen web – örümceği ( web-spider) olarak anılır) genellikle web tarayıcılar tarafından kendi indekslerini oluşturmak için gerekli olan bilgiyi toplamak için kullanılır. Dijital kütüphaneler alanında özel harmanlama protokolleri geliştirilmiştir  – Metadata Harmanlama için Açık Arşiv Protokolü - Open Archive Protocol for Metadata Harvesting (OAI-PMH) en yaygın olarak kullanılanıdır. Eğer koleksiyonunuz harmanlanacaksa, ki şu anda geliştirilen koleksiyonların çoğu harmanlanır, bu protokolün neler gerektirdiğinden haberdar olmanız gerekir. OAI-PMH genelde bütün XML-tabanlı metadata şemaları ile uyumludur ama temel bir ihtiyacı vardır: koleksiyonun metadatası en azından DCMES yapısında olmak zorundadır. Koleksiyonunuz herhangi bir XML-tabanlı metadata standardı kullanılarak tanımlanabilir ama OAI-PMH uyumlu arşiv olması için metadatayı Dublin Core’da göstermek zorunludur.

45 Kurum içi metadata rehberleri hazırlamak gerekli midir?
Kendi metadata rehberlerinizi geliştirmeniz gerekir çünkü; Neden o standartı seçtiğinizi açıkça belirtmenize izin verecektir. Bu sayede kendi deneyimlerinizi başka uzmanlarla paylaşabileceksiniz. Böyle bir dokümanın halka açık olması, koleksiyonu gözden geçiren ve tarayan kullanıcılarınız için de yararlı olabilir. Bir süre sonra muhtemelen neden bir çözümü diğerine tercih ettiğinizi unutursunuz.  Kurumiçi metadata rehberleri, güncel ve gelecekteki koleksiyonlarınızın daha iyi gelişmesi için büyük bir kaynak olacaktır. Kurum içi metadata rehberleri hazırlamam gerçekten gerekli mi? Küçük bir halk kütüphanesinde çalışıyor ve dijitalleştirmeden sorumlu tek kişi ben olsam bile? Yanıt yine de evet olur, kendi metadata rehberlerinizi geliştirmeniz gerekir çünkü: 1. Neden o standardı seçtiğinizi açıkça belirtmenize izin verecektir, Kendi uygulama profilinizi geliştirdiyseniz, yaklaşımınızı açıklamanız ve belgelemeniz gerekir. Hangi alanlar zorunludur (eğer varsa), Hangi öğeler şemaya eklendi ve ne amaçla eklendi. Tanımlamanın her bir öğesi için hangi sözlükler seçildi. Tarih, zaman aralığı, uygun adlar, yerler ve benzeri için hangi kodlama kuralları uygulandı. Oluşturulan metadatanın kalitesini değerlendirmek için kullanılan kriter 2. Bu sayede kendi deneyimlerinizi başka uzmanlarla paylaşabileceksiniz Başkaları sizin çalışmanızı devam ettirebilecek. 3. Böyle bir dokümanın halka açık olması, koleksiyonu gözden geçiren ve tarayan kullanıcılarınız için de yararlı olabilir. 4. Bir süre sonra muhtemelen neden bir çözümü diğerine tercih ettiğinizi unutursunuz.  Kurum için metadata rehberleri, güncel ve gelecekteki koleksiyonlarınızın daha iyi gelişmesi için büyük bir kaynak olacaktır. İnternet üzerinde de yararlı pek çok kaynak mevcuttur. Bazıları diğerlerine göre daha eksiksizdir, en ilginç olanlarından bazılarını aşağıda verebiliriz: Europeana teknik dokümanları [kaynak] Bir uygulama profili tanımına örnek: "Europeana Semantic Elements Specification" ver 3.2.2 Mevcut şemalardan yeni birine metadata eşlemesi hakkında rehberlere örnek: “Metadata Mapping & Normalisation Guidelines for the Europeana Prototype” OAI-PMH ile  Dublin Core Metadata Element Set kullanım kurallarını belirten rehberlere örnek: “Driver Guidelines for Content Providers” [kaynak] Kurum içi metadata rehberi şunları içermelidir: 1. kullanılan metadata öğelerinin listesi, 2. oluşturulan koleksiyon bağlamından her bir öğenin kesin tanımı, 3. farklı türlerdeki nesneler için tam metadata kayıtları örnekleri, Her bir öğe için şunları belirtmelisiniz: * Adı ve genel tanımı * Uygun DC Terimine referans (eğer bir öğe DC Teriminin kendisi değilse) * Zorunlu, önerilen veya isteğe bağlı mı olduğu * Mümkünse bu öğeyi kullanan dijital kütüphane fonksiyonları/hizmetlerinin listesi * Mümkünse bu öğenin göründüğü dijital kütüphane arayüzündeki yerler * Rehberler  (Notlar) * Örnekler

46 Tarama ekipmanı Tarama (scanning); dijitalleştirme iş akışının temel bölümüdür. Tarama ekipmanı, görüntü yakalama aletleri anlamında kullanılmaktadır: her tür tarayıcı ile dijital kameraları kapsar.

47 Tarama ekipman türleri
Düz yataklı (flatbed) tarayıcılar Düz yataklılar Otomatik doküman tutucular Üstten kitap tarayıcılar

48 Düz yataklı

49 Otomatik doküman tutucu

50 Üstten kitap tarayıcı

51 Tarama ekipman türleri (devam)
Kağıt beslemeli (sheetfeed) tarayıcılar Düz yataklı tarayıcılarla aynı teknolojiyi kullanır fakat işin çıktısını en üst düzeye çıkartır ve genellikle kaliteden ödün verir. İş miktarı çok olan işletme ortamları için düzenlenmiştir, oldukça düşük çözünürlükte siyah-beyaz veya gri tonlamalı tarama yapar.

52 Kağıt beslemeli tarayıcı

53 Tarama ekipman türleri (devam)
Tambur (drum) tarayıcılar En yüksek çözünürlük, en yüksek kalitede tarama yapan tarayıcı türüdür fakat oldukça pahalıdır ve yavaş çalışır. Ayrıca hassas dokümanlar için uygun değildir ve yüksek işletim becerisi gerektirir.

54 Tambur tarayıcı

55 Tarama ekipman türleri (devam)
Mikrofilm tarayıcıları Rulo film, fiş ve apartür kartlar (mikrofilm kartı) için uzmanlaşmış bir alettir. Bir mikrofilm tarayıcıdan iyi ve tutarlı kalite elde etmek zor olabilir çünkü işletim açışından karmaşıktır. Ayrıca çok az iyileştirme kapasitesi sunar.

56 Mikrofilm tarayıcı

57 Tarama ekipman türleri (devam)
Slayt tarayıcıları Mevcut slayt kütüphaneleri ve 3 boyutlu nesnelerin fotoğrafları ile doğrudan taramaya elverişli olmayan dokümanların dijitalleştirilmesi için kullanılır.

58 Slayt tarayıcı

59 Tarama ekipman türleri (devam)
Dijital kameralar Dijital kameralar, kamera gözleri ile bir tarayıcıyı birleştirip en üst kalitede görseller üretebilen çok amaçlı araçlardır. Düz yataklı tarayıcılara göre yavaş ve kullanımı zor olmasına rağmen dijital kameralar çok çeşitli doküman ve nesnelere uyarlanabilir; en hassas materyaller bile emniyetli bir şekilde kaydedilebilir. Ancak dış ışıklandırmaya ihtiyaç duyduğu için, ışığın vereceği zarar endişe yaratabilir.

60 Dijital kamera

61 Uygun tarayıcı nasıl seçilir?
Çeşitli kağıt boyutlarını ( A4, A0), doküman türlerini (tek yaprak, ciltli) ve ortamı (yansıyan, şeffaf) işleyebilecek mi? Çok kötü durumdaki bir nesneyi bile taramak mümkün mü? Bu tarayıcı, hedefimize uygun kalitede görseller üretebilecek mi? Bu tarayıcı üretim için hedeflediğimiz takvime uyabilecek ve ödediğimiz paraya değecek mi? Yeterince hızlı ve kullanımı kolay mı? (...)

62 Uygun tarayıcı nasıl seçilir? (...)
Doküman işleme yetenekleri nelerdir? İş zamanı, arızasız geçen ortalama süresi ve ömür boyu kapasitesi nedir? Ne tür bakım/servis hizmetleri mevcuttur?

63 Grafik olarak ileri işleme
Grafik ileri işleme şu durumlarda kullanılmalıdır: tarayıcı ayarındaki hataları düzeltmek için görüntüyü döndürmek için görüntüleri istenen dosya formatına çevirmek için Grafik ileri işleme Photoshop veya GIMP gibi grafik yazılımlar kullanılarak yapılabilir.

64 Metin yakalama Tarama sonucu elde edilen görüntüden metni yakalamak için genellikle iki yol vardır: bir görüntüden metin yakalanır ve Notepad gibi bir metin editörü kullanılarak yazılır, veya görüntüyü yorumlayıp dijital metni otomatik olarak hazırlayan, bu iş için yapılmış bir yazılım kullanılabilir. Metin içeren görüntüleri (örneğin taranmış bir kitap görüntüsü) yayımlamak yeterli değildir. Dijital metin doküman içinde arama yapmaya ve/veya görme engelli kişilerin metne erişimini sağlamak üzere ekrandaki metni okuyan bilgisayar programlarının kullanımına izin verir.

65 Metin yakalama (devam)
İlk seçenek basit görünmekle birlikte çok pahalı ve yavaştır. Bu iş için tahsis edilmiş optik karakter tanıyıcı (OCR) yazılımları çok daha hızlıdır ve iyi sonuçlar verebilir ancak OCR, farklı puntolar ve yazı stilleri içeren eski basmalar veya dokümanlar üzerinde kullanıldığında sonuçların kalitesi kötüleşmektedir.  %100 doğru dijital metin elde etmek için OCR uygulamalarından elde edilen sonuçlar, dijital kütüphanede yayımlanmadan önce kontrol edilmelidir *

66 OCR yazılım performansı için ne önemlidir?
OCR çıktı kalitesini etkileyen faktörler: doküman türü baskı kalitesi orijinal dokümanın kalitesi tarama çözünürlüğü, renk sayısı kontrast metin dili metin yerleşimi (mizanpaj) metin formatı OCR yazılımı, satın alınmadan önce denenmelidir * OCR çıktı kalitesini etkileyen bir takım faktörler vardır. Doküman türü kalite, OCR’in basılı bir metin üzerinde mi yoksa el yazması üzerinde mi kullanıldığına bağlıdır. Baskının kalitesi daha kaliteli baskı daha kaliteli sonuca izin verir. Orijinal dokümanın kalitesi Eğer orijinal nesne hasarlı veya zor okunur durumda ise OCR’den çok iyi kalite bekleyemezsiniz. Tarama çözünürlüğü, renk sayısı Bazı dokümanlarda renk sayısının azlığı bilginin kaybolmasına neden olabilir, aynı şey çözünürlük için de geçerlidir. Bilgi kaybı da OCR kalitesini düşürecektir. OCR yazılımı, genellikle yüksek kontrasta (karşıtlık) sahip görüntüler ile daha iyi çalışır. OCR yazılımı için, harflerin şeklini ayırt etmek önemlidir, bunu yapmak yüksek kontrasta sahip görüntüler için daha kolaydır. Metin dili Çoğu modern OCR motorlorı heceleme hatalarını düzeltmek için sözlükler kullanırlar. Bazı pek bilinmeyen diller için sözlük (ve genelde dil kaynakları) bulmak zordur, bu durumda OCR çıktı kalitesi düşük olabilir. Metin yerleşimi (mizanpaj) Kitapların metin yerleşimi (tek sütun), gazetelerden (resimli, birden fazla sütun) farklıdır, metin yerleşimi karmaşıklaştıkça OCR motorundan iyi sonuçlar almak zorlaşacaktır. Metin formatı Satır, sütun ve sayfa kenarlarındaki beyaz alan elverişli olduğunda metnin sınırları daha iyi belirlenebilir.

67 Taranmış nesnenin web sunumu versiyonu
Yüksek çözünürlükte tarama yapmak iyi bir seçim gibi görünür ama nesnenin İnternet'te sunumu ne olacak? Yüksek çözünürlüğe sahip bir resim ana bellekte çok fazla yer tutar, mevcut bant aralıklarında indirme süreleri çok uzun olabilir. Kullanıcılar beklemeyi sevmez! Çözüm gayet basit! Ayrı bir düşük çözünürlüklü kopya yani web'de sunum versiyonu hazırlamak * Dijitalleştirmenin amaçlarından biri korumaktır, nesnenin dijital kopyasının daha sonra kullanılmak üzere korunması önemlidir, hatta orijinal nesne artık okunamayacak duruma geldiğinde sadece dijital kopya kullanılacaktır. Dijital kopya oluşturma tarama ile yapılır ve bazen çok zahmetli, zor bir iştir. Bu nedenle amaç mümkün olduğunca orijinal üzerinde daha az tarama yapmaktır. Bunu başarmak için görüntüyü çok yüksek çözünürlükte taramak uygundur, bu sayede orijinal nesnenin bütün detaylarını saklarsınız. Ayrıntıların bu derece fazla olması gerekmeyecekse, tarama işini tekrarlamadan nesneyi düşük çözünürlükte üretmek her zaman mümkündür.

68 Taranmış nesnenin web sunumu versiyonu (devam)
Avustralya Milli Kütüphanesi gibi büyük kurumlar, orijinal dijital nesnenin aşağıdaki farklı görüntülerini gösterirler: Küçük resim kopyası İzleme kopyası İnceleme kopyası Yazdırma kopyası Etkileşimli kopya Küçük resim kopyası büyük görüntüden daha küçüktür, bir grup görsele daha kolay ve hızlı bakmayı sağlamak için tasarlanmıştır. İzleme kopyası ekrana rahatça sığacak ve standart bir A4 kağıdına basılacak şekilde tasarlanmıştır. İnceleme kopyası daha ayrıntılı izleme sunar, sayfanın değişik bölümlerini incelemek için İnternet tarayıcınızın aşağı kaydırma çubuğunu kullanmanız gerekebilir, indirme süresi daha uzun olacaktır. Yazdırma kopyası yazdırma için uygun, yüksek kaliteli versiyon. Etkileşimli kopya kullanıcıların ihtiyaçlarına göre görüntünün boyutunu ve kalitesini ayarlamasına izin verir. *** Her bir kopya değişik bir amaç için oluşturulmuştur, farklı ayrıntı düzeyi sunar fakat bunların hepsi orijinal taranmış görüntüden - ana kopyadan üretilmiştir.

69 Avustralya Milli Kütüphanesi web sunum versiyonu standartları

70 Taranmış nesnenin web sunumu versiyonu (devam)
Hatırlanacaklar listesi Ana kopya - yüksek çözünürlük, uzun indirme süresi orijinal taranmış görüntüdür; bütün diğer versiyonlar, nesnenin kendisini tekrar taramaya gerek olmadan, bu kopyadan yaratılabilir. Web sunumu versiyonları - daha düşük çözünürlük, daha kısa indirme süresi ana kopyadan türetilmiş versiyondur; genellikle özel amaçlara hitap eder; örneğin, arama sonuçlarında küçük resim gösterme gibi. gerekli web sunumu versiyonlarının oluşturulması, otomatik olarak dijital kütüphane yazılımı tarafından yapılabilir *

71 Nesnenin web'de yayımlanması
Resimlerinizi flickr.com'a pdf kopyalarınızı scribd.com'a videolarınızı youtube.com'a Dijital nesneyi web'de yayınlamak için ne gerekir? Sıradan bir web sitesi yeterli midir? Genelde dijital nesnelerinizi İnternet'te yayınlamak için çok şey yapmanıza gerek yoktur. Bir hesap oluşturup yükleyebilirsiniz: * resimlerinizi Flickr.com'a * pdf kopyalarınızı Scribd.com'a * videolarınızı youtube.com'a Bunlar milyonlarca kullanıcı tarafından her gün kullanılan web siteleridir. Bu siteler genel izleyiciye hitap eden araçlardır, dijitalleştirme, koruma ve karmaşık metadata şemaları sunmazlar, örneğin youtube videonuz için Dublin Core ile uyumlu metadata tanımı yapma yolu yoktur. Bir diğer sorun da kullanıcınız kendini biraz kaybolmuş hissedebilir, kurumunuz tarafından yayınlanmış bir fotoğrafı görmek için Flickr'a gitmek, sonra da PDF bir dokümanı okumak için Scribd'e atlamak zorunda kalacaklardır. Bu iş için hazırlanmış bazı dijital kütüphane yazılım paketleri vardır; yukarıda belirtilen sorunları çözmek ve değerli nesnelerin dijitalleştirilmesini desteklemek için geliştirilmişlerdir. Bu tür bir yazılım, çeşitli metadata şemaları üzerine geliştirilmiş ileri arama yetenekleri ve diğer pek çok faydalı özellik sunarlar. Ama özünde, dijital kütüphane yazılımı dijital içeriğinizi kolayca yönetmenizi ve yayımlamanızı sağlayacak dijital kütüphane yazılım alt yapısını oluşturmanıza izin verir.

72 Nesnenin dijital kütüphanede yayımlanması
Başlamadan önce emin olunması gereken konular: dijital kütüphaneye erişim vardır. dijital kütüphane yazılımı, nesneleri tanımlamak için kullandığınız metadata şemasını desteklemektedir. eğer desteklemiyorsa bir şemadan diğerine aktarma yapmak zorundasınız veya başka bir yazılım seçin nesnelerin hazırlanan web sunum kopyalarının dijital formatı, dijital kütüphane yazılımı tarafından desteklenmektedir.

73 Dijital doğmuş materyal
Dijitalleştirilmiş materyalden ayrı olarak, dijital materyal olarak doğmuş dokümanlar da mevcuttur. Bu tür dokümanlar da değerli olabilir; korunmaları ve dijital kütüphanede sunulmaları gerekir. Korumanın bu alanı çoğu zaman dikkate alınmaz oysa sadece eski gazeteleri değil aynı zamanda dijitalleştirme gerektirmeyen, zaten dijital formatta mevcut olan kaynakları da hazırlamanız ve dikkate almanız gerekir.

74 Dijitalleştirme yazılımlarına giriş
Dijitalleştirme yazılımları iki gruba ayrılabilir: dijitalleştirme iş akışını sağlayan yazılımlar, dijitalleştirme sürecini kolaylaştıran / hızlandıran / iyileştiren yazılımlar.

75 Ne tür yazılıma ihtiyacımız var?
Dijitalleştirme iş akışını düşünecek olursak; Dijitalleştirme için nesnelerin seçimi Elektronik kataloglama sistemi İş Tablosu (Spreadsheet) Nesnenin metadatasını hazırlama Tarama süreci Tarama donanım sürücüleri Tarama ekipmanlarını yöneten yazılımlar İleri işlem Grafik yazılımlar Ses ve video düzeltme yazılımları (...)

76 Ne tür yazılıma ihtiyacımız var? (devam)
Görüntülerden metin yakalama Optik Karakter Tanıma (OCR) yazılımları Metin editörü (düzeltmeler için) Dijitalleştirilen nesnelerin web sunum versiyonlarını hazırlama Sunulan dosyaların toplu işlenmesine izin veren grafik yazılımlar Uzun dönemli koruma Güvenli bir depolama aygıtına veya depolama hizmetine dosyaları vermeye izin veren istemci uygulaması Nesnenin web’de yayımlanması Dijital kütüphane yazılımı Bütün sürecin ilerleyişini kaydetme İş Tablosu

77 İleri işleme - grafik yazılımlar
Grafik ileri işleme şunlar için uygulanır: tarayıcı ayarlarındaki hataları düzeltme (bazen mümkündür), görüntünün yönünü ayarlama görüntüleri istenen formata çevirme, vb.

78 İleri işleme - grafik yazılımlar (devam)
Ücretsiz yazılımlar: GNU Image Manipulation Program – GIMP, Picasa, Inkscape, Scribus, Hugin, Adobe Acrobat Reader, Gsview,

79 İleri işleme - grafik yazılımlar (devam)
Ücretli yazılımlar: Adobe Photoshop, Corel Paint Shop Pro,

80 İleri işleme - Ses ve video düzenleme yazılımları
Ücretsiz yazılımlar: Audacity, OpenShot Video Editor, PiTiVi, VLC media player, Windows Movie Maker, Virtual Dub,

81 İleri işleme - Ses ve video düzenleme yazılımları (devam)
Ücretli yazılımlar: Adobe Audition, Adobe Premiere, Apple Final Cut,

82 Metin dokümanları/OCR yazılımı
Ücretsiz yazılımlar: OpenOffice, Google Docs, Sun PDF Import Open Office Extension, PDFedit , Tesseract, OCRopus, FreeOCR,

83 Metin dokümanları/OCR yazılımı (devam)
Ücretli yazılımlar: Microsoft Word, ABBYY FineReader, Document Express (DjVu) , Adobe Acrobat,

84 Web sunumu versiyonu Ücretsiz yazılımlar:
PDF2DJVU, BullZipfree PDF printer, ZoomifyExpress, Lame encoder, Nero AAC CODEC, FFmpeg, Irfanview, ImageMagick, OptiPNG,

85 Nesneyi dijital kütüphanede yayımlama
Nesneyi (veya web sunum versiyonunu) ve onun metadatasını dijital kütüphanede yayımlamak için bir dijital kütüphane yazılımına ihtiyacınız vardır. Kendi başınıza böyle bir yazılım edinmeniz gerekli olmayabilir, belki başka kurumların izin vermesiyle kendi nesnelerinizi onların dijital kütüphanesinde yayımlayabilirsiniz.

86 Dijital nesne nedir? Dijital nesne; kütüphanede bulunan bir kitap, gazete sayısı veya başka bir nesnenin dijital temsilcisidir. Öğeleri; Tek tanımlayıcı (Unique identifier) Metadata İçerik

87 Dijital kütüphane nedir?
Dijital kütüphane normal bir kütüphane gibidir ama kağıttan üretilmiş kitap, gazete, vb. yerine onların dijital temsilcileri ile çalışır. Dijital kütüphane sadece dijital nesnelerle doldurulmuş bir yazılım sistemi değildir; aynı zamanda bunların arkasında yer alan ve dijital kütüphaneyi işleten bütün bir kurumdur. Dijital nesneler dijital kütüphaneyi oluşturur ama bunlar sadece dijital nesneler değildir. Dijital nesnelerin yanında insanlar, ekipman, yazılım sistemleri, yöntemler, topluluklar vs. vardır.

88 Bir kütüphanenin temel görevleri

89 Dijital kütüphanenin temel görevleri
Kaynakları paylaşma Kataloglama Koruma

90 Dijital bir kütüphane nasıl çalışır?
Dijital kütüphane iş akış diyagramı [Saat yönünde yukarıdan başlayarak; yazar, basılı materyal, dijitalleştirme, dijital dosyalar, kataloglama, dijital nesne, dijital kütüphane yazılımı, dijital kütüphane kullanıcıları.

91 * Dijital kütüphanenin avantajları
7/24 açık olması Kolay arama ve gözden geçirme Dijital materyallerin korunması Bilginin kolayca güncellenmesi Bilginin yeni formları Mevcut yazılım sistemi ile otomatik bilgi değişimi * Dijital kaynaklar her gün 24 saat kullanıma açıktır – dijital kütüphane bakım çalışmalarının yapıldığı bazı nadir istisnalar harici hemen her zaman açıktır. Okuyucular kendilerine uyan bir zamanda ve Internet bağlantısı olan dünyanın herhangi bir yerinden dijital kütüphaneyi ziyaret edebilirler.  * Kolay arama ve gözden geçirme – dijital kütüphaneler ilginç materyaller bulmak üzere tarama motorlarını kullanıcılarının hizmetine sunar. Başlık, yazar, yayın yılı gibi metadata aramanın yanı sıra yazar, başlık vb. alfabetik indeksleri kullanarak kaynakları kolayca gözden geçirmek de mümkündür. * Dijital materyallerin korunması – dijital materyaller dijital kütüphane sunucularında depolanır ve sunuculardan hiç bir zaman çıkarılmazlar. Bir okuyucu dijital kütüphaneden belirli bir dijital nesneyi istediğinde, her seferinde dijital kütüphanenin ana sürücülerinde depolanan dijital nesnenin bir kopyasını alır. Bu, dijital materyalin sadece korunması değil, ama aynı zamanda orijinalden sınırsız sayıda kopya üretilebileceği anlamına gelir – basılı materyalden kütüphane raflarında sadece sınırlı sayıda kopya bulunmasının tersi bir durumdur. * Bilginin kolayca güncellenmesi – belirli bir dijital nesnenin güncellenmesi gerektiğinde sorumlu personel eski bilgiyi yenisiyle değiştirir veya sadece yeni bilgiyi ekler ve yeni bilgi anında bütün kullanıcılara sunulur. Böyle durumda geleneksel kütüphanede materyalinin yeni edisyonunu sağlamak veya üzerine hata notu koymak gerekirdi. * Bilginin yeni formları – bilgisayar/Internet ile ilgili bütün yeni teknolojilerden yararlanmak ve yeni bilgi formları oluşturmak mümkündür, örneğin etkileşimli dersler, multi-medya materyalleri gibi. * Mevcut yazılım sistemi ile otomatik bilgi değişimi – dijital kütüphane dışarıdaki yazılım sistemleri ile otomatik olarak iletişim kurabilir ve dijital nesneler hakkında veri değişimi yapabilir. Örneğin dijital kütüphane, arama motorlarına dijital nesneler hakkında bilgi verir –  bu sayede, kullanıcının arama sorgusu dijital kütüphanedeki mevcut içerik ile eşleştiğinde arama motoru o dijital kütüphaneyi işaret edebilir.

92 Dijital kütüphaneyle kimler etkileşim içindedir?

93 * Dijital kütüphaneyle kimler etkileşim içindedir? (devam)
Yönetim Üreticiler Tüketiciler Yönetim – dijital kütüphane ile ilgili takip edilmesi gereken strateji, kurallar ve yöntemleri belirler. Örneğin; yönetim bütün dijital kütüphane parametrelerinin tanımlanmasından sorumludur, dijital kütüphanede depolanacak olan dijital nesnenin formatı (PDF, TXT, HTML, MP3, vb.) ve bunların halka açık sunulması, dijitalleştirme süreci iş akışının tanımlanması. Yönetim, dijital kütüphaneyle ilgili günlük işlere karışmaz. Üreticiler – dijital kütüphaneye yeni dijital nesneler koymaktan sorumlu olan uzman personeldir. Üreticiler (editörler olarak da adlandırılır) dijitalleştirme, dijital kütüphane için dosyalar hazırlama ve dijital nesneleri kataloglama, dijital nesnelere erişim hakları atamaktan vb. sorumludurlar. Genelde, üreticiler dijital kütüphaneyi dijital nesnelerle doldurmaktan sorumludur. Tüketiciler – okuyucular olarak da bilinir - gerçek bir görevleri yoktur, tüketiciler dijital kütüphanede mevcut materyalleri kullanırlar. İlginç kaynaklara ulaşmak için arama ve gözden geçirme dahil dijital kütüphanenin çeşitli fonksiyonlarından yararlanırlar. Genellikle tüketiciler dijital kütüphaneden pasif olarak yararlanırlar ama dijital kütüphane yapısına aktif olarak tüketicilerin de katılmasına izin veren yeni yaklaşımlar da mevcuttur; örneğin etiketleme ve dijital nesne yükleme gibi.

94 * Popüler dijital kütüphane örnekleri
Project Gutenberg ( World Digital Library ( Europeana ( Internet Archive ( Google Books ( Project Gutenberg ( Genellikle ilk kez oluşturulan bir dijital kütüphane olarak kabul edilir. Project Gutenberg 1971’de ABD Bağımsızlık Bildirisi’nin dijitalleştirilmesi ile Michael Hart tarafından başlatılmıştır. Michael Hart tarafından yazılan misyon tanımındaeKitapların oluşturulması ve dağıtımını teşvik etmek yazılmıştır. Portal tamamen gönüllüler tarafından desteklenmiş. Genelde herkes Project Gutenberg’e katkıda bulunmaya davet edilmektedir. Project Gutenberg ’den fazla elektronik kitaba ücretsiz erişim vermektedir.. World Digital Library ( World Digital Library (WDL), UNESCO ve Amerikan Kongre Kütüphanesinin bir girişimidir, Nisan 2009’da başlamıştır. WDL’nin misyon tanıtımına göre “Word Digital Libary, dünya çapındaki ülke ve kültürlerden, önemli birincil materyalleri ücretsiz ve çok çeşitli dillerde Internet üzerinden sunar”. WDL’nin hedefleri, dijital kaynakları tanıtma, Internet’te mevcut dijital kaynakların çeşitliliğini artırma, araştırmacılara, eğitimcilere ve diğer ilgilenenlere çok çeşitli dijital kaynaklar sağlamak ve katılan kurumlar arasında bilgi değişimi olarak sıralanmaktadır. Şu andaki mevcut dijital kaynak sıyısı yaklaşık 1300’dür, dünya çapından çok dikkat çekici dijital kaynaklar içerir. WDL'nin kaynakları gözden geçirme yönünden çok ilginç bir yaklaşımı vardır. Ana sayfada bir dünya haritası yer alır ve dünyanın herhangi bir bölgesine ait kaynakları hemen gözden geçirmeye olanak verir. Europeana ( Europeana, Avrupa Komisyonu tarafından başlatılmıştır ve çeşitli faaliyet alanlarında AB tarafından sürekli olarak desteklenmektedir.i2010 policy  parçası olarak  eContentplus altında, Avrupa Komisyonu tarafından kaynak sağlanan bir Thematic Network’dür. Europeana metin, görüntü, video, ses kayıtları dahil Avrupa kültür mirasına erişim verir ortasında, 6 milyon dijital nesneye ulaşmıştır. Dijital nesneler bir takım etkileşimli ve gelişimci özelliklerle tamamlanmıştır, My Europeana veya ThoughtLab gibi [kaynak]. Internet Archive ( Internet Archive  1996’da Brewster Kahle tarafından kurulmuştur, resmi web sayfasında şu şekilde tanımlanmaktadır: “Internet Arşivi kâr amacı gütmeyen bir kurumdur, bir Internet kütüphanesi oluşturulmak üzere kurulmuştur. Amacı dijital formatta mevcut tarihi koleksiyonları araştırmacılara, tarihçilere, bilim insanlarına, engellilere ve genel olarak halka sunmaktır”. Bu dijital kütüphanenin ilginç özelliklerinden biri WayBack makinasıdır (Internet’in dijital kütüphanesi web sitesi), kullanıcılara belirli bir web sitesinin geçmişte nasıl göründüğünü, örneğin 10 yıl öncesini göstermektir. Şu anda 150 milyondan fazla web sayfası vardır, yaklaşık 3 milyon diğer türde kaynak mevcuttur.  [kaynak] Google Books ( Google Kitaplar, ticari Google şirketinin bir hizmetidir, Google tarafından aranmak amacıyla taranmış, işlenmiş ve indekslenmiş tam metin kitapları aramak mümkündür. Google Kitaplar Kamu Malındaki [Telif hakkı bulunmayan veya telif süresi dolmuş, Ç.N.] bütün kaynaklara ücretsiz erişim verir, hâlâ lisanslı olanlar için ise yerini bulma veya satın alma yolu sağlar. Şu anda Google Books'da 7 milyondan fazla kitap aranabilir durumdadar. Yeni yapılan bir duyuruya göre Google yeni bir kitap satış hizmetini başlatacaktır. Google Editions Book Store kullanıcılara kendi kitap raflarında bulunan bütün kitaplara online erişim sağlayarak Book Search hizmetini tamamlayacaktır. Fikir şudur; okuyucu bir kitabı satın alabilir ve sonra ihtiyacı olduğu zaman o kitaba online olarak erişebilir - Google Editions Book Store sloganına göre - "istediğin yerde satın al, istediğin yerde oku" [kaynak].

95 * Dijital kütüphanenin temel işlevleri
Dijital nesne sunma Dijital kütüphanede arama (search) Dijital kütüphanede gözden geçirme (browsing) Dijital nesne sunma Dijital bir kütüphane içinde herhangi bir dijital nesneyi görmek veya bulabilmek için, onun dijital olarak oluşturulmuş olması ve dijital kütüphaneye yüklenmiş olması gerekmektedir. Dijital nesne sunma, dijital kütüphaneye dijital nesne ekleme sürecidir. Dijital kütüphanede arama (search) Her dijital kütüphanenin en önemli işlevi kütüphane içinde arama yapmaktır. Okuyucuların kelime veya terim kullanarak dijital nesneleri aramalarına izin verir. Dijital kütüphanede gözden geçirme (browsing) Arama mekanizmasından başka önemli bir işlev de gözden geçirmedir. Gözden geçirme okuyucuların dijital kütüphanede bulunan dijital nesnelerin listesini görmesine izin verir. Bu liste bütün nesneleri içerebilir veya gözden geçirme konu veya dijital nesne koleksiyonuna özel yapılmışsa o bölümleri getirir.

96 Kendi dijital kütüphanenizi kurmaya karşı mevcut birine katkıda bulunma
Sorumluluk Kendi dijital kütüphanenizi geliştirme Mevcut bir dijital kütüphaneye katılma Dijital içerik ve metadata hazırlama Dijital içerik ve metadata hazırlamaktan sorumlu. Dijitalleştirme standartlarının tanımı , uyarlanması ve prensipler oluşturulması gereklidir. Devamında bakım gerekir. Dijital içerik hazırlamaktan sorumlu , genellikle ev sahibi kurumun koyduğu standart ve prensiplere uymak gerekir. Personel eğitimi İçerik hazırlama, yönetim süreci ve kalite kontrolü gibi alanlarda uzman personel gerekir. Ömür boyu öğrenme ihtiyaçları karşılanmalıdır. İçerik hazırlamak için personel gerekir. Eğitim gereklidir ama ev sahibi kurum tarafından karşılanabilir. İşlev geliştirme Yeni işlev sağlamaktan sorumludur, ister kurum içinde geliştirilsin, ister dış kaynak kullanılsın. IT sistemi için teknik eleman gerekir. Bu alanda sorumluluğu yoktur. Önerilerde bulunabilir ama dikkate alınmak zorunda değildir. Kalite kontrolü Raporlar hazırlanmalı ve ölçümler yapılmalıdır. Kalite kontrol yöntemleri geliştirilmeli ve aktif olarak uygulanmalıdır. Dijital içerik hazırlamayla ilgili temel kalite kontrollerinin yapılması gerekir. Politika belirleme Politikaların tanımlanması ve sonra uygulanması gerekir. Tanımlanmış politikalara uyulması gerekir.

97 Kendi dijital kütüphanenizi kurmaya karşı mevcut birine katkıda bulunma (devam)
“Acaba kurumum dijital bir kütüphane kurup yürütebilir mi?” sorusunu yanıtlamak için önce aşağıdaki soruları yanıtlamak gerekir: Kurumum yüksek performanslı sunucular ve geniş bantlı hızlı Internet erişimi dahil teknik alt yapı bakımı için mali kaynaklara sahip mi? Kurumum dijital kütüphane kurulumu, yapısal düzenleme, bakım ve daha ileri geliştirme için uzman teknik personele sahip mi (veya personel alımı için mali kaynaklara)? Kurumum planlama, dijitalleştirme süreci, kalite kontrolü vb. işlemler için uzman personel dahil, dijital kütüphane yönetimini güvence altına alacak mali kaynaklara sahip mi? Yukarıdaki sorulardan birine yanıtınız olumsuz ise, kendi dijital kütüphane projenize başlamayın ama onun yerine katkıda bulunmak üzere mevcut bir dijital kütüphane arayın. Mali kaynak garantisi olmadan kendi dijital kütüphane projenize başlamanın anlamı yoktur.

98 * Dijital kütüphane planlama
Projenin tanımı projenin amacı ve hedefi, hedeflenen kitle, projenin planlanan hedefleri ve çıktıları nelerdir? hedef ve çıktılar nasıl ve ne zaman gerçekleştirilecektir? Ayrıntılı plan hazırlama için gerekli hususlar: Bu projenin hedeflerini gerçekleştirmek üzere uzman personel. Etkili proje yönetim teknikleri; proje planında yer alan bütün faaliyetleri kontrol altında tutabilecek proje yönetimi. Değerlendirme planı; proje hedeflerini ve çıktılarını tanımlayıp geliştirmek. Projenin çıktılarıyla ilgili pazarlama ve yayma stratejisi; etkili iletişim planı, tanımlanmış hedef kitle, karşılıklı çalışabilirlik stratejisi, ulusal ve uluslararası işbirliği. Bakım ve iyileştirmeler; yazılım, donanım, diğer ekipman için planlama, devam eden iş akışını ve mevcut durumunu analiz etme ve buna dayanarak daha ileri iyileştirmeler belirlemek. Kendi dijital kütüphanenizi kurmaya karar verdiğinizde, başlangıç için temel faaliyet dijital kütüphane planlamasıdır. Burada en önemli iş, dijital bir kütüphaneyi başarılı bir şekilde başlatmak ve sürdürmek için yapılması gereken bütün görevlerin belirlenmesi ve planlanmasıdır. Dikkate alınması gereken ama sadece bunlarla sınırlı olmayan yapılacak işler ve görevler (NISO Girişimleri ilkelerine dayanan “İyi Dijital Koleksiyonlar Oluşturmak için Rehberlik Çerçevesi” adlı kaynaktan) şunlardır [kaynak]: Projenin tanımı – projenin amacı ve hedefi, hedeflenen kitle, projenin planlanan hedefleri ve çıktıları nelerdir, hedef ve çıktılar nasıl ve ne zaman gerçekleştirilecektir. Ayrıntılı plan hazırlama, gerekli hususlar: Bu projenin hedeflerini gerçekleştirmek üzere uzman personel. Personel, mali konulardan yönetim alanına kadar ve proje hedeflerine ulaşana kadar gerekli bütün düzeylerde farklı rollere ve uzmanlık düzeyine sahiptir. Etkili proje yönetim teknikleri; proje planında yer alan bütün faliyetleri kontrol altında tutabilecek proje yönetimi. Farklı teknik ve yöntemler mevcuttur, bununla birlikte her yöntemin üç temel öğesi vardır – proje planlama, projeyi uygulama ve projeyi gözden geçirme ve bakım Değerlendirme planı, proje hedeflerini ve çıktılarını tanımlayıp geliştirmek. Değerlendirme konularına örnek olarak dijital koleksiyonun kalite ve kullanımı, projenin etkisi ve projenin çıktıları veya dijitalleştirme yöntemlerinin randımanı verilebilir. Projenin çıktılarıyla ilgili pazarlama ve yayma stratejisi; etkili iletişim planı, tanımlanmış hedef kitle, karşılıklı çalışabilirlik stratejisi, ulusal ve uluslararası iş birliği. Bakım ve iyileştirmeler; yazılım, donanım, diğer ekipman için planlama, devam eden iş akışını ve mevcut durumunu analiz etme ve buna dayanarak daha ileri iyileştirmeler belirlemek.

99 * Dijital kütüphane planlama (devam)
Proje planlamaya ve gelişimini kontrol etmeye yardımcı bazı yazılım araçları; PRINCE2 (PRojects IN Controlled Environment, sürüm 2) PMBOK Rehberi (Project Management Body of Knowledge) PRINCE2 (PRojects IN Controlled Environment, sürüm 2) - Office of Government Commerce (OGC)’nin tescilli markasıdır, İngiltere HM Hazinesinin bir ofisidir. PRINCE2 jenerik proje yönetimi yöntemidir. Projelerin nasıl organize edileceği, yönetileceği ve kontrol edileceği konularını kapsar. Daha çok İngiltere devlet kurumlarında büyük ölçekli projeleri yönetmek için kullanılır. PMBOK Rehberi (Project Management Body of Knowledge) – ANSI ve IEEE standardıdır, uluslararası düzeyde kabul edilmiştir, PRINCE2’ye alternatiftir. İnşaat, yazılım, otomotiv vb. gibi değişik yerlerde uygulanabilecek proje yönetimi için bir dizi rehberler içerir.

100 * Dijital kütüphane planlama (devam)
JISC Digital Media’ya göre olası risk alanları: Proje yönetimi Personel Ekipman/sistemler Dijitalleştirme Metadata Sunum ve yönetim Proje planlamadaki önemli bir konu risk yönetimi konusudur.  JISC Joint Information Systems Committee Digital Media (JISC DM)’ya göre olası risk alanları şunlardır: Proje yönetimi – yanlış görev tanımı, zamanlama, bütün planı güncellemeden projede değişiklik, bütün bir projeden sorumlu tek bir yetkilinin olmaması. Personel – gerekli becerilerin eksikliği, anahtar personelin kaybı, iletişim sorunu, devamlı eğitim eksikliği, personelin şevkinin kırılması. Ekipman/sistemler – ekipmanın bozulması, alt yapı, IT desteği ve yardım masası sorunları, teknolojinin değişmesi. Dijitalleştirme – telif hakları/yasal sorunlar, iş akışının yanlış veya eksik tanımlanması ve belgelenmesi, kalite için gerektiğinde tekrar dijitalleştirmeye zaman olmaması. Metadata – proje başlamadan önce şema veya sözlüğün tanımlanmamış olması, metadata girişi iş akışının tanımlanmamış olması, kalite güvencesi için zaman ayrılmamış olması. Sunum ve yönetim – dijital koruma strateji ve politikasının olmaması, birinci aşamadan sonrası için projenin sürdürülebilir bir planının olmaması, ortaya çıkan ürünün (örneğin dijital kütüphane) çalışma ve etkisini test edecek kalite güvencesi yöntemlerinin olmaması.

101 * İşlerin düzenlenmesi
İnsanlar, görevler ve sorumluluklar Dijitalleştirme iş akışının tanımlanması ve performans İzleme, iyileştirme ve geliştirmeler Bir dijital kütüphane projesinde işler organize edileceği zaman öncelikle, dikkate alınması gereken tüm konuların listesi yapılmalıdır:

102 * İşlerin düzenlenmesi (devam)
İnsanlar, görevler ve sorumluluklar: “Kültürel Miras Web Hizmetleri Geliştiricileri için İyi Uygulama Rehberi” adlı kaynağa göre dijitalleştirme projesinde 5 kilit görevli vardır: Proje Yöneticisi Teknik Görevli Bilgi ve İletişim Görevlisi Değerlendirici Öğrenme kaynağı yaratıcısı İnsanlar, görevler ve sorumluluklar: “Kültürel Miras Web Hizmetleri Geliştiricileri için İyi Uygulama Rehberi” adlı kaynağa göre dijitalleştirme projesinde 5 kilit görevli vardır: Proje Yöneticisi – genel olarak projenin yönetiminden ve başarısından sorumludur. Proje yöneticisi genellikle proje planı ve bütçeyi hazırlar, projenin yerine getirilmesinden sorumludur. Teknik Görevli – teknik sistemin bakımı ve gelişmesinden sorumludur, proje takımına teknik yardım ve eğitim sağlar. Bilgi ve İletişim Görevlisi – projenin halka ilişkiler, bilgi dağıtımı ve pazarlama stratejisinden sorumludur. Değerlendirici – bir değerlendirme planı hazırlamak ve uygulamaktan sorumludur. Öğrenme kaynağı yaratıcısı – proje çerçevesinde üretilen dijital içerikten öğrenme kaynakları hazırlamaktan sorumludur.

103 * İşlerin düzenlenmesi (devam)
Dijitalleştirme iş akışını tanımlama ve uygulama Dijitalleştirilecek orijinal eserlerin seçimi Dijitalleştirme için hazırlık Orijinal eserlerin dijitalleştirme laboratuvarına taşınması Tarayıcı, kamera vb. araçlar kullanılarak görüntülerin yakalanmasına dayanan dijitalleştirme süreci Gerekirse orijinal eserlerle ilgili koruma işi Uzun dönemli koruma amacıyla dijital ana dosyanın arşivde saklanması Dijitalleştirilen eserlerin metadatasını hazırlama Görüntü işleme Görsellerin kalite kontrolü Dijital kütüphane yazılım ortamında sunum dosyalarının online olarak yayımlanması. Dijitalleştirme iş akışını tanımlama ve uygulama Dijitalleştirilecek orijinal eserlerin seçimi – seçim kriterlerine, son kullanıcı ihtiyaçlarına ve orijinallerin telif hakkı durumuna göre. Dijitalleştirme için hazırlık – orijinal eserlerin ihtiyaçlarına göre yazılım ve donanımın biçimlendirilmesini içerir. Orijinal eserlerin dijitalleştirme laboratuvarına taşınması – orijinal eserler üzerinde çalışılacağı için bunlar kısa bir süre kullanılamayacaktır ve bu süre içinde zarar görmemesi gerekir. Tarayıcı, kamera vb. araçlar kullanılarak görüntülerin yakalanmasına dayanan dijitalleştirme süreci. Gerekirse orijinal eserlerle ilgili koruma işi. Uzun dönemli koruma amacıyla dijital ana dosyanın arşivde saklanması. Dijitalleştirilen eserlerin metadatasını hazırlama, böylece bu eserler ilgilenenler tarafından kolayca keşfedilebilir. Görüntü işleme ve ince-ayar, dijital kütüphane yazılım sisteminin son kullanıcıları için sunum dosyalarını hazırlama. Görsellerin kalite kontrolü, hem ana hem de sunum dosyalarının kalite kontrolü. Dijital kütüphane yazılım ortamında sunum dosyalarının online olarak yayımlanması.

104 * İşlerin düzenlenmesi (devam)
İzleme ve iyileştirmeler: “Kültürel Miras Web Hizmetleri Geliştiricileri için İyi Uygulama Rehberi” adlı kaynağa göre: Sadece plana aykırı faaliyetler için olağan dışı durum raporları hazırlanmalıdır. Proje süreci ve mali konularla ilgili düzenli raporlar, kurumun üst yönetimi için önceliklidir ve tercihen üç aylık ama en azından yıllık olarak hazırlanmalıdır. Raporlara dayanarak çeşitli onarma çalışmaları yapılmalı ve iyileştirmeler bütün proje çerçevesinde sunulmalıdır. İzleme ve iyileştirmeler: “Kültürel Miras Web Hizmetleri Geliştiricileri için İyi Uygulama Rehberi” adlı kaynağa göre: Sadece plana aykırı faaliyetler için olağan dışı durum raporları hazırlanmalıdır. Bu yaklaşım hem belge oluşturmayla daha az uğraşmayı hem de  yöneticinin zamanında bilgilendirilmesi için deneyimli ve iyi koordine edilmiş takım oluşturulmasını gerektirir. Proje süreci ve mali konularla ilgili düzenli raporlar, kurumun üst yönetimi için önceliklidir ve tercihen üç aylık ama en azından yıllık olarak hazırlanmalıdır. Raporlara dayanarak, çeşitli onarma çalışmaları yapılmalı ve iyileştirmeler bütün proje çerçevesinde sunulmalıdır.

105 * Metadata şeması ve çok dillilik
Dijital koleksiyonun amacı nedir? Bu koleksiyonu oluşturmak için amaç ve hedefler nelerdir? Hedeflenen kullanıcılar kimlerdir? Hangi bilgiye ihtiyaçları vardır ve kendilerine özgü bilgi-arama davranışları nasıldır? Erişilecek materyaller koleksiyon düzeyinde mi, yoksa bireysel materyal olarak mı erişilecek veya ikisi de mi? Nesnenin çoklu versiyonları veya görüntülerinin birbirinden ayrılması gerekiyor mu? Koleksiyon veya koleksiyonun nesneleri, dijital koleksiyon oluşturulmadan önce metadataya sahip olacak mı? Hangi konu alanları kapsanacak? Bu konuda yaygın olarak kullanılan metadata standartı nedir? Bu alanda kurumlar tarafından kullanılan metadata standartı nedir? Özellikle bu koleksiyon için en uygunu hangisidir? Bir tanımlamanın ne kadar zengin olması gerekir ve metadatanın hiyerarşik ilişkileri yansıtması gerekir mi? Dijital kütüphane projesinde hangi metadata standardının kabul edilmesi gerektiği kararı, projenin amaç ve hedeflerine dayanılarak alınmalıdır. Dikkate alınacak sorular aşağıdadır ama bunlarla sınırlı değildir (sorular NISO Metadata ilkelerine dayanır):

106 * Metadata şeması ve çok dillilik (devam)
Dijital nesneleri tanımlamak amacıyla seçilen metadata standartının aşağıdaki ilkelere uyması gerekir: Metadata, şimdi ve gelecekteki kullanıcılar tarafından kullanılan ve koleksiyondaki dijital nesnelerin türü için kullanılan standartlara uygun olmalıdır. Metadata karşılıklı çalışabilirliği desteklemelidir, yani dış kullanıcılar veya sistemler tarafından genel bağlamda kullanışlı olmalıdır. Metadata, otorite kontrolü ve içerik standartları kullanmalıdır, yani belirli bir metadata öğesi için kontrollü terimler seti kullanılması önerilir. Örnek olarak; dil öğesinde ISO-639 sandartı kullanılabilir. Metadata, dijital nesnenin durumu ve kullanım şartlarıyla ilgili açık ifadeler içermelidir. Metadata, uzun-dönemli korumayı desteklemelidir yani depolanan verinin ileride yorumlanması için yapısal ve teknik metadata içermelidir. Metadatalar da nesnedir, bu nedenle iyi nesne kalitesine sahip olmalıdırlar; tekil tanımlama (unique identification), otorite, doğruluk, arşivlenebilirlik ve devamlılık gibi.

107 * Metadata şeması ve çok dillilik (devam)
Genellikle dijital kütüphanenin web portalı düzeyinde çok dilli olmasına karar verilir ancak metadata tanımında orijinal dil (kurumun ülkesinde kullanılan dil) kullanılır. Metadata farklı dillerde sunulabilirken, dijital kütüphane projesi için paydaşların metadatanın hangi dillerde sağlanacağına ve dijital kütüphane web portalının hangi dillerde sunulacağına karar vermesi gerekir. Dijital kütüphane web portalının çok dilliliği işi alt yükleniciler tarafından kolayca yapılabilir, metadata düzeyinde çok dillilik ise büyük bir iştir. Çünkü metadata uzman personel tarafından hazırlanır ve yabancı dil bilmeleri gerekmez. O nedenle genellikle dijital kütüphane web portalı düzeyinde çok dilli olmasına karar verilir ama metadata tanımında orijinal dil (kurumun ülkesinde kullanılan dil) kullanılır.

108 * Son ayarlamalar ve dijital kütüphaneyi başlatma
Dijital kütüphane web portalının kullanıcı arayüzü için logo ve tema seçimi, Hedeflenen kullanıcılarla ilgilenme ve onların dikkatini dijital kütüphane projesine çekme: Kullanıcıların geri bildirimde bulunmalarına fırsat vermek, “Nasıl yapılır” materyalleri sağlamak, Kullanıcılara dijital kütüphaneye katkıda bulunma, onun bir parçası olma fırsatı vermek. Son ayarlamalar kapsamında ; Kurumun ihtiyaçlarına uygun logo, tema gibi dijital kütüphane web portalının kullanıcı arayüzünün uyarlanmasıyla ilgili konular vardır. Öte yandan hedeflenen kullanıcılarla ilgilenme ve onların dikkatini dijital kütüphane projesine çekme zamanıdır. Kullanıcılarla ilgilenme şunları içerir: Kullanıcıların geri bildirimde bulunmalarına fırsat vermek. Kullanıcıların, dijital kütüphane davranışları (işlevi, görünümü, vb.) üzerinde etkileri olduğunu hissettirmek. “Nasıl yapılır” materyalleri sağlamak, örneğin dijital kütüphanede mevcut dijital materyalleri kullanmak için ek yazılım yüklemek gerektiğinde. Kullanıcılara dijital kütüphaneye katkıda bulunma, onun bir parçası olma fırsatı vermek, örneğin etiketleme gibi Web 2.0 özellikleri ile.

109 * İyi koleksiyonlar nasıl oluşturulur?
NISO iyi koleksiyon ilkeleri: İyi bir dijital koleksiyon, üzerinde anlaşılmış ve koleksiyon oluşturmaya başlanmadan önce belgelenmiş, açık bir koleksiyon geliştirme politikasına göre oluşturulur. Koleksiyonlar tanımlanmalıdır; böylece bir kullanıcı koleksiyonun karakteristik özelliklerini keşfedebilir. İyi bir koleksiyon bakımlıdır; yani kaynakları bütün yaşamları boyunca aktif olarak yönetilir. İyi bir koleksiyon geniş olarak sunulur. İyi bir koleksiyon entelektüel mülkiyet haklarına saygı duyar. İyi bir koleksiyon, kullanım verisi ve standart yararlılık ölçümlerini kaydetmeye izin veren verileri sağlama mekanizmasına sahiptir. İyi bir koleksiyon karşılıklı çalışabilirdir. İyi bir koleksiyon, kullanıcının kendi iş akışıyla bütünleşir. İyi bir koleksiyon zaman içinde sürdürülebilirdir. NISO - National Information Standards Organization – iyi koleksiyon ilkeleri 1. ilke: İyi bir dijital koleksiyon, üzerinde anlaşılmış ve koleksiyon oluşturmaya başlanmadan önce belgelenmiş, açık bir koleksiyon geliştirme politikasına göre oluşturulur. 2. ilke: Koleksiyonlar tanımlanmalıdır; böylece bir kullanıcı koleksiyonun karakteristik özelliklerini keşfedebilir. Bunlar kapsam, format, erişim kısıtlamaları, sahiplik ve koleksiyonun doğrulanması, bütünlüğü ve yorumlamasını belirlemek için önemli bilgilerdir. 4. ilke: İyi bir koleksiyon geniş olarak sunulur ve kullanmak için engellerden kaçınılır. Koleksiyonlar engelli kişiler tarafından da erişilebilir olmalı ve uygun teknolojilerle birlikte etkili şekilde kullanılabilmelidir. 6. ilkenin açıklaması: Dijital koleksiyon kullanımını izlemek, hizmet etkinliğini belirlemek, yatırımın karşılığını göstermek, bilgili koleksiyon geliştirme, bilgili stratejik planlama ve mali kaynak isteklerini desteklemek üzere düzenli olarak değerlendirilmelidir. Değerlendirme çeşitli yöntemler kullanılarak yapılabilir, bunlar: anketler, röportajlar, gözlem, vaka çalışmaları ve (kütük) log analizleri.

110 * İyi koleksiyonlar nasıl oluşturulur? (devam)
Materyal şu nedenlerden dolayı seçilebilir: Mali kaynak sağlayan dış kurumun kriterlerine uymak için Başka bir kurumla işbirliği sağlamak için Belirli bir yıl dönümüne rastladığı için Aksi durumda erişilemeyecek veya sınırlı erişilecek bu materyale erişimi artırmak için Bu materyalin korunmasını sağlamak için

111 İyi koleksiyonlar nasıl oluşturulur? (devam)
Materyal şu nedenlerden dolayı seçilmeyebilir: Telif Hakları veya Entelektüel Mülkiyet Hakları Dijital versiyonunun zaten var olması Dijitalleştirmenin maliyeti

112 Entelektüel Mülkiyet Haklarına Genel Bakış
Telif hakkı koruması sonsuza kadar değildir, bir eser için geçerlilik süresi hesaplanabilir ve üretildiği ülkenin kanunlarına bağlıdır. Edebiyat ve sanat eserleri için, eğer yaratıcısı biliniyorsa, çoğu ülkede telif hakkı, eserin yaratıcısının ölümünden itibaren 70 yıl geçerlidir. Yayımlanmış anonim eserler için, çoğu ülkede telif hakkı yayım tarihinden itibaren 70 yıl geçerlidir.

113 Entelektüel Mülkiyet Haklarına Genel Bakış (devam)
Telif hakkı olmayan nesneler “kamu alanı”nın bir parçası haline gelir; bu tür nesneler EMH sınırlaması olmadan kullanılabilir. Eğer telif hakkı sahipleri bilinmiyor veya bulunamıyorsa “öksüz eserler” ortaya çıkar. Bu durumda böyle bir kaynağı dijitalleştirmek isteyen kurum, telif hakkı ihlali riskini göze alacaktır.

114 * Entelektüel Mülkiyet Hakları konularında uluslararası anlaşmalar
Entelektüel mülkiyet hakları uluslararası kanun konusudur, her ülke kendi kanununu geliştirir ama bunların çok önemli üç anlaşma doğrultusunda olması gerekir: Berne Convention (1971) WIPO Copyright Treaty (WCT, 1996) WIPO Performances and Phonograms Treaty (WPPT, 1996) Berne Convention (1971) - anlaşmayı imzalayan ülkelerdeki yasaları uyumlu hale getirmeyi amaçlar. Yazarın eserinin korunduğu zaman süresi, en belirgin minimum standartdır: yazarın hayatı boyunca ve artı elli yıl. Şu anda bu süre daha uzundur - 70 yıl. WIPO Copyright Treaty (WCT, 1996) – dijital çağa telif haklarını getirmeyi amaçlar. WCT bilgisayar programlarının edebiyat eserleri olduğunu ve diğer edebiyat eserleriyle aynı şekilde yasalarla koruma altında olduğunu belirtir. WIPO Performances and Phonograms Treaty (WPPT, 1996) – "gösteri ve ses kayıtlarının karıştırılması ve bunların kablolu veya kablosuz araçlarla halka sunulması yetkisi konusunda  icracı ve yapımcıların hakları"nı tarif eder” [kaynak].

115 Telif hakkı ihlali ve adil kullanım
JISC Dijital Medyanın "Hareketsiz Görüntüler: Telif Hakkı ve Dijital Medya" adlı kaynağına göre telif hakkı ihlaline neden olan yasaklı faaliyetler: Materyali kopyalama Kopyaları yayımlama veya halka sunma Gösterme, oynatma veya yayın yapma veya filme alma Materyali uyarlama veya değiştirme

116 * Telif hakkı ihlali ve adil kullanım (devam)
Korunan materyalin kopyalanması yasaktır ama bazı şartlar altında nesneleri yeniden üretmek mümkündür; bu tür istisnalara adil kullanım - fair use denir. Adil kullanıma şu şartlarda izin verilir: Ticari olmayan araştırma veya özel çalışma için kopyalama Eleştiri veya inceleme için Güncel etkinlikleri bildirmek için Eğitim amaçlı Yetkili bir eğitim kurumunda sınav amacıyla Ticari-olmayan araştırma veya özel çalışma için kopyalama örneğin, görüntüleri İnternet’ten indirme ve bunları kendi bilgisayarınızın ana belleğinde saklama. Kişisel kullanımınız için olduğu sürece bu kabul edilir ama bu görüntüyü kendi web sitenize koymamalısınız. Eleştiri veya inceleme için Örneğin, bir müzik albümünün kapak görüntüsünü, eleştirisinin yanında gazeteye koymak. Güncel etkinlikleri bildirmek için Örneğin haber sitesinde bir görüntü kullanma, bu durum fotoğrafı hariç tutar. Eğitim amaçlı Örneğin, ders sırasında bazı kavramları açıklamak için romanın bir parçasını kullanmak.  Yetkili bir eğitim kurumunda sınav amacıyla Örneğin, öğretmen dijital bir eseri indirebilir ve sınav amacıyla sınıfına dağıtabilir. Ayrıca “Kütüphane Ayrıcalığı – Library Privileges” olarak bilinen bir istisna vardır, kütüphaneci ve arşivcilere kullanıcıları adına bir kopya yapmalarına izin verir. Kopya ticari-olmayan araştırma veya özel çalışma için kullanıldığı sürece sorun değildir.

117 Lisanslama Creative Commons (CC) GNU Free Document License (GFDL)
Telif hakkı koruması baştan kabul edilmek koşuluyla; bir yazarın yazılı izni olmadan eserini kullanamayacağınızı belirtir. CC lisanslarında hak sahibi, CC lisanslarından birini seçerek, kendi içeriği ile ne yapılabileceğini söyler. GNU Free Document License (GFDL) GFD License telif müsaadeli (copyleft)  kavramı etrafında yapılandırılmıştır. Copyleft; tek bir şart altında herkesin yeniden üretebileceğini, uyarlayabileceğini veya dağıtabileceğini varsayar; bu şarta göre sonuçta ortaya çıkan kopyalar veya uyarlamalar da aynı lisans anlaşmasına tabii olacaktır.

118 Lisanslama (devam) Kurum, elinde tuttuğu haklar konusunda, şu bilgileri içeren veri kaydı tutmalıdır: Kaynağın kendisinin kimliği Hakları veren kişinin adı Verilen bütün haklar ve varsa özel istisnalar Hakların verildiği zaman periyodu Kaynağı kullanmaya izin verilen kullanıcı grupları Kaynağı kullananların yükümlülükleri (mali yükümlülükler dahil) Bütün lisans anlaşmaları izlenmeli ve gerekirse yeniden müzakere edilmelidir.

119 Fotoğraf/çizim/posterler nasıl dijitalleştirilir ve web'de sunulmak üzere hazırlanır?
Bu derste; Fotoğraf, çizim, resim, harita ve poster gibi hareketsiz görüntülerin nasıl dijitalleştirileceği, görüntü çözünürlükleri, uygun tarama parametreleri, Arşiv ve/veya web sunum amaçlı hazırlanan çeşitli görüntü dosya parametreleri, (…)

120 Fotoğraf/çizim/posterler nasıl dijitalleştirilir ve web'de sunulmak üzere hazırlanır? (devam)
Hareketsiz görüntülerin dijitalleştirilmesi için uygun araçların nasıl seçileceği gibi bilgilerin yanısıra; GIMP kullanarak temel görüntü ileri işleme (görüntüyü döndürme, kırpma) görüntüyü farklı dosya formatları ve çözünürlükleri arasında değiştirme/dönüştürme harita, poster gibi büyük nesneleri dijital kamera ya da Hugin gibi bir görüntü birleştirme aracı kullanarak dijitalleştirme Google Maps Image Cutter ve Zoomify araçları kullanarak etkileşimli görüntüler yaratma IrfanView kullanarak toplu işlem ve bir grup görüntüyü bir formattan başka bir formata dönüştürme uygulamalarını gördük. How to choose scanning parameters? Below you will find a example of recommendation from National Library of Australia which describes how to deal with colour reflective formats like coloured maps, sepia or coloured photographic prints etc. Material type: Colour reflective formats, including: coloured maps, ,pencil sketches with wash, sepia or coloured photographic prints, printed music, manuscripts. Tonal resolution (pixel depth): RGB - 24 bits per pixel Spatial resolution: larger than A5: 300 ppi, smaller than A5 but larger than A6: 600 ppi, smaller than A6: 1200 ppi One thing here requires more elaborate description, it was already mentioned that pixels contains information about colour. This information can be encoded in various ways, the most commonly used model is RGB (Red Green Blue) where each colour is described using three components. In the example above, apart from using RGB model National Library of Australia recommends using 24 bit to encode each pixel (this means 8bit per RGB component). This may sound pretty mysteriously but in only this means that pixels can have 16.7 million different colours. You may refer to any of the following guidelines: "National Library of New Zealand Digitisation Guidelines" [source] "National Library of Australia – Image capture standard" [source] "The Library of Congress: Technical Standards for Digital Conversion Of Text and Graphic Materials" [source] Soru: What does RGB 24 bits per pixel mean in practice? Yanıt: Image colour information is encoded using RGB model How to choose archival format? The most widely used file format for storing digital images is TIFF (Tagged Image File Format). TIFF was introduced in 1986, it is mature, flexible (allows to store metadata, use various compression algorithms) and adaptable. TIFF with lossless LZW compression is a great choice for small memory institutions. Most of the SLR digital cameras support also a RAW format, contains minimally processed data from the image sensor. RAW format is sometimes called a digital negative as they have the same role as traditional negatives. RAW format is lossless, metadata rich format, unfortunately most of the camera manufacturers are using their own file formats. You can create TIFF file from RAW using a software which usually provided by camera manufacturer. Soru: What kind of compression can be used together with TIFF files? Yanıt: Lossy and lossless How to choose web delivery format for images? There is quite a lot of various file formats available for web delivery. Existing image web delivery formats can be divided into two groups: Simple file formats i.e. PNG or JPEG one file contains one image, some of them feature lossy, some lossless compression. Interactive formats i.e. Zoomify one image can be represented by multiple file, they may require additional software like Adobe Flash, offers some level of interactivity, allows to publish really large images with the high level of details. PNG (Portable Network Graphics) was designed as a general purpose replacement for GIF format. It uses lossless compression which in general causes that PNG files are bigger than JPEGs. JPEG (Joint Photography Experts Group) features very effective lossy compression which was designed mostly for photographic images. Soru: Is it possible to use PNG files also as a digital master copy format? Cevap: Yes, it is open, lossless file format. Sounds reasonable. (Yes, it is a general purpose standard, whose specification is available.)

121 Metin içeren nesneler nasıl dijitalleştirilir ve web'de sunulmak üzere hazırlanır?
Kitap, gazete gibi metin içerikli nesnelerin dijitalleştirilmesi ve sunumu, tarama parametreleri ve araçlarının seçimi görüntüden metin yakalama yöntemleri metin içeriği için hem arşivleme hem de web sunum formatı seçimi OCR yazılımının yönetim yolları, FineReader kullanımı otomatik metin tanıma sonuçlarının düzeltilmesi dijital nesnenin web sunum versiyonunun hazırlanması metin içeren belgelerin otomatik olarak işlenmesine olanak veren OCR sunucusu kavramı hakkında bilgi edindik. Digital text Soru: What does it mean that text is machine readable? Cevap: Computers can process text to do perform some actions i.e. search for a given word. How to create digital text? Soru: Which project used crowdsourcing for creation of digital text? Cevap: Australian Newspaper Digitisation Program Optical character recognition There are several factors which reduces quality of the OCR, the most important are: Quality of print and overal state of document, Scans resolution and used colour depth, Language of text, used alphabet and typeface It is important to use OCR engine which supports language of text, its alphabet and typeface. Figure 1 presents examples of errors made by OCR when given language (in this case Polish) is not supported. Text layout Book has different text layout (one column) than newspaper (many columns with pictures), if layout is really complex results of OCR may have low quality. Text formatting Adequate white space between lines, columns and at edge of page so that text boundaries can be identified. When deciding which OCR should be used you should definitely take a look at the following products: ABBYY Finereader – is the leading commercial solution in terms of OCR. It supports more than 180 different languages and advanced layout analysis. Apart from this it has also a dedicated module for recognition of gothic fonts (called Finereader XIX). ABBYY offers multiple versions of this product with different pricing and terms of use. Readiris OCR engine which is available as a separate product or as a part of Document Express (DjVu) and Adobe Acrobat. It supports 120 different languages, layout analysis and other advanced features. Tesseract/OCRopus are open source and free to use tools which are in fact fully featured OCR solution. Tesseract was originally developed by Hewlet Packard at the moment it is heavily used in Google Books projects. Since it is an open source project it may be hard to use it without technical knowledge. Choosing scanning parameters Soru: Which resolution is considered as a good balance between scanning speed and efficiency of OCR? Cevap: 300 PPI Scanning process Soru: What is the purpose of using automatic document feeders? Cevap: Speeding up the scanning process for unbound paper. How to choose archival and web delivery formats? The simplest way to expose multipage textual documents is to use PDF files. PDF is a widely used standard, most of the computers has pre-installed web browser plugin which allows to display PDF in a browser. PDF/A is a version of PDF which was certified as an ISO standard, which makes it suitable for using in long term preservation and archiving. Main competitor of PDF is DjVu format. It features very efficient compression technique which makes that DjVu files are really small. Apart from this it is possible to create a DjVu documents which are divided into multiple files i.e. each page has its own file. This is very comfortable in terms of web access, web browser is downloading only a one file at time, so users does not have to wait till whole document is loaded. The biggest drawback of DjVu is that it requires additional web browser plugin which users have to download and install. Soru: Does DjVu files require browser plugin? Cevap: Yes Preparation of web delivery version In this part you will learn how to create a web delivery version of PDF and DjVu document. Batch processing of textual content Not all stages of the process of creating digital textual objects must be done manually. Some tasks can be automated. Three stages can be distinguished in the process of creation of digital textual objects: preparation of input images OCR preparation of presentation files Some operations on images cannot be automated i.e. deskewing and cropping. But other things like colour depth reductions for the purpose of enhancing the quality of OCR can be easily performed by computer program.

122 Ses ve videolar web üzerinden sunulmak üzere nasıl hazırlanır?
Dijital işitsel ve video içeriğin webde sunuluşuna dair önemli yaklaşımları, Bu materyallerin yaratılması ve korunmasıyla ilgili sorunları, Video ve işitsel içeriğin; uzun dönem korunmasına, web üzerinde sunumuna ve yayımlanmadan önce düzenlenmesine yönelik uygun dosya formatı, araçlar ve/veya yöntemlerin seçimi.

123 Ses ve videolar web üzerinden sunulmak üzere nasıl hazırlanır? (devam)
İşitsel işlemeye ilişkin olarak; Audacity işitsel editörü kullanarak işitseli yayımlanmaya hazır duruma getirme, Lame kodlayıcısı kullanarak işitsel dosyasını bir formattan başka bir formata dönüştürme, Media Monkey kullanarak metadatayı işitsel dosyasına ekleme ve İşitseli web üzerinde yayımlama, Video işlemeye ilişkin olarak da; Virtual Dub editörü kullanarak videoyu yayımlanmaya hazır duruma getirme, WinFF ve ffmpeg kullanarak videoyu bir formattan başka bir formata dönüştürme ve videoyu web üzerinde yayımlama konularında bilgi edindik. Önemli terimler: sampling, sample rate, bit depth, bit rate Sampling is the method used to encode information about sound in the digital form. In digital still images pixels are the basic elements which build the whole picture. In case of digital audio these pixels are named samples. One sample holds information about sound properties in given moment of time, how loud is given sound, what tone it has. The frequency in which samples are created is called sample rate. The image sample rate is similar to pixel resolution it tells how many details are kept inside a digital image. Sample rate - expressed in hertz (Hz), describes how often samples are created, higher frequency (higher sample rate) results in an digital audio file which is more similar to original song. As you remember high resolution caused longer download times and bigger file sizes – sample rate behaves in exactly the same way. Bit depth corresponds to image colour depth, the more bits represents one sample the more accurate projection of original sound would be. The last element is a bit rate it refers to amount of data transferred (per second) when given file is downloaded. In order to calculate bit rate you have to take into account: sample bit depth, sampling rate and number audio channels (as you know stereo sound has two channels, mono has only one). Overall bit rate can be calculated using simple equation: bit rate = bit depth x sampling rate x number of channels. The higher bit rate the better sound you will get. Exactly the same as with digital images in order to reduce size of the file you may use compression. In terms of audio files compression method (also called CODEC – Compression – Decompression) is usually associated with particular file format. The most important concepts associated with digital video anatomy can be derived from digital images and audio features i.e. resolution derived from resolution (both pixel and colour) of images presented in the movie bit rate to amount of data transferred (per second) when given file is downloaded sampling rate refers to sampling rate of audio from the movie There are also other concepts which are unique for video like playback speed and aspect ratio (proportion between horizontal and vertical dimension). Another issue which is essential for digital video accessibility is compression – decompression (CODEC) algorithm used to reduce the time necessary to download given file. While watching a standard video you see 25 frames per second when multiplied by the length of the movie it results in quite significant amount of data. Modern CODECs are doing really good job and are able to significantly reduce the size of file, thanks this it is possible to watch High Definition video by the means of regular Internet connection. It is really hard to write a good CODEC, no wonder that the most efficient tools in this area are proprietary and you have to pay a fee to use them. As some file types works only with particular types of CODECs, it may exclude some file formats from using them in your project. Soru: What is the main task of CODECs? Cevap: Compression and decompression of the audio and video. Bit rate is directly associated with the quality of presented material, the better quality (the more details movie has) the more space it occupies on the hard disk. Apart from bandwidth capacity there is also one more requirement which you should take into consideration - computational capacity of end-user devices. As desktop computers won’t have any problems with decoding high quality video you should remember about other devices like netbooks or mobile handsets. Their computational power is very limited, to ensure that your content will be accessible for users you should consider publishing a dedicated version of videos. Getting content from device to computer The first step in digital audio and video authoring is to get content from device into the file system of your computer. This operation should be well described in the manual added to every digital camera or recorder. It may be necessary to install additional software (usually provided by manufacturer or available to download from its website) after successful installation it would be necessary to connect device to your computer and download the content. As was said penetration of devices capable to record audio-video content in a digital format is quite significant but analogue cameras are still available. In order to digitise it output you will need some additional equipment, which should include: appropriate playback device (i.e. VHS video player, gramophone) dedicated capturing device (i.e. extension card for a computer) computer Depending on the type of analogue video carrier, the availability of playback devices may be different. Some of the hardware is already obsolete and it is impossible to buy new devices, the only chance is look for some used equipment. There is also a number of optional equipment which might be useful, like: Time base corrector (TBC) If the area of the tape responsible for control over the rate of playback is damaged, TBC may be the only way to control playback speed and improve the quality of final video. Colour corrector Allows to adjust colour of analogue video. Cube monitor Is a monitor which is very accurate in terms of colour representation. It can be used to view the output of video playback device, to see what kind of input is processed through analogue to digital converter (capturing card). As you see digitisation requires additional equipment, this hardware would be only useful for digitisation of a-v content. So, if audio and video is only a small part of your collection you should consider outsourcing its digitisation or try to use digital recording devices to avoid digitisation on your own.Usually digital recording devices allows to record content with different quality, usually it is the best to use the highest possible quality. It is very important when there is a chance that video or audio may be reused for the different purpose i.e. promo movie. If you are sure that given material will be only published on the Web you may decide to record at lower quality. You have to remember that in some cases it may be hard to repeat given recording (i.e. performance or concert) so you should think carefully about what are your needs and goals. Choosing archival formats for digital video and audio When content is already downloaded from recording device and stored in the file system of your computer you can proceed further. Exactly the same as with other types of content, it is necessary to distinguish two things web delivery form of a-v material and version suited for long term preservation. As you already know preservation form (a.k.a. digital master copy) should be accessible even in a long term perspective this is why it is important to use format which is widely used and whose specification is open. This is not so important when preparing a web delivery version where CODEC efficiency may be the most important factor. Beyond that web delivery version can be always re-generated from digital master copy. Most of the used CODECs are using lossy compression, so the conversion to some other format may cause further loss of information. That’s why in case of digital masters of audio and video materials it is common practice to use material downloaded from recording device as a digital master copy. As internal recorder format may not be open it is recommended to preserve appropriate software next to the file. If recording device allows to choose appropriate settings you should use suggestion described in "MINERVA Technical Guidelines for Digital Cultural Content Creation Programmes" [source]. Video should be stored using the uncompressed RAW AVI format, without the use of any codec, at the same frame size as captured original, a frame rate of 25 frames per second, using 24-bit colour. PAL colour encoding should be used." The same document advices that in terms of audio files a WAV or AIFF formats should be used. 24-bit stereo sound at 48/96 KHz sample rate should be used for master copies. Using uncompressed data means that you will have to allocate appropriate amount of disk space. You can also test usage of lossless CODECs like FLAC (Free Lossless Audio Codec) or LPCM (Linear Pulse Code Modulation). Choosing a web delivery format for digital video and audio As was said in the previous lesson format openness is not crucial in terms of web delivery of audio and video. But thankfully there are some solutions which allows to have efficient and open distribution of audio files over the web. Most probably you have heard about a family of MPEG standards (like MP3, MP4), they are intended to deal with handling of audio and video compression. They employ a so called asymmetric approach: an encoder – tool which does the compression is much more sophisticated than decoder (tool which does the decompression). Most of the standards developed in this way regulates behaviour of the decoder and leaves a lot of space for developers who are creating encoders. This allows to companies like Apple to develop their own proprietary encoders and as long as they produce output which is compliant to MPEG standards anyone would be able to watch a video or listen to given song. Soru: Does MP4 can handle both video and audio files? Cevap: Yes. Choosing a web delivery format for digital audio In previous parts of this lesson you have read about digital audio-video anatomy and about format which are suitable for long-term preservation. Before you proceed to online delivery formats suitable for audio it is necessary to explain some terms which you may encounter while reading materials about CODECs and file formats. File format is sometimes called wrapper (or container) file specification as such defines how data are organized inside of file. This structure usually allows to embed metadata and use various CODECs. In some cases mentioned structure is suited for particular compression-decompression algorithm. Visible indicator of file type is its extension i.e. WAV, MP3, OGG. In part devoted to digital image anatomy it was mentioned that compression can be lossy or lossless. When lossless compression is used size of the file will be reduced and all the details would be preserved after decompression. Lossy compression may cause that some information will be lost during the compression. Lossy compression algorithms are usually more efficient in terms of reducing the file size and that is the reason why they are so widely used. The most renowned audio CODECs are: Linear Pulse Code Modulation (LPCM) - lossless, Free Lossless Audio Codec (FLAC)- lossless, Windows Media Audio (WMA) - lossy MPEG-3 - lossy OGG Vorbis - lossy As you saw in previous part about choosing format for long-term preservation whole album compressed using FLAC CODEC maybe much larger than the same album compressed using MP3 format. This is why in general lossless CODECs are not used for online delivery. The most widely used format is a compression standard is MP3, there are more efficient CODECs but MP3 is supported by all the available tools i.e. web browsers. If there are no other requirements MP3 should be the right choice. Suggested solutions Compression is important but size of an audio file depends from audio parameters described in part dedicated to digital audio anatomy. These parameters determine audio quality, as you know the higher quality the bigger file size. Audio settings depends on the type of material and it can be different for: spoken word recordings simple recordings without any important background noises i.e. oral history sample rate at 44.1kHz, bit depth at 16bit, encoded as MP3 with bit rate at 96 Kbps, music For music you can start with CD-quality which is: sample rate at 44.1kHz, bit depth at 24 bit, with bit rates ranging from 128 kbps to 168 kbps encoded as MP3. You may consider publication of several versions of one audio file - for normal users (as presented above), for users with very limited Internet connection (with lower bit rates) or audiophile (very high bit rates i.e. 192Kbps or even encoded using lossless CODECs like FLAC). Choosing a web delivery format for digital video Web video standards is a very dynamic field which is intensively developed by various companies including giants like Google, Microsoft and Apple. Recommended three formats include Flash Video (.flv), Windows Media Video (.wmv) and MPEG-4 compliant CODECS. Flash Video Flash Video (.flv) is almost ubiquitous. It is used by Youtube.com portal. FLV does not use the most modern CODECs and it is possible to get better compression-quality ratio with other solution. The biggest advantage of Flash Video is that it is installed on virtually any computer in the world. That’s why FLV seems to be a good solution to assure high accessibility of your content. Windows Media Video Windows Media Video was developed by Microsoft and it is considered as a main competitor of Flash Video and MPEG originated formats. It offers a very good compression ratio, videos can be created using free tools like Windows Movie Maker. Its support is not limited to Windows platform. WMV supports Digital Rights Management which allows to protect video content from copyright infringement. MPEG-4 Last but certainly not least contender in this race is MPEG-4 (.mp4). MP4 features set of standards which includes description of highly efficient audio-video CODECs like H.264 (aka AVC). To deals well with High Definition video. It is also widely supported i.e. it can be played using existing Flash-based players. In the near future all modern browser would be able to play MP4 content without installation of additional plugins. Playing MP4 file may be quite computationaly demanding so it excludes older computers. Despite of that this format is suitable for mobilde devices. Most of modern handsets and netbooks may have a hardware support for decoding of MP4 content. Which format to choose? In general the choise is not simple but in most cases Flash Video is still the most accessible solution. This may change in the near future with further evolution of WWW and adoption of HTML 5.0 but at the moment FLV seems to be the right choice. There are multiple solutions which allows to create FLV video you will learn about them later in this chapter.As for choosing the resolution it depends from the type of the content which will be delivered. In terms of: recordings from the lectures and presentations, interviews, news stories you may: limit the resolution to 320x240 pixels you may use bit rates from 276kbps to 386 kbps movies, music videos or in general content which visual layer is as important as the rest of intellectual content. You should consider publishing two versions of video in order to expose visual features of video and make it accessible for users with slower bandwidth. Resolution - Similar to original one Bit rate at 700kbps or higher How web delivery works? There are in general three main mechanisms which allow to serve audio-video content over the web: simple link to a file in this case video or audio is available for download at general purpose web server. You (or digital library software) will provide a link to that file. Users will be able to get the whole file and after successful download he or she would be able to view the movie or listen to a song. This is the simplest solution but it is not very attractive and useful for digital library users. In this scenario a copy of resource is saved at user's hard disk. progressive download In this case user sees a video embedded in the website (see Figure 2) - it is possible to start or pause movie/song. With progressive download user doesn't have to wait till the end of download to play with content. This is much more pleasant solution, although it may require some additional software to be installed at users computer i.e. Flash player. streaming The last and the most advanced delivery scenario. Audio or video is streamed to the user. What does it mean? It means that only a small part of movie/song is sent to a user's computer. User does not download the whole file, but they can play with content almost instantly. Exactly the same as with progressive download on site player do allow users to start/stop playback. In this scenario a copy of resource is not saved at user's hard disk. Streaming allows to broadcast live events, to transmit video directly from recording devices to the Internet. How to prepare audio for online publication? Audio files must be post-processed before you prepare web delivery version. First of all, sound may need cutting, for example removing silence at the beginning and at the end of a recording. Besides the sound may require additional operations, such as normalizing, noise removal, etc. In this example you will see how to remove the silence at the beginning and at the end of the sound. We use the most popular audio editor – Audacity ( It is free, open source software available for Microsoft Windows, GNU/Linux, Mac OS X and other operating systems. How to convert digital audio files? This archive version will be used to prepare web delivery version in mp3 format by using LAME encoder. As you can read at the LAME home page, „LAME is a high quality MPEG Audio Layer III (MP3) encoder licensed under the LGPL. ”. LAME is distributed as command line tool. In addition to console tool LAME is supported by many programs, usually with a graphic user interface. Before you start conversion to mp3 format, here is the basic information about the mp3 encoding modes: Constant Bitrate (CBR) – default encoding mode, bitrate is the same for the whole file, useful for streaming, not optimal for storage Average Bitrate (ABR) – average amount of data per second, higher bitrate for the parts that needs more bits, higher quality than CBR Variable Bitrate (VBR) – bitrate varies depending on the requirement, preferred for storage How to add metadata to the media file? Audio files allow you to store metadata about its contents such as title, artist, year, and other information. This metadata is stored in the audio file by tags. ID3 is the most popular tag format used in MP3 audio files. There are two unrelated versions of ID3: ID3v1 I ID3v2. ID3v1 is an older format that allows you to store a few text tags 30 characters long. ID3v2 is a newer format which has no limit on length of text tags. In addition, it allows you to store links, lyrics and images. ID3 tags are supported by many software and hardware music players. How to publish audio on the web? As you know from the lesson How web delivery works?, there are in general three main mechanisms which allow to serve audio-video content over the web: streaming. Here are the ways of serving audio files in several systems/digital libraries: DSpace. An audio file in mp3 format is served as simple link to a file. An example form DSpace at Cambridge: dLibra. User select a way of serving Mp3 file. Audio content can be handled by a web browser (usually by downloading a file) or by an embedded Flash player – progressive download. An example from Digital Library of Wielkopolska: Example of embedded audio players from other systems: MUSIQUE CONTEMPORAINE, Médiathèque Valais, Ina FR, The Memory of the Netherlands Project. Audio content streaming using Microsoft Media Server. An example: Video content, just like audio content, may require post-processing before you use it to prepare web delivery version. You may want to remove fragment from the beginning and/or the end of video file or split whole video into several parts. In this lesson toy will see how to remove fragments from the beginning and the end. In this order we will use VirtualDub, a video capture/processing utility for Windows platforms licensed under the GNU General Public License. How to convert digital video between formats? In this lesson you will see how to prepare web delivery version of video using ffmpeg and WinFF. ffmpeg is a command line tool for converting multimedia file between formats. It is one of several components of the FFmpeg project, a free, cross-platform software licensed under the LGPL/GPL. WinFF is a Graphical User Interface (GUI) for ffmpeg. It is free software published under the GPL. WinFF is available for Windows and Linux. video bitrate – 200 kb/s, frame rate – 25, audio sampling frequency Hz and audio bit-rate 64 kb/s. These are options for basic parameters: -b bitrate - the video bitrate in bit/s -r fps - frame rate -s size - frame size -aspect aspect - aspect ratio -ar freq - the audio sampling frequency -ab bitrate - the audio bitrate in bit/s -ac channels - the number of audio channels. To set frame rate to 25, frame size to 320x240 pixels, bitrate to 300kb/s, number of audio channels to 1, audio sampling frequency to Hz and audio bitrate to 56 kb/s run command: ffmpeg -i CC_1915_03_01_TheChampion.avi -r 25 -s 320x240 -b 300kb -ac 1 -ar ab 56kb CC_1915_03_01_TheChampion.flv How to publish video on the web? Publishing video content does not differ significantly from publishing audio content and other digital objects. However, the video file format and method of displaying the file depend on the system where it will be published. Below there are examples of three main mechanisms that allow to server video content over the web: Institut National de l'Audiovisuel (Ina FR), example, The Tibetan & Himalayan Library, Médiathèque Valais, Video Archive Project, Mediateca de la Universidad de Oviedo, Médiathèque de la Cité de la musique,

124 Heykel/anıt ve diğer 3 boyutlu nesneler nasıl dijitalleştirilir ve web'de sunulmak üzere hazırlanır?
3B nesnelerin dijitalleştirilmesine ilişkin temel yaklaşımlar, 3B dijitalleştirmenin orijinal nesnenin korunmasında oynayabileceği rol, 3B nesnenin dijital ortama aktarılması, arşiv ve web sunum versiyonlarının hazırlanarak web üzerinde kullanıma sunulması, hakkında bilgiler edindik. Why digitise in 3D? Precise, well prepare 3D model of the object may be used for various purposes, including: Documentation and research Object can be sliced, zoomed and sent to some distant location for analysis all this without moving original exhibit. Reconstruction Either to reconstruct missing parts of the object or to create physical duplicates (for commercial or safety purposes). Web presentation, virtual exhibitions Creation of the virtual exhibition can be a very good for attracting potential visitors to come the museum. It is also possible to arrange virtual exhibitions presenting objects which would never be presented together. Transportation packaging Thanks to 3D models it is possible to create dedicated forms which would assure that object would be securely moved from one location into another. Deformation measurement Precise scans of the surface of the painting are very helpful in the conservation. Geometry-based models Geometry-based models can be also referred as a real 3D models. Geometry-based models can very accurately copy features of the original object, this has its price, precise, complete 3D models will occupy quite significant hard disk space. Such a model is usually very interactive, users can rotate, it can be zoomed in to see details. 3D objects can be placed in virtual worlds among other 3D models, they can be organized into virtual exhibitions. On top of data kept in geometry-based models it should be possible to create reconstruction of given object. Which might be essential if original object would be destroyed. It is hard to achieve exact reconstruction by using image-based models so it is a huge advantage of this approach. Apart from lack of out-of-the-box support for 3D formats in web browsers the biggest disadvantage of geometry-based models is that creation of such a model is very expensive, sometimes even impossible. Preparation of a good model require usage of dedicated equipment like 3D digitizers/scanners which are still relatively hard to obtain. Image-based presentations Image-based solutions employ completely different philosophy, the aim is to create a presentation of 3D object by using flat snapshots. The simplest solution here is to combine a set of pictures showing given object from various angles. This allow users to zoom in and see details of the particular shot, or to look at given object from different perspective by choosing different shot. As you see these methods require a number of shots for a given object. Pictures usually need to intersect in order to stitch them together. This idea is well-known in digital photography and is used to create a panorama pictures. There are multiple variants and tools used to create such a presentations including: simple HTML galleries, Adobe Flash - require a browser plugin, Microsoft Silverlight-based Photosynths (require a browser plugin). The process of creation of such a presentation requires several steps: take the shots of the object, choose the most accurate ones, assemble objects presentation sometimes it may require using a dedicated tool which will transform your pictures into web ready presentation, put presentation online. If you decide to use this approach you should remember about preservation of original set of pictures. There is also one more form of presentation which is in fact image-based but it offers a very limited interaction possibilities for users. In fact every three dimensional object can be digitised using a video camera. Video can show an object from various angles and different close ups it is also possible to publish a set of videos which are showing various aspects of preserved object. Image-based solutions are rather object presentations than models, it would be hard to accurately reconstruct original object on top of such a presentation. How does 3D digitizers work? “a 3D scanner is a device that analyzes a real-world object or environment to collect data on its shape and possibly its appearance (i.e. color). The collected data can then be used to construct digital, three dimensional models useful for a wide variety of applications” 3D scanning device outputs a cloud of points which can be used to create a 3D model of object shape. There are different types of 3D scanners which are using different techniques to gather data about object shape. Some scanners require to have a contact (contact) with scanned surface other can scan object even when placed 1km from the object (non-contact). Contact scanners are very slow and since they require to touch scanned surface they may damage or change scanned surface. From the cultural heritage perspective it is much better to use non-contact digitizers (as some people say about scanners). These category of tools can be divided into two categories: active scanners they emit some kind of signal and detects its reflection and distortions in order to probe given surface. passive scanners this group of devices do not emit any signals, instead they are detecting ambient radiation such as reflected visible light or infrared. In most cases these solutions should be cheaper than active scanners because they require only a digital camera. Among many different kinds of scanners non-contact 3D scanners are the most accurate for cultural heritage objects. Both active and passive scanners can use different techniques in order to create 3D model. When using (or building) active scanner it is required to have source of signal and a tool which is capable to record data about reflected signal. In the simplest possible set up, you may use web cam and laser pointer. This tools can be used to build a simple 3D scanner, there are affordable tools which allow you to that. DAVID laser scanner is one of the examples of such a solutions. In case of most of the scanned objects it is impossible to capture the shape of object at once, so multiple scans will be required. Results of these scans should be than merged into one model using appropriate software like MeshLab. Three dimensional models can be also created using passive scanning i.e. using simple digital video camera. ProFORMA – an experimental software created at University of Cambridge, can capture a 3D object model based on the input from digital video camera (it is a passive scanner). How to choose archival format for 3D objects? According to Minerva "Technical Guidelines for Digital Cultural Content Creation Programmes" most of the 3D scanners are producing data in a proprietary formats. Most of the 3D processing software supports proprietary Autodesk Drawing (.dwg) file format. There is also an exchange format (.dxf) created by Autodesk vendor, this format has open specification so it seems that it is better suited for archival usage. As you know in terms of archival formats you should use open file types whenever possible. There are two important standards in the field, first is a X3D (Extensible 3D Graphics, a successor of VRML) which is an ISO standard created to store rich virtual reality models. This can be used not only to create virtual models but also to combine them in virtual exhibitions. Apart from X3D there is also format called COLLADA (COLLAborative Design Activity) which defines an open standard for exchanging 3D files between 3D software application. COLLADA is used by all major application used to work with 3D objects. To summarize Minerva "Technical Guidelines for Digital Cultural Content Creation Programmes" states that: projects may choose to store 3D data using the proprietary dxf ("Drawing Exchange Format"), virtual Reality models should be created using the X3D format, projects may use COLLADA with X3D to develop 3D applications. As for image-based 3D object presentation the best way is to archive original picture set which should be in line with archival requirements for images. What is important when proprietary file format is used to archive digital object? Cevabınız : You need to ensure that there are tools which allow for migration. Yes, migration path is very important. How to deliver 3D models over the web? As virtual worlds like Second Life are becoming more and more popular delivery of the 3D objects over the web should be easier. Web delivery of geometry-based 3D models is something completely different than putting online image-based presentations. Objects stored in X3D require an additional web browser plugins (like Cortona3D or SwirlX3D) to be displayed properly. Nevertheless creation of models using X3D seems to be the best solution at the moment. Mentioned plugins allows to watch and interact with 3D models in a very pleasant way. There are two alternative solutions described in Minerva "Technical Guidelines for Digital Cultural Content Creation Programmes": Preparation of the video presentation showing how 3D model looks like by showing it from various angles and distances. In this case user needs to have a capable video player installed on his computer, there is no necessity to install X3D plugins. You may also consider to use such a video presentations next to the X3D based model. It is also possible to use managed 3D virtual worlds i.e. Second Life (SL), there are many institutions which decide to create a 3D copy of some of their resources in SL. Managed virtual worlds may offer additional features which allows users for rich interaction. How to create object presentation using Photosynth? Microsoft Photosynth is a service developed at Microsoft Labs in cooperation with University of Washington. It analyzes digital photography and generates a 3D model of photos and a point cloud. Photosynth allows also to publish huge panorama pictures. What is the difference between panorama pictures and photosynths? In a nutshell both create a 3D-like impression, but panorama pictures allows user only to move around one central point and to zoom in/out in order to see more details. Photosynths are different, it creates a real 3D model and allows you to move around in any direction. Degree of freedom depends on the amount of pictures which are building given Photosynth, the more pictures of object/place you will prepare the bigger interactivity and precision of the model. Both forms require massive amount of pictures and you have to decide on your own which of them is more accurate for you. When dealing with Microsoft technologies you need to remember that in most cases these tools are working only with Windows systems (no Mac, no Linux). Another disadvantage of this solution is that there are no free tools which allow you to host Photosynths on your server you need to use Microsoft’s portal. Nevertheless Photosynth’s capabilities are quite impressive you may decide to use then side by side with other forms of presentation. How to create object presentation using HTML and Javascript? You just need to: make a few pictures of your exhibit from different angles (this solution does not support zooming) prepare them for web delivery as any other pictures paste the names of the files into template of the HTML page copy HTML page plus pictures into web server or publish them in the digital library Template HTML page is just an example there are endless possibilities which allows you to embed such an object presentation inside of any website. This example uses a tool called JQuery supported by some additional tools developed by Mathieu Dumais-Savard. Both of them are free and open source so you can use them in your development. Why HTML + Javascript galleries are more accessible for users? Because HTML and Javascript are supported by any web browser.

125 Dijital Ana Kopya nedir ve neden bu kadar önemlidir?
Dijital ana kopya, tarama işlemi sırasında yaratılan orijinal dosyadır. Tarama işleminin mümkün olduğunca az yapılması gerektiğinden, dijital ana kopya mümkün olan en üst düzeyde detay göstermelidir. Detay düzeyi ya da dijital bilginin miktarı, dosyanın boyutu ile doğrudan ilgilidir.

126 Dijital Ana Kopya nedir ve neden bu kadar önemlidir? (devam)
Dosya boyutu tarama parametrelerine bağlıdır: 300 DPI çözünürlükle kayıpsız sıkıştırılmış bir TIFF görüntüsü 40MB’tan fazla yer tutabilir. Standart TV kalitesinde (25 kare/dk.), 720x576 pixel çözünürlüğündeki bir saatlik sıkıştırılmamış video, 93 GB yer kaplar.

127 Dijital Ana Kopya nedir ve neden bu kadar önemlidir? (devam)
Ya dijital doğmuş materyaller? Dijital ana kopya kavramı dijital doğmuş materyaller için de geçerlidir. Bu kavram dijital metinleri, grafikleri, dijital ses kayıtlarını ve dijital videoları kapsar.

128 Uzun süreli dijital koruma
Uzun süreli dijital koruma; dijitalleştirme ve dijital kütüphanelerle ilgili çeşitli kavramları da beraberinde getirir. Aynen analog nesnelerde olduğu gibi dijital içerik de çeşitli tehditler altındadır. Bunlar; Formatın eskimesi, Taşıyıcının bozulması, Taşıyıcının eskimesi, Nesnenin entelektüel içeriğini düzgün biçimde yorumlamak için yeterli bilginin bulunmaması, Kurumsal sürdürülebilirliğin zarar görmesi. Uzun süreli koruma basit bir sorun değildir. Dijitalleştirme iş akışının tüm süreçleri içerisinde bu tehditlerin tamamının göz önünde bulundurulması gerekir. Exactly the same as analogue objects, digital content is exposed to various threats, including: Format obsolescence, Which is associated with lack of software which is capable to display the content of given file properly. Data are imprisoned in the unsupported file format. Physical deterioration of the carrier, If copy of a digital object is stored on a DVD disc if this disc would be scratched it may have terrible impact on accessing the content of the object. Carrier obsolescence Exactly the same as with file format obsolescence also a carrier may become unreadable because of the lack of appropriate hardware. Do you remember a 3.5 inch floppy disks? Availability of hardware which is able to read its content is very limited. Lack of information to properly interpret the intellectual content of the object, Over the time the knowledge about interpretation of information in given object may disappear. Imagine a picture showing a building which does not exist anymore over the time knowledge about how its existence may vanish and it would be impossible to identify the content of that particular picture. Institutional sustainability If institution or company which is driving given repository would bankrupt what would happen with its digital assets? Which concepts related to digitisation workflow are relevant in terms of long term preservation? (choose the most accurate answer) Cevabınız : Virtually all aspects including standards, file formats and metadata Yes, long term preservation is a really complex problem.

129 Dijital ana kopyayı nerede saklamalı?
Fiziksel bir taşıyıcıda CD DLT (Dijital lineer bant) DVD Sabit disk USB harici sabit disk 3,5 inch sabit disk Storing on a physical carrier There multiple carriers which might be used to store big amounts of data. According to already mentioned "Digital Preservation Management" tutorial CD-R and DLT (Digital linear tapes) were marked as the best possible solution for storing digital masters. This selection was based on a comparison of given carrier in the context of factors like longevity, capacity, viability, obsolescence and cost. This comparison didn’t cover a solid state drives and ordinary hard disks which are known as a very comfortable, relatively cheap way archive digital content but may require careful maintenance. Storing on physical carriers requires constant attention, some studies performed at National Institute of Standards and Technology (NIST) [source] estimates that DVD-R should be readable for 30 years (assuming storing in 25°C with 50% relative humidity). As you see when storing data on optical discs like CDs or DVDs you should remember that they will require refreshment after some time. Apart from this you also need to remember about proper handling and storing (i.e. don’t stack CDs) in a safe dry place. Each disc needs to be properly described in order to ensure that you will be able to find given resource when it will be needed. As was said Digital linear tapes are also very efficient way to store data. They are used mainly in large data centres apart from buying a carrier itself you need to possess an appropriate device which would allow you to read and write data onto the tape. CD and DVD recorder and drives are very common and usually there is no need to buy them especially for the purpose of storing digital masters. It is hard to imagine that such a device would be usable in the small memory institution with limited resources and very few or none IT staff. Another solution is to store data on hard disk, the alternative for traditional hard disks are solid state drives but they are still very expensive. Hard disks are more spacious than optical disks and offers easier access to the data. External hard disk which can be connected to the computer easily using USB plug are affordable and quite fast. Apart from USB external hard disks there also traditional 3,5 inch hard disks which are cheaper and can be plugged directly into computer’s hard disk controller. Whatever you will choose you should remember: choose reputable brands because this is a decent guarantee of quality, media should be handled properly and in accordance with the suppliers’ instructions.

130 Dijital ana kopyayı nerede saklamalı? (devam)
Depolama hizmet alımı Ulusal veri depoları Çevrimiçi yedekleme hizmetleri Basit depolama hizmetleri Bu hizmetlerden biri kullanılarak; depolamayla ilgili oluşabilecek hasar görme, veri kaybına yol açacak kazalar, vb. sorunların oluşması engellenebilir. Storage outsourcing You may decide to store your data on physical carriers, create a carrier magazine in your institution and keep all the optical or hard discs there. In previous part it was mentioned that sometimes one copy may be not enough. If you decide that an additional copy of resources should be made or you don’t want to cope with storing a few hundred/thousands of optical disks you may decide to store your data in a remote/external data centre or ask bigger institution for help. Storage hardware is very affordable and so are the online storage services, there are various types of such a facilities: national data warehouses, online backup services and simple storage services. By using such an external providers you can avoiding all the storage related problems like carrier refreshment, possible damages and accidents leading to the loss of data. If you want to use online storage you need to remember about capacity of your network. Some companies which provides such a facility are able to receive your data on a physical carrier, so you can send a bunch of DVDs by the means of traditional mail. National data warehouses may provide a free storage for some groups of national institutions these facilities are usually properly secured against various accidents and technical threats. There are also a numerous online backup services which offers dedicated software which takes care of synchronisation between hard disk of your computer and its copy online. Different vendors may offer various conditions i.e. fixed amount of data, or fixed amount of computers which would be backed up. Apart from services like those described above you may also buy a simple online storage accessible through standard protocols like FTP or HTTP. In case of commercial services most likely you will be able to test service before buying. It is a good opportunity to check whether tools offered by commercial vendor are fitting into your needs. In case of using external storage providers you safety of your data depends only on stability of your funding. If your institution does not have money and expertise to use any of the solutions described above you should try to establish a cooperation with some bigger institution i.e. regional library, major academic library, high performance computing centre.

131 Dijital ana kopyayı nerede saklamalı? (devam)
Checksum dosyası Checksum; dosya içeriğinin analizi üstüne oluşturulan bir tür dosya tanımlayıcısıdır yani kontrol dosyasıdır. Checksum algoritmaları içeriğin değiştirilip değiştirilmediğini kontrol eder. Yararı nedir? Fiziksel taşıyıcılar hasar görebilir. Bunun sonucunda bazı veriler kaybolabilir , bozulabilir ya da değişebilir. Eğer dijital ana kopyanın yanına bir checksum dosyası kurulursa, en azından ana kopyanın hala okunabilir ve doğru olup olmadığı anlaşılır.

132 Arşiv biçimi nasıl seçilir?
Arşiv biçimini karakterize etmesi gereken temel özellikler Açık ve yaygın şekilde kullanılan standartlar Güçlü, sağlıklı Esnek Platform bağımsız Metadata yerleştirmeye elverişli Dönüştürme mekanizmaları mevcut Hataları tespit etme ve bozulmuş dosyaları onarma mekanizmaları mevcut. Suggested archival formats and parameters Still images Suggestion below are coming from the Library of Congress technical document [source] "Technical Standards for Digital Conversion of Text and Graphic Materials". Printed text: books w/illustrations, pamphlets, typed pages, newspapers for an image of text: 300 ppi minimum, 8-bit grayscale for OCR: 400 ppi, Music: sheet music, annotated scores, music manuscripts: Access to content: 8-bit grayscale or 24-bit color should be used where color is an important attribute of the document Recognition of artifactual features: Manuscripts: handwritten, typewritten copies Maps: printed tones printed color up to D-size 22" x 34" Content Research: 24-bit colour 250 ppi minimum - ppi depends on the map size, particularly when map sections must be stitched together and map filesize increases to 500 MBs and more, Map reproduction: Photographs: continuous tone, color Reproduction: you should use maximal resolution available for given device Graphic Arts: Limited tone originals, Continuous tone Color 24-bit colour minimum you should use maximal resolution available for given device, Rare Books: Objects of High Artifactual Value 400 ppi minimum, Research on artifactual features: 600 ppi minimum, TIFF stands from Tagged Image File Format it is widely used (first version of specification was issued in 1986), flexible and adaptable. TIFF can hold image data in both compressed and uncompressed format, when it comes to compression both lossy and lossless algorithms can be used. Digital masters of still images are usually stored as TIFF 6.0 files or JPEG2000 with lossless compression. JPEG2000 is an image compression standard and coding system developed by Joint Photographic Experts Group committee in It has quite a few pretty impressive features, among them you should know about: It has built-in mechanisms for fixing bit errors introduced by noisy communication channels. Both lossless and lossy compression can be used Exactly the same as TIFF it has a support for embedded metadata. One file can hold version of one image in different resolutions Both files formats seems to good for digital masters, at the moment of writing JPEG 2000 is still quite new in comparison to TIFF. That last is in fact a much simpler file format then JPEG 2000, these arguments suggests that TIFF maybe slightly better choice. Yes, that is true. Cevabınız : JPEG 2000 Which format allows to store multiple resolution of the same image in one file? Textual content After obtaining still images and performing OCR of the textual content you need to decide how (and what) to store as a digital master copy of a textual object. Because text character recognition is also a very time consuming and expensive activity so it is also worth to preserve not only original images obtained from scanning device but also results of the OCR. There are two ways of doing so: Simplest solution is to place a text file next to each image, text file should be encoded using UTF-8. This possibility can be used only when text presented on the image has simple layout and there are no more advanced formatting. OCR engines apart from text itself outputs also information about coordinates of text on the page. This information should be preserved but such a simple format does not give such a possibility. OCR engines like ABBYY Finereader allows to export results of OCR in OCR XML output, this can be converted to open standards like TEI P5 or TEI Lite markup. You can also preserve this XML next to each page. Another solution is to use a standardised PDF/A file which can contain both text and original images as they were created (in TIFF or JPEG2000). Most of the existing OCR tools allows to save results of OCR as a PDF file so it should be quite straightforward to use this solution. Audio and video content In general you should preserve audio and video as it comes from recording device, digital master copy of such a raw data can be encoded using proprietary format. In some cases conversion to open format may be impossible (it will cause loss of quality) in such a situation you should consider storing an appropriate software package next to digital master files. In terms of both audio and video recommendation are based on "MINERVA Technical Guidelines for Digital Cultural Content Creation Programmes" [source]. For audio you should use WAV or AIFF formats with at least 24 bit depth per channel (all channels should be preserved) sampled at least using 48/96 KHz. If file size would become a problem you may use lossless compression algorithms like FLAC or LPCM. Where possible video should be stored in raw AVI format, without the use of any codec, at an original frame size, with a frame rate of 25 frames per second, using 24-bit colour. Yes, that might be the case. Cevabınız : Nothing cannot be done, you should leave a file as it is, this is your digital master copy. You can archive proprietary software package next to the video file. Some digital cameras store the results of recording in proprietary file format which uses lossy compression, what should you do after obtaining such an record from the camera? File naming conventions Usually you don’t pay much attention to file naming, but when it comes to moving files from environment to another file names become very important. In modern operating systems you can give virtually any name to the file. But different operating systems are using different ways to encode things like whitespaces, non Latin letters and names longer than 8 characters. So using any of these may cause some problems when file is transferred across the network [source]. There is an ISO standard ISO 9660 which defines file system for optical discs. It aims at supporting different computer systems so the data may be exchanged. In a nutshell this standard uses 8.3 naming standard. This means that file name consist of name (at most 8 letters), dot and extension (at most 3 letters). Both name and the extension shouldn’t contain any punctuation (i.e. \,/,:,?,”,<>), because some signs may have special meaning in particular operating systems. Whitespaces should not be used, it is possible to replaced them by using hyphens or underscores. You should only use Latin letters in both name and extension. You should avoid situation in which file extension is not provided, extension should inform about file format. This information is important for users who will be able to view the content of given file. Yes, you must not use non Latin characters and whitespaces in file names. Cevabınız : łukasz.png, scan from yesterday.jpg Which file names are not compliant with 8.3 standard? Lesson summary Digital masters (DM) is the most precious artefact in the whole digitisation workflow, all other digital versions can be derived from this original digital version of the object. The term digital master is used to denote both a particular file or set of file which are a part of original digital copy. DM should be stored next to metadata which would help the user to access and understand an intellectual content of the object. In case of textual objects you should also preserve results of OCR because it is also a time consuming process. Digital master copy is crucial for long term preservation, a fully documented package which contain all the resources related to digital copy of original object significantly simplify access to original intellectual content. As digital master copies can occupy significant amount of hard disk space sooner or later you will face storage problems. Digital masters can be stored using various means i.e. optical or hard disks, digital linear tapes. You can also decide that you want to rent an online storage or pay for automated backup services which will synchronize data on your hard disk with a remote online storage. If none of these solution works for you, you can always ask for help of a bigger institution. You have to remember about the fact that one copy of a digital master does not guarantee that your resources would be safe. So it is worth to remember that lots of copies keep stuff save. If it is possible you should also have a backup of you data. When creating a copies of digital masters you may consider creation of checksums for all your files, this is very useful for content consistency verification. Last but not least – file names are important! Following 8.3 standard should guarantee that your files would be interoperable. As digital masters should be available in long period of time you should take care of using choosing proper file format. In this lesson you have read some suggestions about file formats and parameters of digital master images, textual content as well as audio and video. Lossless compression is a way to reduce the size of file. But you have to remember that it complicates reading the content from the file. Exactly as with file format the compression algorithm needs to be open and widely used, thanks to this it should not cause any problems with accessibility.

133 * Bir nesne dijital bir kütüphanede nasıl yayımlanır?
Dijital kütüphane yazılım platformları Ücretsiz yazılımlar Dspace Greenstone Eprints Paralı yazılımlar VTLS Vital ExLibris DigiTool dLibra

134 Internet'te dijital nesneler nasıl tanıtılır?
Dijital nesneler neden tanıtılmalı? Dijitalleştirme sürecinin tüm aşamaları en iyi yöntemlerle yürütülse bile beklenen sonuçlar elde edilemeyebilir. Dijital nesnelerin dijital kütüphanede yayımlanması, birilerinin onları bulup okuduğu anlamına gelmez. Dijital nesneler nasıl tanıtılmalı? Internet üzerinde pazarlama; ucuz ve etkili olması nedeniyle bunun için ideal bir yoldur.

135 Dijital kütüphane tanıtımı
Web sayfası, dijital kütüphanenin, kullanıcıların en çok etkileşimde bulundukları bölümüdür. Web sayfasının dikkat çekmesi için karşılanması gereken önemli gereksinimler; Arama motorunun getirdiği sonuçlarda ilk sıralarda yer almak, Okuyucuların siteyi hemen her gün ziyaret etmesi için nedenlerinin olması, Ödüllü anket, Ekran koruyucu ve duvar kağıdı gibi dijital hediyeler, İngilizce ana sayfa. Promoting digital library Promotion of digital objects can be started indirectly by promoting the digital library where objects are available. After all the user who visit digital library will be close to digital objects. This section presents methods of promoting a digital library. Website is the part of the digital library that users most interact with. You should ensure good quality of this element first and foremost. According to researches led by J. Nielsen: “People rarely read Web pages word by word; instead, they scan the page, picking out individual words and sentences”. How do people read websites? 79 percent of test users always scanned any new page they came across; only 16 percent read word-by-word. This means that users can skip many parts of a webpage. At first the web page may influence user only by graphics and page layout. In the next stage user familiarize himself with moving around the webpage and reaching the information. The last stage of familiarizing with the website is contact with the web page content. You can see how important this first two stages are and without them information have no chance come into being. For that reason you should take care of well thought out navigation and attractive presentation of important content. The website of digital library should be aesthetic and since it fulfil an informational and educational function thus it is inadvisable using excessive colours, graphics and animations which may distract the user.

136 * Dijital kütüphane tanıtımı – SEO
SEM – Search Engine Marketing SEO – Search Engine Optimization It is possible that the title and meta-description is created automatically for some pages in your digital library. It depends on the digital library software you use. But perhaps you could define your own keywords. Check software documentation for more information. One of the most important factors for determining website's search engine ranking is number of incoming links that website has. Generally, the more links points to your website the higher rank it has in search result. What you can do to increase the number of incoming links pointing to your site? First, use the web directories. These are free services that allow to add add your site to directory of websites. Another way to increase the popularity of the website is to exchange links between websites. The most important are the links from the pages that have a high popularity and similar in term of subject. Start with the exchange of links to web sites of the institutions which contribute to the digital library. Put links to your the digital library web page on the website of your local library / museum / archive. What next? Make sure that the website has a sitemap. A sitemap is a list of pages of a web site accessible to search engine bots or users. It can be a web page that list the pages on a web site organized in hierarchical fashion.

137 Dijital kütüphane tanıtımı - topluluklar
Çevrimiçi topluluklar; Tartışma grupları Elektronik posta listeleri İnternet forumları Internet Relay Chat (IRC) Çevrimiçi sohbet Web portalları Bloglar

138 Kullanıcılara dijital nesne sağlama
Dijital nesneler dijital kütüphanenin web sayfasında nasıl tanıtılır? (dijital kütüphaneyi düzenli ziyaret eden kullanıcılar için) Yeni eklenen nesnelerin listesi Tavsiye edilen nesnelerin listesi En çok görüntülenen nesnelerin listesi En yüksek oy alan nesnelerin listesi Providing users with digital objects Apart from branding of digital library you should ensure adequate promotion of digital objects. There are many activities aimed at promotion of the objects. Depending on the place of promotion we can distinguish promoting on the digital library website and outside this site. There is also a difference between providing resources to user and allowing to search objects. This chapter describes methods of notifying user about resources. On the one hand it is important to appropriately present content of digital library to the user when he enter the website. On the other hand we want to attract the user even if he never visit digital library web page or if he do not visit it regularly. Promotion of objects on the digital library web page is based on the principles described in the previous chapter. Lists with recently added items is a very good example of elements changing every day (assuming that new objects appear in digital library so often). Another form of news on the site may be a list of recommended objects. Library staff select objects worth to recommend and the user has access to interesting resources without having to search it. User community of digital library and internet traffic that is generated while browsing resources can be used to create select the most viewed and the best rates objects. List of the most viewed objects may have several versions depending on time period, for example, last 24 hours, last week or month. Of course, the popularity of object does not determine quality. You can allow users to rate objects in digital library. It is a good and commonly used method of objects promotion.

139 Kullanıcılara dijital nesne sağlama (devam)
Dijital nesneler dijital kütüphanenin web sayfasında nasıl tanıtılır? (dijital kütüphanedeki nesnelere ilgi duyan ancak sayfayı düzenli ziyaret etmeyen kullanıcılar için) Web besleme (RSS) E-posta gazeteleri The newsletter is a powerful marketing tool with various useful functions. It informs users about digital objects in your digital library and remind yours users about you. Rules for creating newsletter about digital objects may differ from general newsletter. News about new objects may be send more frequently than in general newsletter. It would be best to give user choice for frequency and content of notifications. A web feed (or news feed) is used for providing users with frequently updated content. Content distributors syndicate a web feed, thereby allowing users to subscribe to it. Making a collection of web feeds accessible in one spot is known as aggregation. The kinds of content delivered by a web feed are typically HTML (webpage content) or links to webpages and other kinds of digital media. Often when websites provide web feeds to notify users of content updates, they only include summaries in the web feed rather than the full content itself. The two main web feed formats are RSS and Atom. Web feeds have some advantages compared to receiving frequently published content via an Users do not disclose their address when subscribing to a feed Users do not have to send an unsubscribe request to stop receiving news. They simply remove the feed from their aggregator. The feed items are automatically sorted in that each feed URL has its own sets of entries A Feed Reader is required for using web feeds. This tool works like an automated program, but no address is needed. The user subscribes to a particular web feed and thereafter receives updated content each time updating takes place. News feed can be used in digital library primarily for notification of newly added digital objects. Feeds can be used to deliver information from whole collections or only particular one. Web feed are generated automatically by digital library software. Notifying users about the resources is addressed to users who have at least once visit digital library website. However, most users of the Internet have never gone to your website. They should have chance to come across digital objects outside digital library website. Common way of promoting digital objects on the Internet is placing links to these resources on websites. You can use websites of institutions that create the digital library, for example, local libraries or museums. Exchange of links to digital resources between friends is very powerful and effective method of promotion. This can be facilitated by providing the option of recommending, for example by . You can send a message to a friend about an interesting resource in digital library using option available at the website. An interesting idea would be the ability of users to view digital objects on web pages outside the digital library site. Embedding videos is one of the key features of YouTube, a video sharing website. Users do not have to go to the site to watch the video. As a matter of fact they may not even be aware of the existence of the site he is using. A similar idea can be used to promote resources of digital libraries.

140 Kullanıcılara dijital nesne sağlama (devam)
Dijital nesneler dijital kütüphanenin web sayfasında nasıl tanıtılır? (dijital kütüphane web sayfasını hiç ziyaret etmeyen kullanıcılar için) Başka web sayfalarında, dijital kütüphanedeki nesnelere bağlantı verilmesi, İnsanların arkadaşlarıyla dijital nesnelerin bağlantılarını paylaşmaları, Dijital kütüphane sayfasının dışındaki web sayfalarında dijital nesnelerin görüntülenebilmesi. Notifying users about the resources is addressed to users who have at least once visit digital library website. However, most users of the Internet have never gone to your website. They should have chance to come across digital objects outside digital library website. Common way of promoting digital objects on the Internet is placing links to these resources on websites. You can use websites of institutions that create the digital library, for example, local libraries or museums. Exchange of links to digital resources between friends is very powerful and effective method of promotion. This can be facilitated by providing the option of recommending, for example by . You can send a message to a friend about an interesting resource in digital library using option available at the website. An interesting idea would be the ability of users to view digital objects on web pages outside the digital library site. Embedding videos is one of the key features of YouTube, a video sharing website. Users do not have to go to the site to watch the video. As a matter of fact they may not even be aware of the existence of the site he is using. A similar idea can be used to promote resources of digital libraries.

141 Dijital nesnelerin aranması
Kullanıcılar, dijital kütüphanenin web sayfasından arama yapabilmeliler. Basit arama formu Sayfanın görünür bir yerinde olmalı. Gelişmiş arama formu Basit arama formunun yanında buna bir bağlantı olmalı. Arama dizinleri Başlık dizini Yazar dizini Anahtar sözcük dizini Searching digital objects Appropriate promotion of digital digital library creates a good brand, increases online visibility, attracts new users and keeps up existing group of users. Digital objects that may interest to user are delivered to users by various channels and methods. Just as in the traditional library users expect to have capabilities of finding resources. We can distinguish several search profiles. In the first case, the user knows exactly what they are looking, for example, he knows the title and author of the book. He may also want to all the books of the given author or all issues of newspaper for given year. In the second case user may know can't fully describe the object, for example, he knows only the author of the book but he doesn't remember the title. In the last case user isn't looking for any specific resource. He is looking for any object corresponding to his interest, for example, resources related to the history of the region of his origin. How to help users find resources? It's necessary to provide appropriate facilities for searching in places where users work. These are mainly standard tools for searching: search engines and search forms on the website's digital library. Besides this there are dedicated solutions dedicated to searching resources in digital libraries. Promoting digital library and providing users with information about resources requires a lot of work and number of various activities. It is slightly different in the case of searching facilities because most of the work is done automatically. How does typical Internet user searches for information on the web? He uses Google (search engine generally speaking). What do you need to make resources of digital library visible in search engine? Nothing. Popular system for building digital libraries designed to maximize the visibility of your resources on the Internet. If you use one of popular software package and your digital library is publicity available you can rest assured, users will easily find resources from your digital library. Digital library users should be able to search from digital library website. System for building digital libraries provide standard solutions such as: simple search form advanced search form search indexes. First of all simple search form must be located in obvious place. It must allow for a quick search by typing a query and submitting without changing any other parameters of the form. Next to a simple form there should be a link to an advanced search form. Another system that allows you to search objects is search index, for example, titles index, authors index, keywords index. Index is a lists of values of given attribute (e.g. title) in alphabetical order. It resemble index card catalogue in real libraries. Search forms and indexes operate fully automatically.After adding a new object into the digital library indexes are automatically updated and you can search new object using the search forms. An interesting feature available on many websites is a search plugin. It provides the ability to access a search engine from a web browser, without having to go to the engine's website first. Such plugins are available in systems for building digital libraries. Lesson summary Publishing digital objects in digital library doesn't mean that someone find and read them. There's a need for a lot of actions to promote digital objects created during a long and laborious process. Marketing activities should begin by promoting digital library. This will contribute indirectly to the promotion of digital objects. A good brand of a digital library can be build using the general principles of promotion online services. These are primarily a good web site, creating user communities, contact with the users. Promotion don't need to be restricted to a particular digital library. It's worth to work at a good brand of all digital libraries. Joint promotion will have wider range of activities and will attract more users. Digital libraries providing access to resources of cultural heritage generally are not in competition with each because of uniqueness of resources. In addition to actions aimed at building a brand of digital library one should ensure appropriate presentation and visibility of digital objects on the digital library website and out of it. The objectives behind the digital library may not be achieved without promotion. But appropriate actions may attract users and help to achieve success.

142 Dijital kütüphane kullanıcı arayüzünün kullanılabilirliği nasıl test edilir?
The user has a goal to achieve. The user will not be analysing how your digital library system works. The user will not read manual of your digital library system. The user will try to achieve the goal choosing the first possible option and will resign after few failures. Good interface is effective in everyday work and easy to learn. For each element of the interface you have to decide what is better - simplicity or advanced features. Sometimes the best solution is to have both variants in separate and allow the user to switch between them.

143 Dijital kütüphane kullanıcı arayüzünün kullanılabilirliği nasıl test edilir? (devam)
The main page of the digital library should very straightforwardly inform the user what it the purpose of this website and how to start using it. But it should not be done by a long welcome message, but by the overall impression that site makes and by the functionality of its components. When preparing textual information for the user or requiring the user to answer a question, you should remember that the shorter the text is, the bigger chance is that it will be read and understood. It is enough to have 5 different users testing your website to detect up to 85% of potential usability problems. Just ask them to perform some tasks on your website and to think aloud while doing it, and observe them.

144 Dijital bir kütüphanenin bilgi erişim yetenekleri nasıl değerlendirilir?
Information retrieval basics Information retrieval can be defined as process, methods and procedures used to selectively recall recorded information from a file or data. methods or tools which are provided by the digital library to its end users. the functionality of the tools the usability of the tools the quality and quantity of data on which these tools operate

145 Dijital bir kütüphanenin bilgi erişim yetenekleri nasıl değerlendirilir? (devam)
Digital library information architecture On top of such architecture in most cases there is a structured set of collections. Structured in this context means that any collection can have sub-collections, allowing to design possibly large tree structures. The collections mechanism can be used to propose the end user several arrangements of the digital library content. For example two probably most popular uses of collections are: Thematic collections, grouping objects connected with some theme – often used in the cultural heritage digital libraries. Such collections can be based on the subject of digital objects, but can be also based on their type, language of content, etc. Collections reflecting the structure of organization(s) responsible for a digital library – often used in digital libraries used as institutional repositories. The order and regularity in the information architecture of your digital library bring benefits to its users. Therefore this architecture should be carefully designed and influenced by needs of your users and goals of your digital library, and not by rich software possibilities or ad hoc decisions.

146 Dijital bir kütüphanenin bilgi erişim yetenekleri nasıl değerlendirilir? (devam)
Searching and browsing - basic techniques of the digital library exploration Searching and browsing are two major techniques of a digital library exploration. The three important elements which should be considered in the context of the information retrieval during searching and browsing are: The possibilities provided by the digital library software The quality of the metadata, especially its coherence if it is developed by several editors The alignment between the language used to formulate the metadata and the language used by the end users in queries

147 Dijital bir kütüphanenin bilgi erişim yetenekleri nasıl değerlendirilir? (devam)
Analysis of a digital library effectiveness from the end user point of view The list of elements for a digital library analysis: Quality of collections Description of collection as a whole, including IPR and access rights Organization of resources Description of digital objects (metadata) Credibility, exactness User interface Service identity Functionality, including searching and index browsing Accessibility to the widest possible audience Service usability (…)

148 Dijital bir kütüphanenin bilgi erişim yetenekleri nasıl değerlendirilir? (devam)
Analysis of a digital library effectiveness from the end user point of view (devam) 3. Search possibilities and techniques Full –text search Possibility to search with different criteria and selection lists Possibility to use controlled vocabularies and indexes Possiblity to limit the query by different criteria Search techniques and text processing techniques Suggestions system Presentation of search results General information about search results Different options to display search results list, grouping, sorting Further limitation of search according to specified criteria Presentation of objects’ descriptions Possibility to save citation and search results Support for various file formats, availability of viewing tools Additional services Web 2.0 elements Features for registered users Availability of reports and statistics Other functions and services


"AccessIT Projesi Dijitalleştirme Uzaktan Eğitim Programı Ders Özeti" indir ppt

Benzer bir sunumlar


Google Reklamları