Bilgisayar Mühendisliği Bölümü

Slides:



Advertisements
Benzer bir sunumlar
Hayat Bilgisi Veritabanı Kullanarak Otomatik Cümle Üretimi
Advertisements

Ayrık Yapılar Algoritma Analizi.
ALPER LAÇİN SERDAR TAŞAN
KISA CEVAPLI TESTLER ve DOĞRU-YANLIŞ TESTLERİ
MORFOLOJİYE GİRİŞ.
LEKIN Ar. Gör. Pelin ALCAN.
Prof. Dr. Halil İbrahim Karakaş
Kümeler.
TBF Genel Matematik I DERS – 1 : Sayı Kümeleri ve Koordinatlar
Derleyici Araçları FLEX & BISON
Çizge Teorisi, Dağıtık Algoritmalar ve Telsiz Duyarga Ağları
Boyer-Moore Algoritması ve Analizi
SÖZDE –KODLAR (pseudo-code)
Veri – Bilgi – Karar Kuramları ve Özellikleri
Yrd. Doç. Dr. Emre SÜMER Aralık-2011
Derleyici Teorisine Giriş
1 Diller nasıl yazılmıştır? İki ana strateji: –Yorumlayıcılar - Interpreters (eski ve az çalışılmıştır) –Derleyiciler - Compilers (yeni, daha yoğun çalşılmıştır)
GOOGLE’DA ARAMA YAPMAK
SONLU ELEMANLAR YÖNTEMİ
Erciyes Eğitim Fakültesi Türkçe Öğretmenliği 2. sınıf
TÜRKÇE FATMANUR ŞAHİN 6/A 523.
Önce Dil Öğrenmeyi Öğrenin Önce Dil Öğrenmeyi Öğrenin Gerekli Zamanı Ayırın Gerekli Zamanı Ayırın Kullanacağınız Materyalleri Edinin Kullanacağınız Materyalleri.
Web Ortamında Arama Yapmak R. Orçun MADRAN. Arama Motorları Arama Motorları, günümüzün popüler bilgiye erişim sistemlerinin başında yer almaktadır. Bir.
MATEMATİK ÖĞRENEBİLİR
=>CÜMLEDE ANLAM<=
YAPAY SİNİR AĞLARI VE BAYES SINIFLAYICI
M.Fatih AMASYALI Uzman Sistemler Ders Notları
SONLU ELEMANLARA GİRİŞ DERSİ
3. SINIFLAR BİLGİ YARIŞMASINA HOŞGELDİNİZ
Şahin BAYZAN Kocaeli Üniversitesi Teknik Eğitim Fakültesi
PATENT ARAŞTIRMASI VE ÖNEMİ A. Bülent DALOĞLU Patent Uzmanı İstanbul, 26 Ekim 2010.
KELİME KUMBARAM.
BİL 102 BİLGİSAYAR PROGRAMLAMA DERS 1. PROGRAM GELİŞTİRME AŞAMALARI 1- Probleme ilişkin veriler nelerdir? 2- Çözüm yöntemi nasıl olacaktır? 3- Çözüm sonucunda.
Patent Araştırması ve Patent Veritabanlarının Ö nemi.
SENTAKSA GİRİŞ.
Sözcük ( Kelime ) Tek başına anlamı olan ve cümle kurmaya yarayan sözlere , sözcük ( kelime ) denir.
MORFOLOJİYE GİRİŞ.
SAYISAL ANALİZ Doç. Dr. Cüneyt BAYILMIŞ.
FAİZ PROBLEMLERİ Faiz: Bir paranın, belirli bir süre bir bankada kalıp bir miktar değerlenmesidir. * Faiz problemleri aslında bir çeşit yüzde problemidir.
Mühendislikte Bilgisayar Uygulamaları Mustafa Öztürk.
Wordnet ve Bilgisayar Ağ Terimleri Sözlüğünün Oluşturulması
Biçimsel Diller ve Soyut Makineler
NOKTA(.): o Nokta cümlenin sonuna konur. o Türk Dil Kurumu,1932 yılında kurulmuştur. o Cümle değeri taşıyan anlatımların sonuna konur. o Bazı kısaltmaların.
KIZILDERE ÖĞRETİM OKULU ANLATIM BOZUKLUKLARI HAZIRLAYAN: MURAT COŞGUN.
SÖZCÜĞÜN YAPISI KÖK EK GÖVDE.
dİn kültürü ve ahlak bİlgİsİ
ADLAR (İSİMLER).
Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ.
Dil Gelişimi Dilin Temelleri
Türkçe ve Kırım Tatarca’sı Arasında Bir Çeviri Sistemi
Bilimsel Araştırma Yöntemleri Verilerin Toplanması ANKET
Örneklerden Tercüme Kalıplarının Öğrenilmesi
Programlamaya Giriş.
ADLAR (İSİMLER).
Bilgisayar ile Çeviri Sistemleri
KESİRLER Hikmet SIRMA.
Kayıt Yöneticisi (Records Manager) Kullanımı İçin;
TÜRKÇE Doğacan Özdemir.
TAM SAYILAR.
Ontoloji Tabanlı Bir Kitap Sorgulama Sistemi Gerçekleştirimi
Bilgisayar Mühendisliğine Giriş
Problem Çözme ve Algoritmalar
KELİME YAPISI KÖK – EK – GÖVDE
NİŞANTAŞI ÜNİVERSİTESİ
Türkçe Haber Yazılarında Sosyal Ağların İncelenmesi
TÜRKÇE ÖĞRETİMİNDE YENİ YAKLAŞIMLAR
Mehmet Fatih KARACA Mustafa GÜNEL Akif Alkan TAŞTAN
Kelime Anlamları (Word Semantics) Doç.Dr.Banu Diri
Sunum transkripti:

Bilgisayar Mühendisliği Bölümü   Çeviri Sistemleri İlyas Çiçekli Bilgisayar Mühendisliği Bölümü Bilkent Üniversitesi Bilkent 06800, Ankara ilyas@cs.bilkent.edu.tr

Çeviri Sistemleri Tercüme: Kaynak dilde verilen bir metini anlamını koruyarak hedef dildeki bir metine çevrilmesi. Çeviri sistemleri bu tercüme işlemini otomatik olarak yapmaya çalışırlar. Bilgisayar ile çeviri zordur. Doğal dildeki bir cümlede her seviyede belirsizlik olabilir: morfolojik, sözdizim, anlamsal, ... Çeviri sırasında bu belirsizliklerin giderilmesi gerekir. Çeviri sistemleri değişik yöntemler kullanır. Çeviri Sistemleri

Tercüme Piramidi Cümlenin Dil Bağımsız Anlamsal Yapısı (Interlingua) Hedef Dildeki Cümlenin Anlamsal Yapısı Kaynak Dildeki Cümlenin Anlamsal Yapısı Anlamsal Yapı Transferi Hedef Dildeki Cümlenin Sözdizim Yapısı Kaynak Dildeki Cümlenin Sözdizim Yapısı Sözdizim Yapı Transferi Kaynak Dildeki Cümle Hedef Dildeki Cümle Doğrudan Transfer Çeviri Sistemleri

Doğrudan Transfer Doğrudan transferde sadece aşağıdaki basit işlem adımları kullanır. Kaynak cümlenin morfolojik analizi Kaynak cümle için morfolojik belirsizlik gidericinin uygulanması Kaynak cümlenin morfolojik seviyedeki kelimelerinin hedef dildeki morfolojik seviyedeki kelimelere transferi. Hedef dildeki kelimelerin sıralanın tekrardan belirlenmesi. Hedef cümledeki morfolojik seviyedeki kelimelerin üretilmesi. Çeviri Sistemleri

Sözdizim Yapı Transferi Kaynak cümlenin sözdizim analizinin yapılarak sözdizim yapısının bulunması. kaynak dil için morfolojik analizci, kaynak dil için morfolojik belirsizlik giderici, kaynak dil için sözdizim analizcisi. Kaynak cümlenin sözdizim yapısının hedef dildeki sözdizim yapısına transferi. yapıların transferi, iki-taraflı sözlük Hedef dildeki sözdizim yapısından hedef cümlenin üretilmesi. sözdizim yapısından kelime sıraların bulunması, morfolojik üretici Çeviri Sistemleri

Dil Bağımsız Anlam Yapısını Kullanarak Tercüme Bu tür tercüme yönteminde çok fazla kaynak gerekir ve bunları elde etmek pahalı ve kolay değildir. Kaynak cümlenin dil bağımsız anlam yapısının bulunması. kaynak dil için morfolojik analizci, kaynak dil için morfolojik belirsizlik giderici, kaynak dil için sözdizim analizcisi. kaynak dil için anlamsal analizci anlamsal yapının dil bağımsız yapıya çevrilmesi (ontoloji denilen dünya bilgisini saklayan bir kaynak gerekli) Dil bağımsız anlam yapısından hedef cümlenin üretilmesi. Dil bağımsız anlam yapısının hedef cümleye çevrilmesi Çeviri Sistemleri

Yapıları Birbirlerine Yakın Diller Arasında Tercüme Yapıları birbirlerine benzeyen diller arasında tercüme benzemeyenlere göre daha kolaydır. Birbirlerine benzemeyen diller arasındaki tercüme sistemleri daha fazla kaynak bilgiye ihtiyaç duyarlar. Sözlük, gramer kuralları, aktarma kuralları, ontoloji Gerekli kaynakları hazırlamak pahalı olabilir. Birbirlerine benzeyen diller arasındaki tercüme sistemleri daha az kaynak bilgiye ihtiyaç duyarlar. Morfolojik Analizciler, Morfolojik Belirsizlik Gidericiler, Tercüme Sözlükleri ve Basit Tercüme Kuralları Anlamsal Analizciye gerek olmayabilir. Çeviri Sistemleri

Türkçe ve Tatarca Arasında Tercüme Türkçe ve Tatarca arasında sonlu durum yöntemleri kullanıldı. Türkçe ve Tatarca Gramerleri Birbirlerine Çok Benzerler Türkçe ile Tatarca arasındaki bir tercüme sisteminde kelime sırası problemiyle ilgilenmemize gerek yoktur. Ama Türkçe ve İngilizce arasındaki bir tercüme sisteminde kelime sırası problemiyle ilgilenmemiz gerekir. Basit Tercüme Kuralları (Sonlu Durum Kuralları) Bazı belirsizlikler aynen korunduğundan, daha az belirsizlik problemi. Çeviri Sistemleri

Türkçe ve Tatarca Arasındaki Tercüme Sistemi Türkçe Metin Türkçe Morfolojik Analizci Türkçe Morfolojik Belirsizlik Giderici Tercüme Gramer Kuralların Tercümesi Duruma Bağlı Yapıların Tercümesi Köklerin Tercümesi Tatarca Morfolojik Üretici Tatarca Metin Çeviri Sistemleri

Örneğe Dayalı Bilgisayar ile Tercüme Verilen kaynak dildeki cümle kaynak-hedef diller arasında verilmiş olan tercüme örnek kümesi yardımıyla hedef dildeki cümleye çevrilir. Bazı çeviri sistemleri kaynak-hedef diller arasındaki tercüme örnek kümesini direk olarak tercüme sırasında kullanır. Kaynak cümleye en çok benzeyen cümleler örnek kümesinden bulunarak, kaynak cümlenin parçaları tercüme edilir. Parçalar birleştirilerek tercüme sonucu bulunur. Bazı çeviri sistemleri ise örnek kümesinden tercüme kalıpları öğrenir ve bu tercüme kalıplarını kullanarak kaynak dildeki cümleyi tercüme ederler. İngilizce ve Türkçe arasında bu tür sistem üzerinde çalıştık. Çeviri Sistemleri

İstatiksel Tercüme Yöntemleri Kaynak-Hedef tercüme örnek kümesi Hedef örnek kümesi İstatiksel Analiz İstatiksel Analiz Hedef dildeki cümle Kaynak dildeki cümle Tercüme Modeli Dil Modeli Çeviri Sistemleri

İstatiksel Tercüme Yöntemleri Dil Modeli verilen bir cümle e için, P(e) değerini bulur e doğru bir cümle yapısındaysa ve çok kullanılan bir yapı ise P(e) değeri yüksek olacaktır, aksi halde düşük olacaktır. Tercüme Modeli verilen iki cümle e ve f için, P(e | f) değerini bulur. e ve f bir birlerinin tercümesi olmaya ne kadar uygun ise, P(e | f) değeri o kadar yüksek olacaktır, aksi halde düşük olacaktır. Ayrıştırma Algoritması Verilen bir f cümlesi için P(e) * P(e | f) formülünü en yüksek değeri verecek olan e cümlesini bulmaya çalışır. Çeviri Sistemleri

Sonuçlar Kullanacağımız yönteme göre ihtiyaç duyacağımız kaynaklar değişir. Örneğe dayalı bilgisayar ile tercüme için: Büyük tercüme örnek kümeleri. Türkçe için örneklerin morfolojik seviyede işaretlenmiş olması gerekir. Kaynak ve hedef diller için morfolojik analizciler. Kaynak ve hedef diller için morfolojik belirsizlik gidericiler. Yapıları benzer olan diller arasındaki bir tercüme sistemi daha az bir çabayla geliştirilebilinir. Yapıları benzer olan diller arasındaki tercüme sistemlerinde çoğu zaman sonlu durum yöntemleri yeterli olabilir. Türkçe ve Tatarca arasında kullanılan yöntemler, diğer Türk diller içinde uygulanabilir. Çeviri Sistemleri