Mehmet Fatih KARACA Yrd. Doç. Dr. Salih GÖRGÜNOĞLU

Slides:

Advertisements

Benzer bir sunumlar

Advertisements

Hayat Bilgisi Veritabanı Kullanarak Otomatik Cümle Üretimi

HTML e GİRİŞ Temel HTML etiketleri.

DİCLE ÜNİVERSİTESİ AKADEMİK BİLGİ SİSTEMİ (AKADEMİKWEB)

MIT505 İnternet ve Web Programlama: Web Şablonları ve Web düzenleme

İnternet Programcılığı

Bilgisayar Dosya Uzantıları

Kişisel Web Sayfaları Kullanım Bilgileri

BTEP 203 – İnternet ProgramcIlIğI - I

Temel Bilgisayar Bilimleri Dersi

VERİTABANLARININ ETKİN KULLANIM TEKNİKLERİ

BTEP 203 – İnternet ProgramcIlIğI - I

Javascript Oğuz İNAL.

Dizinleme ve Öz HazIRlama

Türkçe Dokümanlarda Yapay Sinir Ağları ile Yazar Tanıma

Web Sayfası Bilgilendirme Toplantısı

ARAYÜZ Yenilikleri – ProQuest Search Widget. The ProQuest Search Widget ProQuest Arayüzü özelliklerine; masaüstüne ve kurumunuzun WEB sitesinde istenilen.

Temel HTML Eğitimi Erman Yükseltürk.

EasyChair KULLANIM KILAVUZU Ulusal Meslek Yüksekokulları Çalıştayı ve Öğrenci Sempozyumu Haziran 2012.

HTML (HYPER TEXT MARKUP LANGUAGE) TEMEL ETİKETLERİ

Hacimsel Moleküler Modellemede Kütle-Yay Sisteminin Kullanımı

WEB TASARIMININ TEMELLERİ

Veri Tabanı Veri Tabanı Nedir? Veri tabanı yazılımı Veri tabanı yöneticiliği Veri tabanı yönetim sistem yazılımları Veri tabanı Nerelerde Kullanılmaktadır?

Strateji Geliştirme Daire Başkanlığı

Temel Bilgi Teknolojileri 2

CONTENT MANAGEMENT SYSTEM (İÇERİK YÖNETİM SİSTEMLERİ)

Temel Bilgisayar Bilimleri Dersi (Microsoft Powerpoint)

HTML HYPER TEXT MARKUP LANGUAGE Burcu Yılmaz – İ brahim Mert Bilişim Teknolojileri Ö ğ retmeni.

HTML :Hyper Text Markup Language explorer, firefox, opera herhangi bir derleyiciye ihtiyaç duymadan çalışabilir metin biçimlendirme resim ekleme ve biçimlendirme.

ADRES DEFTERİM.

Şişecam S ayısal Yönetimle Verim VIII. "Türkiye'de İnternet" Konferansı 20 ARALIK 2002 Canan Özcan Türkiye Şişe ve Cam Fab. A.Ş.

Veritabanı Kavramları

Microsoft Office Access

=>NOKTALAMA İŞARETLERİ<=

AŞAĞIDA BELİRTİLEN LİNK ADRESLERİNDEN BİRİNE GİRİŞ YAPILMALI.

Listeleme Etiketleri.

Meryem FISTIKÇI. Kendi arşivini oluşturarak kendi “bilgi veritabanına” kolayca erişebilme, tarayabilme, ve erişilen yeni sonuçları kaydedebilme, İşbirliğini.

Veri Tabanı Yönetim Sistemleri 2 Ders 2 Oracle 11g Kurulumu

Makİne Öğrenmesİ İle Ürün SInIflandIrma İncelemesi

Web 2.0 araçlarI MERYEM KAYA AKDENİZ ÜNİVERSİTESİ

BİLGİ İŞLEM DAİRESİ BAŞKANLIĞI Bilgi İşlem Şube Müdürlüğü

HTML HYPER TEXT MARKUP LANGUAGE Ayşe AK İ DA Ğ I Bilişim Teknolojileri Ö ğ retmeni.

Hazırlayan: Yrys Moidin kyzy. 1) html; 1. html (hypertext markup language ): hipermetin işaretleme dili. 2) Bu tag wep sayfasında bulunan ilk tagdır.

Microsoft Office Access

-Genel sayfa düzeni. -Duyuru Ekleme -Fakülte-Myo Sayfa düzenleri eğitimi.

Dersi Özeti Kursun içeriğini özeti Alt başlıkları Proje Kurs esnasında kullanmayı planladığımı editörler HTMLe giriş Temel etiketler Notepad+’da.

2-Hafta Temel İşlemler * Html Komutlarının Yapısı * Açıklamalar

Yrd. Doç. Dr. Murat Olcay Özcan

Veritabanı Kavramları

UNV13107 TEMEL BİLGİ TEKNOLOJİSİ KULLANIMI. Veri tabanı Bilgisayar ortamında saklanan düzenli verilerdir. Bilgisayar ve ağ ortamındaki bilginin temel.

TOBB Ekonomi ve Teknoloji Üniversitesi Fen Bilimleri Enstitüsü Tez Çalışması Orijinallik Raporu Alınması ve Kullanılması Uygulama Esasları.

Iğdır Üniversitesi Kütüphane ve Dokümantasyon Daire Başkanlığı

SAYISAL ANALİZ Doç.Dr. Cüneyt BAYILMIŞ.

Yrd. Doç. Dr. Hidayet Takcı. Ders Hakkında Bu ders; veritabanı tasarım ve uygulama işlevi bir yazılım geliştirme görevi olarak ele alınacaktır. Derste.

İÇERİK YÖNETİM SİSTEMİ Öğr. Gör. Emine TUNÇEL Kırklareli Üniversitesi Pınarhisar Meslek Yüksekokulu.

Bölüm 2 C Dilinin Temelleri Genel Kavramlar Yazım ve Noktalama Kuralları C Kütüphaneleri C Dilindeki Sözcükler Değer Sabitleri Veri Tipleri Değişkenler.

Web Tasarımı 2.Hafta. HTML Nedir  Hyper Text Markup Language (Hiper Metin İşaretleme Dili) web sayfalarını oluşturmak için kullanılan standart metin.

Oxford Dergılerını Tarama ve Tarama Seçeneklerini

İŞYERİ TESCİLİ VE E-BİLDİRGE ŞİFRE İŞLEMLERİ

Bilgisayar Uygulamaları II

Ocak, 2013 Akdeniz Üniversitesi

Ontoloji Tabanlı Bir Kitap Sorgulama Sistemi Gerçekleştirimi

Başlık Düzeni Alt Başlık.

www. mersis. gumrukticaret. gov

Öğretim Yazılımı Tasarımı Rehberi

Tasarım: Ali Topal.

Çukurova Üniversitesi Kurumsal Açık Erişim Arşivi Çalışması

Mehmet Fatih KARACA Mustafa GÜNEL Akif Alkan TAŞTAN

Sunum transkripti:

ColumnREADY: İnternet Gazeteleri Köşe Yazılarını Hazırlama Uygulama Yazılımı Mehmet Fatih KARACA Yrd. Doç. Dr. Salih GÖRGÜNOĞLU Gaziosmanpaşa Üniversitesi Karabük Üniversitesi

Giriş Bu çalışmada internet gazetelerinde yazı yazan köşe yazarlarının yazıları ele alınmıştır. 5 gazete ve her bir gazeteden 10 yazar olmak üzere toplamda 50 adet yazarın yazıları incelenmektedir. Visual Basic (Visual Studio 2008) , Access, Java ve Zemberek (Türkçe Doğal Dil İşleme kütüphanesi) kullanılmıştır.

Giriş CoulmnREADY, yazı bilgilerini ve yazı içeriklerini kodlar aracılığıyla elde etmektedirler. CoulmnREADY, gazete köşe yazıları üzerine yapılacak çalışmalar için tasarlanmıştır.

Sistemin Yapısı - Veritabanı

Sistemin Yapısı Ön İşlem Aşamaları Tanımların Yapılması Kelimelerin Veritabanına Eklenmesi Verilerin Alınması Tanımların Yapılması İçeriğin HTML Etiketlerinden Temizlenmesi İçeriğin Karakterlerden Temizlenmesi İçeriğin Gereksiz Kelimelerden Temizlenmesi İçerikteki Kelimelerin Köklerine Ayrılması Vektör Oluşturma

Sistemin Yapısı - Tanımların Yapılması İşlemlerin gerçekleştirilmesi için öncelikle sisteme tanımların yapılması gerekir. Bu tanımlar gazete ve yazar bilgileridir. Yazar sayısını arttırmak için sadece tanımlama yapılması yeterlidir.

Sistemin Yapısı - Verilerin Alınması Yazar seçiminden sonra aşağıdaki işlemlere geçilebilir; Yazı bilgilerinin elde edilmesi; Link, başlık, içerik, tarih bilgisi Yazı bilgilerinin elde edilmesinde başlangıç etiketi <A class=header…, bitiş etiketi </DIV… kullanılmıştır. Yazının elde edilmesi; Köşe yazısı içeriği bilgisi Yazının elde edilmesinde başlangıç etiketi <P id=HaberDetayContainer…, bitiş etiketi <DIV id=NewsCommentMain class=comments... kullanılmıştır.

Sistemin Yapısı - Verilerin Alınması Bir yazarın yazısı birden fazla kez gazete web sitesine dahil edilmiş olabilir. Bu sorun Aynı Yazarın Aynı İçerikli Köşe Yazılarını Sil düğmesiyle giderilmektedir.

Sistemin Yapısı - Ekran Görüntüsü

Sistemin Yapısı - Ekran Görüntüsü

Sistemin Yapısı - Ön İşlem Aşamaları Yazılar alındıktan sonra yazıların ön işlemden geçirilmesi gerekmektedir. Ön işlem aşaması aşağıdaki işlemlerden oluşmaktadır; İçeriğin HTML etiketlerinden temizlenmesi, İçeriğin karakterden temizlenmesi, İçeriğin gereksiz kelimelerden temizlenmesi, İçerikteki kelimelerin köklerine ayrılması.

Sistemin Yapısı - Ön İşlem Aşamaları İçeriğin HTML etiketlerinden temizlenmesi; Başlangıç ve bitiş etiketleri arasında kalan metin Browser_Adi.Body.InnerText koduyla HTML etiketlerinden arındırılır. İçeriğin karakterden temizlenmesi; İçerikte sadece Türkçe karakterler ve bazı noktalama işaretleri kullanılmıştır. ' karakteri yerine ’ kullanılması gibi. İçeriğin gereksiz kelimelerden temizlenmesi; Türkçede tek başlarına anlamı bulunmayan, anlama etkisi bulunmayan kelimelerden temizlenmesi işlemini ifade eder. İçerikteki kelimelerin köklerine ayrılması; Java kodları yardımıyla Zemberek kullanılarak elde edilmektedir. İçeriği boş olmayan yazıların kelimelerin kökleri elde edilir.

Sistemin Yapısı - Kelimelerin Veritabanına Eklenmesi Kelime köklerinin kaydedilmesi; Boşluk karakteriyle birleştirilen kelime kökleri tek tek ele alınarak tbl_kelime tablosuna eklenmektedir. Yazı kelime dağılımının yapılması; Eklenen kelimelerin yazı içerisindeki geçme durumuna göre tbl_yazi_kelime tablosuna eklenme işlemidir. Dağılım bittikten sonra tbl_kelime tablosundaki ağırlık(IDF) hesaplanır, kelimenin yazı içerisinde geçme sıklığı da bilindiğinden vektör kolaylıkla oluşturulabilir.

Sistemin Yapısı – İncelenecek Yazı Sınıflandırma gibi işlemler yapmak için girilecek metin veya seçilecek haber ön işlemden geçirilir, kelime kökleri kaydedilmesi, kelime dağılımı işlemleri yapılır ve yazi_id 0 olmak üzere tbl_incelenecek_yazi_kelime tablosuna kaydedilir.

Sistemin Yapısı - Vektör Oluşturma tbl_yazi_kelime ve tbl_incelenecek_yazi_kelime tabloları kullanılıp sorgu yazmak suretiyle her iki yazıda geçen kelimeler bulunur ve vektör oluşturulmuş olur.