Çocukların İnternet Kullanım Yetkinliklerini Etkileyen Faktörlerin Veri Madenciliği İle Tespiti Gökhan SİLAHTAROĞLU, Zehra Nur CANBOLAT Medipol Üniversitesi Yönetim Bilişim Sistemleri Bölümü
“We are social” raporu (Global Digital Statistics, 2016)
ÇOCUK VE İNTERNET İnternet erişimi ve kullanımı özellikle çocuklar ve gençler arasında son on yılda katlanarak büyümüştür. Yapılan çalışmalarda her ne kadar ebeveynler çocuklarının internet kullanma yaşını en erken 13 olarak görseler dahi çocuklar İnterneti kullanmaya çok daha erken yaşlarda başlamaktadırlar. İnternetin çocukluk yaşlarına kadar inmesi beraberinde bireyin sosyal ve ruhsal gelişimini etkileme ve yönlendirme sorunlarını da getirmeye başlamıştır İnternetin dinamik bir özelliğe sahip olması, yayılım ağının oldukça geniş ve hızlı olması kontrol edilmesini güçleştirmektedir. Bu durum çocukları pornografiden şiddete kadar birçok risk ile karşı karşıya bırakmaktadır.
ÇOCUK VE İNTERNET Çocukların güvenli İnternet kullanımını desteklemek amacıyla devlet, sivil toplum kuruluşları ve ailelerin iş birliği içerisinde düzenledikleri eğitim ve kampanyalar, araştırma sonuçlarının uygulamadaki yansımalarıdır. Çocuk yaştaki bireylerin İnternetteki uygunsuz içerikten kendilerini otokontrol şeklinde koruyabilme yetilerinin gelişmesi hem kendilerine hem de içinde yaşadıkları topluma olumlu katkı sağlayacaktır .
VERİ MADENCİLİĞİ Teknolojik gelişmelerin beraberinde getirdiği veri miktarındaki hızlı artış, verilerden nasıl yararlanılacağını ve bu verilerden nasıl anlamlı bilgiler çıkarılabileceği sorununu gündeme getirmiştir. Bu sorunların çözümüne imkân sağlayan veri madenciliği son yıllarda yoğun olarak kullanılmaya başlanmıştır. Veri madenciliği farklı birçok alanda ve farklı amaçlarla kullanılmakla birlikte, uygulamada veri tanımlama, sınıflandırma, kümeleme, ilişkilendirme, tahmin etme gibi bazı temel uygulama türleri yaygın olarak kullanılmaktadır .
UYGULAMA Bu çalışmada Avrupa Çevrimiçi Çocuklar Projesi kapsamında 24.000’den fazla çocuk ile yapılmış olan anket verileri kullanılarak , çocukların İnternet kullanım yetkinliklerini etkileyen faktörler veri madenciliğinin sınıflandırma analizi yöntemi olan karar ağaçları algoritmaları kullanılarak ortaya konulmuştur. Bu çalışmada kullanılan veri kümesi, 25 Avrupa ülkesinde tümü İnternet kullanan 9-16 yaş çocuklar arasından seçkisiz örneklemeyle seçilen 25.142 çocuk ve ebeveynlerinden birisi ile İlkbahar/Yaz 2010 döneminde yüz yüze görüşme yoluyla yapılan özgün anket verilerinden oluşmaktadır.
Avrupa Çevrimiçi Çocuklar Projesine Katılımcı Ülkeler ve Sayıları Toplam 25.142 Katılımcı Almanya 1023 Avusturya 1000 Belçika 1006 Bulgaristan 1088 Çek Cumhuriyeti 1009 Danimarka 1001 Finlandiya 1017 Fransa Hollanda 1004 İngiltere 1032 İrlanda 990 İspanya 1024 İsveç İtalya 1021 Kıbrıs Cumhuriyeti 806 Litvanya Macaristan Norveç 1019 Polonya 1034 Portekiz Romanya 1041 Slovenya Türkiye 1018 Yunanistan
Avrupa Çevrimiçi Çocuklar projesi (EU Kids Online) kapsamında veri toplama aracı olarak kullanılan soru formlarında çocukların fizyolojik, psikolojik ve sosyolojik özellikleri, çocukların ve ebeveynlerin İnternete yönelik tutumları, İnternete erişim yolları, İnternet kullanım sıklıkları, çocukların İnternetteki faaliyetleri, İnternet kullanımındaki yetkinlikleri, karşılaştıkları riskleri ve ebeveynlerin çocukların İnternet yaşantıları ile ilgili eksiklerini ve farkındalıklarını belirlemeye yönelik sorular bulunmaktadır. Veri kümesi başlangıçta 953 değişken ve 25.142 kayıt içermektedir. Satırlarda yer alan her bir kayıt 9 ile 16 yaş arasında bir çocuk ve ebeveyni ile yapılan anket verilerini içermektedir. Veri kümesinde bulunan değişkenlerin büyük bir çoğunluğu nominal ve ordinal düzeyde kategorik verileri içerirken, bir kısmı da aralık ve oran ölçeğinde sürekli verileri içermektedir.
YÖNTEM SEÇİMİ Çalışma konusu veri kümesine, standart veri madenciliği sürecinin (CRISP-DM) başlangıcı olan verileri anlama ve hazırlama aşamaları uygulanmıştır. Bu çalışmada bir makine öğrenmesi algoritması olan SPRINT ve C4.5 karar ağacı algoritmaları kullanılmış ve algoritmanın en uygun değişkeni kendisinin bulması beklenmiştir. Bu anlamda çalışma klasik istatistiksel raporlamadan farklılık göstermektedir.
YÖNTEM SEÇİMİ Karar ağaçları ya istatistiğe dayalı yöntemler ve algoritmaları kullanır ya da entropi kavramı benimseyen algoritmalara bağlı olarak çalışırlar. SPRINT istatistik ve olasılığa dayalı bir algoritma iken C4.5 entropi kavramını kullanan algoritmadır. Karar ağaçları kullanılan verinin yapısı ve barındırdığı kurallara göre farklı başarı ölçütleri gösterirler. Bir veri grubunda çok iyi sonuç veren algoritma diğer bir veri grubunda aynı başarıyı göstermeyebilir. Bu yüzden algoritmalar ayrı ayrı ya da toplu kullanım şeklinde yürütülmeli ve en uygun tahmin kuralları benimsenmelidir. Bu çalışmada SPRINT ve C4.5 algoritmaları kullanılmış ve her iki algoritmada aynı kuralları bulmuştur. Dolayısıyla üçüncü bir algoritma denenmemiştir. SPRINT gini değeri hesaplayarak dallara bölünme işlemini gerçekleştirirken C4.5 algoritması ise entropi hesabı yaparak en uygun değişken üzerinden ağacı dallara ayırır.
VERİ TEMİZLEME Veri ön işlemlerinden sonra nihai veri kümesi 230 değişken ve 24.210 kayıt olarak son halini almıştır. Çalışmanın amacı, Avrupa ülkeleri genelinde İnternet kullanan çocukların, İnternet kullanımındaki yetkinliklerini etkileyen faktörleri belirleyebilmektir. Veri kümesinde çocukların İnternet kullanımındaki yetkinliklerini belirleyen sorular; İnternette bulduğun bilgilerin doğru olup olmadığına karar vermek için farklı siteleri karşılaştırabilmek, bir İnternet sayfasını favorilerine / sık kullanılanlara ekleyebilmek, istenmeyen reklam ya da e-posta, spam engelleyebilmek, gezdiğin sitelerin kaydını silebilmek gibi İnternet kullanımının etkinliğini sorgulayan sorulardır. Tahmin edilecek sınıf değişkeni olarak seçilen yetkinlik, bu 4 sorunun ortalamasını yansıtmaktadır.
VERİLERDE AYRINTILAR Veri kümesindeki çocukların tamamı İnternet kullanmakta olup İnternet kullanım sıklıkları incelendiğinde hemen hemen her gün İnternet kullanımına sahip olan çocuklar %65,7 (15.910) oranındadır. Haftada bir veya iki kere İnternet kullanan çocuklar %28,8 oranında (6997) iken ayda bir veya iki kere İnternet kullandığını söyleyen çocuklar ise %4,2 (1015) oranındadır. İnterneti ayda iki veya daha az kullanan çocuklar ise %1,3’lük (318) bir orana sahiptir. Veri kümesindeki 9-16 yaş arası çocukların %61,4’ü (14.854) sosyal ağ sitelerine üye olduklarını belirtmişlerdir. Sosyal ağ sitelerinin üyelikleri incelendiğinde özellikle Facebook kullanımının %36,3’lük (8799) bir oranla en yüksek olduğu görülmüştür.
BULGULAR Çocukların İnternet kullanımındaki yetkinliklerini, hangi faktörlerin etkilediğini araştırdığımız bu çalışmada, veri kümesinde yer alan tüm değişkenler (230 adet) sınıflandırmaya tabi tutulmuş ve bunların arasından çocukların yetkinliğini en çok etkileyen değişkenlerin tahmin edilmesi hedeflenmiştir. Araştırmada, veri kümesinde yer alan çocuklar 9-16 yaş aralığında olmalarına rağmen 11-16 yaş aralığındaki çocuklar sonuçlar üzerinde etkili olmuştur. Karar ağacı analizinin sonuçlarına göre çocukların İnternet kullanım yetkinliğini etkileyen en önemli faktör çocuğun yaşı olup, ileri yaşlar bireyin yetkinliğini artırmaktadır.
Yetkinlik Seviyesi /Yaş Yüksek Seviye Yetkinlik Zayıf Seviye Yetkinlik Çocukların Yaşlarına Göre İnternet Kullanım Yetkinlikleri Yetkinlik Seviyesi /Yaş 11 12 13 14 15 16 Yüksek Seviye Yetkinlik %17,7 %28,9 %15,1 %51 %58,5 %63,8 Orta Seviye Yetkinlik %48,9 %47,6 %41,6 38,6 %32,4 %29,3 Zayıf Seviye Yetkinlik %33,4 %23,6 %43,3 10,5 %9,1 %6,9 Çocukların İnternet kullanım yetkinliği 16 yaşında en yüksek seviyede iken (63,8), 13 yaşında zayıf seviyede yetkinlik görülmektedir (%43,3).
BULGULAR Yaştan sonra en önemli ikinci faktör ; ÜLKE Hollanda’da yaşayan 11, 12, 13, 14 ve 16 yaşlarındaki çocukların İnternet kullanım yetkinlikleri en yüksek seviyede iken, 15 yaşındaki çocuklarda İnternet kullanım yetkinliğinin en yüksek Slovenya’da olduğu görülmektedir. 11 yaşındaki çocukların İnternet kullanım yetkinliği en düşük Romanya’da iken, 12-16 yaş arasındaki çocukların İnternet kullanım yetkinliğinin en düşük olduğu ülke Türkiye’dir. Tablo 2. Ülkelere Göre Çocukların İnternet Kullanım Yetkinlikleri ÜLKELER /YAŞ 11 12 13 14 15 16 İnternet Kullanım Yetkinliğinin Yüksek Olduğu Ülkeler Hollanda (%40,7) (%55,4) (%64,6) (%73,1) Slovenya (%85,6) (%88,4) İnternet Kullanım Yetkinliğinin Zayıf Olduğu Ülkeler Romanya (%60) Türkiye (%54,9) (%49,6) (%39,5) (%40,8) (%29,3)
Yaştan sonra en önemli ikinci faktör ; ÜLKE BULGULAR Yaştan sonra en önemli ikinci faktör ; ÜLKE Ülke değişkeninin etkin bir faktör olarak ortaya çıkması çocukların İnternet yetkinliğinin ülke koşullarından, ülkenin benimsediği eğitim sisteminden, kültüründen ve yaşayış tarzından son derece etkilendiği yorumu getirilebilir. 2 soruda yetkinlik kararı verebilme
SONUÇ Ülkelerin çocuklara verdikleri etkili ve bilinçli İnternet eğitimi, çocukların İnternet kullanımını geliştirebilecek şekilde verilen ev ödevleri ya da projeler çocuklara bu konularda ciddi katkılar sağlayabilir. Ülkelerin ekonomik, fiziki ve sosyolojik yapısı gereği çocukların farklı kültürel, sanatsal ve sportif aktiviteler ile daha fazla zaman geçirmesi ve İnternete ayıracak vaktinin olmaması da çocukların İnternet kullanım yetkinliğini etkileyebilmektedir. Yapılan çalışma Avrupa Çevrimiçi Çocuklar Projesi (EU Kids Online) 2010 verileri kullanılarak yürütülmüştür. Dolayısıyla çocukların İnternet kullanım yetkinlikleri yaklaşık beş yıl önceki çocuklar hakkındaki bilgileri içermektedir. Değişimin son derece hızlı olduğu bu çağda beş yıl içinde birçok şey değişmiş olabilir. Bu nedenle çalışmamız 2017 verileri ile yenilenip karşılaştırmalı bir analiz yapılması uygun olacaktır.
Çocukların İnternet Kullanım Yetkinliklerini Etkileyen Faktörlerin Veri Madenciliği İle Tespiti Gökhan SİLAHTAROĞLU, Zehra Nur CANBOLAT Medipol Üniversitesi Yönetim Bilişim Sistemleri Bölümü TEŞEKKÜRLER