BÖLÜM
6
Prof. Dr. Şeref SAĞIROĞLU
Siber
Güvenlikta
Büyük Veri ve
Açık Veri
Kullanımı
165
SİBER GÜVENLİKTE BÜYÜK VERİ VE
AÇIK VERİ KULLANIMI
6.1. Giriş
S
iber ortamlar verilerin taşındığı, veriler üzerinde işlemlerin
yapıldığı, verilerden değer elde edildiği, veriler ile saldırıların
yapıldığı belki de en önemlisi yine bu verilerin analizi sonu-
cunda saldırıların önlendiği ortamlardır. Dolayısıyla, veriye sahip
olanlar ve bunları analiz edenler, elektronik dünyada var olabilir,
saldırılara karşı koyabilir veya olası saldırıları anlayabilir, karşılaşı-
labilecek olumsuzluklardan, zararlardan, tehlikelerden daha az et-
kilenir, yeni araştırmalar yaparak koruma teknikleri ve teknolojileri
geliştirebilir ve sonuçta hem bunu bir fırsata dönüştürebilir hem de
kişisel, kurumsal ve ulusal bilgi varlıklarını koruyabilirler.
Bu konunun önemini anlayan toplumlar bu konuda çözümler ge-
liştirmişler, verilerini araştırmacılara açımışlar, yüksek seviyede bir
koruma sağlamanın yanında bundan hem ekonomik hem de strate-
jik olarak faydalanmışlardır.
Bu bölümde bu konu kapsamlı olarak incelenmiştir.
6.2. Açık Veri ve Açık Kaynağın Önemi
Açık Kaynak, Açık Toplum, Açık Bilim, Açık Veri, Açık Veri Türkiye
son dönemde üzerinde konuşulan konuların başında geliyor.
Açık veya açıklık, kişiler, toplumlar veya ülkeler için önemlidir. Ge-
lişim ve değişim için şarttır. Bunların Konuşulması, paylaşılması,
okunulması veya anlatılması bile pozitif bir etki bırakıyor insanın
üzerinde. Toplumda güven duygusunu artıran önemli bir etkisi
vardır. Güven veriyor.
Açık Bilgi Vakfı (Open Knowledge Foundation) açık veriyi, “her-
hangi bir telif hakkı, patent ya da herhangi bir kontrol mekanizması-
Ş E R E F S A Ğ I R O Ğ L U
166
na tabi olmaksızın herkes tarafından ücretsiz ve özgürce kullanılan
veri” olarak tanımlamaktadır. Diğer bir ifadeyle “herkes tarafından
ücretsiz olarak erişilebilen, tekrar kullanılabilen ve paylaşılabilen
araştırma veya gözlem sonuçları” açık veri olarak ifade edilmekte-
dir. Aynı zamanda, Açık Bilgi Vakfı “açık devlet verisini” ise “dev-
let ya da devlet kontrolündeki birimler tarafından üretilen, herkes
tarafından kullanabilen ve paylaşılabilen veriler” olarak tanımla-
maktadır.
Dünyaya baktığımızda; bu kelimeleri konuşan, bunları hayatın içe-
risine alan, bu konuda çalışmalar yapan, verilerini, dokümanlarını,
yaptıklarını ve bunların değerlerini bilen ve koruyan, paylaşılma-
sı gereken bilgilerini ise topluma açan veya bunları geniş kitlelerle
paylaşanlar gelişmiş toplumlardır. Açık verileri işleyip bunları de-
ğere dönüştürenler, ekonomiye katanlar, bunun ekonomisini oluş-
turanlar ise gelişmiş beyinlere sahip ülkelerdir.
Sümerlerden günümüze kadar geçen uygarlıkları incelediğimizde,
bu açıklık ile hareket eden toplumların büyüdükleri, felsefelerini
yaygınlaştırdıkları ve sonuçta geliştiklerini tarih bize söylemekte-
dir. Osmanlı imparatorluğunun büyüme felsefesinin arkasında da
bu olduğu gibi büyük dünya devletlerinin büyüklüğünün arkasın-
da da bu vardır. Doğal olarak; bu büyüklük, şeffaflıkla ve açıklıkla
sağlanabilmektedir. Bu sayede güven artmaktadır. Destekler çoğal-
maktadır. Toplumların veya ülkelerin ortak hedeflere koşması veya
kilitlenmesi de artmaktadır. Google, Wikipedia, Scholarpedia, Go-
ogleScholar, Facebook, Twitter, Über, TEDTalks, vb ürünler veya or-
tamlar bunlara verilebilecek iyi örneklerdir. Bu açıklığın ekonomik
sonuçları ise Milyar dolarlık şirketler, zengin ve gelişmiş ekonomi-
ler, bilgi toplumları, sosyal projeler, milyarları etkileyen olaylar, de-
ğişimler ve sonuçlardır.
Dünya üzerinde büyük etki yaratan uygulamaların sayısını artır-
mak için; büyük etkiler oluşturabilecek büyük fikirleri geliştirmek,
projeleri hayata geçirmek, açık ortamları oluşturmak, paylaşmak,
yenilerini düşünmek ve özellikle de bunda ısrar etmek gereklidir.
Ülke olarak açık veriye baktığımızda; bu yönde geliştirdiğimiz bü-
yük projelerin sayısı maalesef azdır. Bunu artırmanın yolu; gelişi-
min önündeki engellerin kaldırılması, açık bilgiye erişimin yeterli
düzeye getirilmesi, üretilen bilginin niteliğinin ve kapsamının ge-
S İ B E R G Ü V E N L İ K T E B Ü Y Ü K V E R İ V E A Ç I K V E R İ K U L L A N I M I
167
nişletilmesi, teknoloji ve inovasyon kültürünün gelişmesi, yerli ve
milli ürünlerin sayılarının artırılması, toplumun hızla gelişip kal-
kınması, bilgi toplumu ve ekonomisine geçişin hızlandırılmasından
geçmektedir. Bundan dolayı, gelişmiş, toplumlar veya ülkeler açık
kaynak ve veri yaklaşımlarını desteklemekte, kamu kaynaklarıyla
desteklenen projeleri, yayınları, araştırmaları, raporları, araştırma
verilerini herkese açmakta, bunun için yasal düzenlemeler yapmak-
ta, bu tür projeleri teşvik etmekte ve bunların hayata geçirilmesinde
kolaylıklar göstermektedir.
Büyük ve açık verilerin önemli bir kısmı kamu hizmetlerinden elde
edilen verilerdir. Bu verilerin işlenmesi ve elde edilen değerlerin
toplumun yararına kullanılması için sahip olunan bazı verilerin
kullanıma veya analize açık olması, farklı kurumlar ve birimler ta-
rafından kullanılabilmesi, farklı ve yeni fikirlerin ve çıktıların elde
edilebilmesinin yanında girişimciliği ve inovasyonu teşvik etmesi,
kurumların verimliliğini artırması, kurumlar arası işbirliğini güç-
lendirmesi, oluşabilecek ihlallerin tespit edilmesini kolaylaştırması,
kayıpları en aza indirgemeye katkı sağlaması, açık verilerden farklı
kazanımların elde edilmesi ve bunların vatandaşlara ve yöneticilere
aktarılması işlemlerini sağlayacak ve işleri kolaylaştıracaktır.
Akademik ortamlarda “Açık Erişim”; yaklaşık 10 yıldır yoğun ola-
rak ülkemizde tartışılmakta ve bugün dünyada pek çok bilim insa-
nı, araştırmacı, yayınevi, kurum ve kuruluşlar tarafından destek-
lenmektedir.
Budapeşte Açık Erişim Girişimi Bildirgesinde; Açık Erişim “verile-
rin okunabilir, kaydedilebilir, erişilebilir, kopyalanabilir, yazdırıla-
bilir, taranabilir, dizinlenebilir, bağlantı verilebilir, başka bir orta-
ma veri olarak aktarılabilir ve her türlü amaç için yasal çerçevede
kullanılabilir olması ve ekonomik, hukuki ve teknik engellemeler
olmaksızın kamuya ücretsiz olarak açık bulunması” olarak tanım-
lanmaktadır
.
Büyük veri, günümüzde gerek akademik ortamlarda gerekse sek-
törlerde ve kurumlarda önemli ve popüler konularından biridir.
Büyük veri; depolama, yönetim ve analiz için sıradan veri tabanı
yazılım araçlarının yeteneklerinin gerisinde kaldığı veri kümesi,
yüksek hızda toplama, keşif ve analiz sayesinde çok çeşitli verinin
çok büyük hacminden ekonomik olarak değer elde etmek için ta-
Ş E R E F S A Ğ I R O Ğ L U
168
sarlanan yeni nesil teknolojiler ve mimariler, geleneksel veri işleme
uygulamaları veya genel veri tabanı yönetim araçları kullanılarak
yönetilmesi zor olan büyük ve karmaşık veri koleksiyonu, farklı
formatlarda ve farklı kaynaklardan çok yüksek hızlarda üretilen
büyük miktardaki veriler, gibi tanımlamaları olsa da aslında güncel
teknolojiler ile çözülemeyen problemlerin çözümünde kullanılabi-
lecek yeni nesil çözümlerdir. Bu verilere, hız, hacim, çeşitlilik, güve-
nilirlik ve değer olmak üzere beş temel karakteristiğe (5V Özelliği)
sahip olsa da buna yeni özelliklerde eklenmektedir (11V Özelliği).
Bu temel karakteristikler, verilere ve veri işleme yaklaşımlarımıza
bakış açımızı değiştirmekte, pekçok şeyi tekrar sorgulamamıza,
yeni yaklaşımlar geliştirmemize ve en önemlisi bir verinin ne kadar
hacimli olduğuna, ne kadar hızlı değiştiğine, ne kadar çeşitli oldu-
ğuna, ne denli güvenilir olmasına daha çok dikkat etmemize ve en
önemlisi de bu verilerden yeni değer nasıl elde edilebilir odaklan-
mamızı sağlamaktadır.
Verilerin mahremiyetinin sağlanmasına yönelik, çeşitli anonimleş-
tirme teknikleri ve çözümleri mevcuttur. Bu teknikler, en temelde
kayıt bağlama, özellik bağlama, tablo bağlama ve olasılık saldırıları-
na karşı koruma sağlamaktadır. Burada verilere yapılabilecek olası
saldırıların veya oluşabilecek açıkların önceden fark edilmesi veya
belirlenmesi, ve sonuçta bu oluşabilecek ihlallerin engellenmesi için
anonimleştirme tekniklerinin önemi büyüktür. İstenilen anonimleş-
tirme seviyesi sağlanmadan paylaşılan veri kümelerinin saldırıya
ve ihlale açık olduğu bilinmektedir. Buna en iyi örnek, 2006 yılında
AOL firması tarafından çeşitli araştırma faaliyetleri için, kullanıcı
kimliği ve IP numarası silinerek 650 kullanıcıya ait 20 milyon arama
sorgu verisi paylaşılmış, ancak birkaç gün içerisinde bu sorguların
kimlere ait olduğu araştırmacılar tarafından tespit edilmiştir. Buna
benzer başka örneklerde literatürde mevcuttur. Karşılaşılan bu ih-
laller araştırmacılara yol göstermiş olup, bu tür ihlallerin önlenme-
sine yönelik yeni ve farklı çözümler geliştirilmesine öncü olmuştur.
2016 yılında yayımlanan Kişisel Verileri Koruma Kanununda ano-
nimleştirme, “kişisel verilerin, başka verilerle eşleştirilerek dahi
hiçbir surette kimliği belirli veya belirlenebilir bir gerçek kişiyle iliş-
kilendirilemeyecek hale getirilmesi”, kişisel veri ise “kimliği belirli
veya belirlenebilir gerçek kişiye ilişkin her türlü bilgi” olarak tanım-
lanmıştır. Bu tanımlara dayanarak, kişisel veri sınıfına giren büyük
S İ B E R G Ü V E N L İ K T E B Ü Y Ü K V E R İ V E A Ç I K V E R İ K U L L A N I M I
169
verilerin mahremiyeti belirtilen kanun çerçevesinde gerek işlenmesi
ve saklanması gerekse aktarılması veya ifşa edilmesi konularında
çalışmalar vardır.
Avrupa Birliği;
- “kamu bilgilerinin Avrupa’daki en büyük veri kaynağı olduğunu
ve bunların ise sayısal haritalar, meteorolojik, yasal, trafik, mali,
ekonomik ve diğer verilerden oluştuğunu belirtmiş, bu verilerin
çoğunun yeniden kullanılabilir olduğunu, hava, finans ve sigor-
ta kuruluşları gibi kurumların yeni ürün ve hizmetlerine entegre
edilebileceğini”, “verilerin altın olduğunu ve bunun keşfedilme-
si, işlenmesi ve değere dönüştürülmesini”, açık verileri “petrole
benzetmiş” ve “dijital çağda verilere önem verilmesi gerektiğini”
raporlamış,
- kendi büyük verisini oluşturmak ve “Açık Erişim Arşivlerini”
kurmak için H2020 çerçeve programı kapsamında “OpenAIREp-
lus” projesini destekleyerek, 10 milyonun üzerinde doküman,
yayın ve verileri bu sisteme aktarılmasını sağlamış, ve
- CERN ev sahipliğinde oluşturulan açık veri arşivi ZENODO
(http://zenodo.org/) ile ülkelerin kullanımı için arşivlenmektedir.
Bunun gerekçeleri ise büyük verilerden farklı ve yeni değerlerin
elde edilebilme ve Avrupa toplumlarının bu gelişmelerden daha
çok faydalanmasını sağlamak ve kendi ekosistemini kurmaktır.
Nicol, Caruso ve Archambault tarafından 2013’de hazırlanan “Av-
rupa Araştırma Alanları ve Ötesi: Açık Veri Erişim Politikaları ve
Stratejileri” dokümanında sunulan verilere göre;
- ABD’nin bu alana yılda 60 milyar dolar harcadığı,
- AB’nin FP7 projeleri kapsamında bu konunun gelişmesi için 50
milyar avroluk harcama planladığı,
- AB’de H2020 için 70 milyar avro araştırma bütçesi kullanılacağı,
- Yıllık veri artışının ise %30 civarında gerçekleştiği ve
- Büyük verilerin, açık veri haline getirilmesiyle AB ülkelerinin
bundan yılda 150-300 milyar avro tasarruf sağlanabileceği
belirtilmiştir.
Ş E R E F S A Ğ I R O Ğ L U
170
ABD, İspanya, Almanya, Kanada, Japonya, Yunanistan, İtalya vb.
ülkeler kamu kaynaklarıyla desteklenen araştırma çıktılarının açık
erişim olarak paylaşılmasını zorunlu hale getirmişlerdir. Günü-
müzde pekçok uluslararası üniversite açık erişimi, araştırmacıların
destek alabilmelerinde ve akademik yükseltmelerde ön koşul ola-
rak sunmaktadır.
Ülkemizdeki durumları incelediğimizde ise;
- Ülkemizde açık erişim çalışmaları 2006 yılında başlamış, ülke-
mizde açık erişim arşivi ve kültürünün oluşturulmasına katkı
sağlamak ve kazanılan tecrübeleri paylaşmak amacıyla ANKOS
(Anadolu Üniversite Kütüphaneleri Konsorsiyumu) çatısı altın-
da Açık Erişim ve Kurumsal Arşivler (AEKA) adıyla bir çalışma
grubu kurulmuştur. Bu grup çalışmalarını sürdürmektedir.
- Ülkemizde 120’nin üzerinde üniversitenin açık erişim yaklaşım-
larını destekledikleri, bazılarının ise bunu senato kararı alarak
daha da somutlaştırmışlardır.
- World Wide Web Foundation tarafından yıllık olarak yapılan
bir araştırma sonucunu incelediğimizde, ülkelerdeki açık veri-
leri sınayan Open Data Barometer listesinde ülkemiz bu yıl 40.
sıradadır. Bu sıralamanın ise hazır olma (readiness), uygulama
(implementation) ve etki (impact) kriterleri dikkate alınarak be-
lirlendiği, ülkemizin ise 100 üzerinden 3 kriter için sırasıyla 35,
53 ve 15 puan aldığı görülmüştür.
- Ülkemiz için internette açık veri ile ilgili küçük bir araştırma ya-
pıldığında, bazı belediyelerin bu tür platformları açtığı fakat içe-
risinde herhangi bir bilginin bulunmadığı, devletin bu konudaki
alan isimlerini (www.data.gov.tr) aldığını fakat bunların içeriği-
nin olmadığı görülebilir.
- Ülkemizde, iyi örneklerimizin de olduğunu belirtmekte fayda
vardır. Açık kaynak ve açık veri konusunda YÖK, TÜBİTAK ve
Üniversitelerimiz örneklerimizdendir.
- Kurumsal Akademik Arşiv ve Ulusal Akademik Arşiv sistemleri-
nin kurulması için 2014 yılında kamu kaynaklarıyla yapılan pro-
jeler ve araştırmalar sonucunda üretilen yayınların açık erişim
olarak sunulması, açık erişim politikalarının oluşturulması için
bir proje hayata geçirilmiş ve şu an için Yüksek Öğretim Bilgi Yö-
S İ B E R G Ü V E N L İ K T E B Ü Y Ü K V E R İ V E A Ç I K V E R İ K U L L A N I M I
171
netim Sistemi (https://istatistik.yok.gov.tr) ile tüm öğretim ele-
manlarının yaptığı çalışmaların neler olduğunu ve ilgi alanlarını
genelde ve özelde görebilmek için geliştirilen “Yükseköğretim
Akademik Arşiv Projesi” (http://akademik.yok.gov.tr) portalları
üzerinden açık bilgiye erişim kanallarını açılmıştır.
- Üniversitelerimizin bu konuya en çok desteği veren kurumlar
olduğu ve son on yıldır bu konuya çok önem verildiği, 100’ün
üzerinde üniversite web siteleri altında, açık arşivler oluştur-
muşlar ve bu portallarda Açık Erişim ve Açık Ders Arşivleri ile
bugün için hizmet vermektedir. Örnek olarak; Gazi Üniversite-
sinin http://www.acikarsiv.gazi.edu.tr ve acikders.gazi.edu.tr
adreslerinde, Ankara Üniversitesinin ise acikarsiv.ankara.edu.tr
ve açık ders için acikders.ankara.edu.tr portallarından kamuya
açık kaynak ve ders materyallerini sunduğu, diğer üniversiteler-
de de buna benzer açık arşiv portalları bulunmaktadır.
- Ülkemizde bu alanda yapılan AB destekli projeler olduğu, açık
erişim politikalarıyla ilgili olan MedOANet (Mediterranean
Open Access Network), ortak altyapı oluşturmak için OpenA-
IREplus (Open Archives Infrastructure for Research in Europe)
ve MedOANet’in devamı niteliğinde olan ve açık erişim politi-
kalarının ve stratejilerinin geliştirilmesine katkı sağlamak ama-
cıyla PASTEUR4OA (Open Access Policy Alignment Strategies
for European Union Research) ile ülke bilgi birikimine katkılar
sağlanmıştır.
- Ülkemizde 2012 yılında Açık Yönetim Ortaklığı Girişimini (Open
Government Partnership) destekleyen ülkelerden birisi olduğu-
nu belirtmiş ve 23 Ağustos 2013’te 352013/9 sayılı ve “Açık Yö-
netim Ortaklığı Girişimi” konulu Başbakanlık Genelgesi (http://
www.resmigazete.gov.tr/eskiler/ 2013/08/20130823-8.htm) ya-
yımlayarak buna taraf olduğunu ve kurumların bu konuda ge-
reğini yapmasını bildirmiştir. Gelinen noktaya bakıldığında ise
ülkemizde yeni yeni kurumların bu konuya ağırlık verdikleri ve
gerekli adımları, 2016-2019 Ulusal e-Devlet Stratejisi ve Eylem
Planı gereği yerine getirmeye çalıştıkları bilinmektedir. Strateji
dokümanında, 22 yerde “açık veri” 24 yerde ise “büyük veri” ke-
limesi geçmektedir. Eylem planında Hedef 4.2’de “Açık Verinin
Kullanım Alanları Yaygınlaştırma” başlığı altında;
Ş E R E F S A Ğ I R O Ğ L U
172
• ülkemizde açık veri konusunda kamu kurum / kuruluşlarının ya-
nında özel sektör, sivil toplum kuruluşları gibi diğer paydaşları
da içine alacak şekilde yapılacak çalışmaların çerçevesinin çizil-
mesi, kriterlerin belirlenmesi ve kullanımının yaygınlaştırılması,
• açık veri anonimleştirilmiş kamu verisi, özel sektör, üniversite-
ler, sivil toplum kuruluşları gibi tüm paydaşların verileri de açık
veri olarak belirlenip burada tüm paydaşların dahil edildiği,
• paydaşlar tarafından üretilen verilerin açık veri olarak
paylaşıldığı ve
• katma değer sağlanan bir modelin oluşturulması
gerektiği vurgulanmıştır. Ayrıca, açık veri konusunda gerekli mev-
zuat düzenlemelerinin yapılarak açık verinin üretilmesinin ve kul-
lanımının önündeki engellerin kaldırılmasına ihtiyaç duyulduğu,
açık veri ortamlarının ve platformlarının oluşturulması görevinin
ise Başbakanlığa verildiği, ve eylem maddelerinin ise E4.2.1 : Açık
Veri Paylaşım Portalının Oluşturulması ve E4.2.2 : Kamu Verilerinin
Açık Veriye Dönüştürülmesi ve Paylaşılması olduğu strateji dokü-
manında belirtilmektedir.
- TÜBİTAK ULAKBİM’in geliştirdiği DergiPark Projesi son dö-
nemde en önemli projelerden birisidir. Bu açık dergi platfor-
munda bugün için Türkçe ve İngilizce 1.446 dergi, 239.675 Ma-
kale, 133.050 kullanıcının kaydı vardır. Bu platform, daha çok
ülkemizde üretilen makalelerin açık olarak yayımlandığı bir
projedir. Gazi Üniversitesinde ilk örneği yapılan bu projenin bu-
gün için ülkeye yayılması ve 2013 yılından ULAKBİM altında
toplanarak bu hizmetin bilimsel dergilere ücretsiz olarak sunul-
ması ve bunu tüm akademisyenlere açmak çok önemli bir proje-
dir. Bunun etkileri gelecekte daha net olarak görülecektir. Bunun
konferanslar, seminerler ve çalıştaylar içinde geliştirilmesi çok
faydalı olacaktır. Ülkede üretilen bilimi, bu platform üzerinden
sunmak ve gelecekte bu verileri farklı amaçlar için analiz etmek,
ona göre planlamalar yapmak, yapılan çalışmaların etkisini gör-
mek kolaylaşacaktır.
- Bilgi Güvenliği Derneğinin her yıl Gazi Üniversitesi, ODTÜ ve
İTÜ ile düzenlediği Uluslararası Bilgi Güvenliği ve Kriptoloji
konferansında sunulan bildirilerin ve yapılan sunumların www.
S İ B E R G Ü V E N L İ K T E B Ü Y Ü K V E R İ V E A Ç I K V E R İ K U L L A N I M I
173
iscturkey.org adresinden tamamının ücretsiz yayımlanması ise
bir diğer güzel örnektir. Bu tür örneklerin ve paylaşımların hızla
artması, verilerin boyutlarının büyümesine ve toplanan veriler-
den yeni çıkarımların ve değerlerin elde edilmesini kolaylaştıra-
caktır.
Dostları ilə paylaş: |