Bulut Bilişim ve Büyük Veri Çalıştayı 2015



Teknolojinin hızlı gelişimiyle birlikte, çoklu kaynaklardan üretilen veri miktarı devasa boyutlara ulaşmış, bu veriyi işlemek için gerekli sistemlerin kaynak ihtiyacına göre etkin şekilde yönetilmesi, işletilmesi ve güç tüketim maliyetlerinin azaltılması zorunlu hale gelmiştir. Bu bağlamda, bulut bilişim ve büyük veri çözümleri tüm dünyada giderek önem kazanmakta ve her geçen gün daha da yaygınlaşmaktadır. TÜBİTAK BİLGEM Bilişim Teknolojileri Enstitüsü (BTE) bulut bilişim ve büyük veri konusundaki çalışmalarını, dünyadaki gelişmeler ışığında ve ülkemiz ihtiyaçları doğrultusunda, T.C. Kalkınma Bakanlığı Yatırım Programı destekli “Bulut Bilişim ve Büyük Veri Araştırma Laboratuvarı” projesi ile yürütmektedir. Ulusal boyutta pek çok paydaşı ilgilendirecek bu laboratuvar sayesinde, bulut bilişim ve büyük veri alanlarında ileri düzeyde araştırmaların yapılması, ihtiyaç duyulan ürünlerin yerli kaynaklarla geliştirilmesine öncülük edilmesi, bu alanlarda çalışacak paydaşlar için araştırma yapma ve danışmanlık alma olanaklarının sunulması hedeflenmektedir.

TÜBİTAK BİLGEM BTE tarafından 2014 yılında ilki düzenlenen Bulut Bilişim ve Büyük Veri Çalıştayı, konusunda uzman çok sayıda katılımcının iştirakiyle etkin bir şekilde gerçekleştirilmiştir.

“2. Bulut Bilişim ve Büyük Veri Çalıştayı”, 10-11 Aralık 2015 tarihleri arasında, The Green Park Hotel Pendik, İstanbul'da düzenlenecektir. Çalıştay, konularında uzman konuşmacılar ile ülkemizdeki büyük veri çalışmalarının yönlenmesinde rol almak isteyen kamu kurum ve kuruluşları, üniversiteler ve özel sektör çalışanlarının katılımıyla gerçekleştirilecektir.

Kurumların devasa büyüklükteki verilerinin doğru öngörüler yapabilmek için doğru hızda ve doğru zamanda işlenmesini, yönetilmesini ve depolanmasını mümkün kılan büyük veri teknolojileri; sağlık, güvenlik, enerji, tarım, ekonomi gibi birçok sektör için çözüm sunma potansiyeli taşımaktadır. “Kamuda Büyük Veri ve Analitik Kazanımlar” temasıyla gerçekleştirilecek olan 2. Bulut Bilişim ve Büyük Veri Çalıştayı’nda, tahminleme, öngörü ve karar destek odaklı kamu ihtiyaçlarının büyük veri analitiği ile karşılanmasına yönelik öncelikli kullanım senaryolarının belirlenmesi hedeflenmektedir. Yapılacak çalışma sonunda, ilgili paydaşların bilgi ve tecrübeleri doğrultusunda bir iletişim ağı oluşturulacak, analitiği kamu yararına fayda sağlayacak veriler ve verilerin analitiğine yönelik senaryolar tespit edilecek ve proje vizyonu doğrultusunda ortak çalışma imkânları değerlendirilecektir.

Davetli Konuşmacılar

 
Assoc. Prof. Vasilis Vassalos

The Medical Informatics Platform of the Human Brain Project has the challenging task of organizing and presenting a variety of data originating from different hospitals and hospital systems in a unified way, while allowing users to access it following an, as much as possible, uniform structure and terminology, and while protecting patient privacy as imposed by national legislation and institutional ethics. In this talk we present an overview of the Medical Informatics Platform goals and challenges. We more specifically focus on their data integration aspects and analyze preliminary steps taken towards addressing these challenges.

 
Harald Mueller
Ensuring success in Big Data

Big Data is a phenomenon that is widely misunderstood across the industry. Though it originally has risen as a phrase to demonstrate the increasing amount of data and that is how received the name “Big”, the real life impact of Big Data has become much more complex over time. At the end of the day, every organization wants to analyze their data to get more insight and act on the insight, but the data has not only become much more over time but also complex and dynamic. To make it much more simple, it increases its size exponentially, it changes all the time and it mostly is not represented in a table. If you by any chance miracolously achieved to have a single view of data for instant in time by having the best database of the planet, what are you going to do if you want to make more additions to rows or coloumns? What are you going to do if you want to merge two sperate databases? What if you want to extract a certain portion of the data to make your analysis? And how does that tie with the amount of hardware, storage and licensing costs which increases constantly whereas the performance is not improving inline with your increasing costs? During the conference, Mr. Harald Müller will try to aid in helping public institutions to understand and engage the big data problem in the following order:
1. What is big data and hadoop?
2. Why Hadoop?
3. What are the challenges of the IT Manager?
4. What are the challenges of the initial Hadoop projects?
5. How can those challenges be addressed?
6. How to build the right big data strategy
7. Typical examples of big data cases across the industry"

 
Yrd. Doç. Dr. Mehmet Aktaş
Büyük Veri ve Veri Kalitesi

Günümüzde veri görülmemiş büyük bir ölçekte yaratılmakta, toplanmakta ve analiz edilmektedir. Toplu yaşamın bir çok alanında, veri güdümlü karar verme, yaygın olarak kullanılmaktadır. Yakın zamanda yapılan çalışmalar, düşük kaliteli verinin, Web ortamında ve büyük ölçekli veri tabanlarında yaygın olarak bulunabileceğini işaret etmektedir. Düşük kalitedeki verinin, veri analizi sonuçları üzerinde olumsuz yönde sonuçlar doğurabileceği açıktır. Büyük Veri kavramı için yaygın olarak kullanılan Hacim, Hız ve Çeşitlilik gibi ayırt edici özelliklerin yanı sıra, bir diğer özellik olarak Kalite de önem kazanmaktadır. Bu konuşmada Büyük Verinin Kalitesi üzerinde vurgular yapılacak, Veri Kalitesi değerlendirme ve iyileştirmeye yönelik yaklaşımlardan bahsedilecektir.

 
Yrd. Doç. Dr. Galip AYDIN

Bilişim teknolojilerindeki gelişmelerin en önemli sonuçlarından birisi de farklı kaynaklarca üretilen verinin miktarı, çeşitliliği ve üretim hızındaki görülmemiş artıştır. Global ölçekte, veri depolama sistemlerinin kapasitelerinin her 40 ayda bir ikiye katlandığı tahmin edilmektedir. Sensörler, araçlar, bilgisayarlar ve insanlar tarafından üretilen çok büyük miktardaki verinin depolanması, işlenmesi ve analiz edilebilmesi bilinen yaklaşımlarla mümkün olamamaktadır. Geleneksel araçlar ve yöntemlerle işlenemeyecek ve analiz edilemeyecek kadar yüksek hacimli verilere Büyük Veri adı verilmiştir. Bu kavram aynı zamanda büyük verilerin depolanması, işlenmesi ve analiz edilmesi için kullanılan teknolojileri de ifade etmektedir. Bu konuşmada Büyük Veri kavramı ve temel özellikleri tanıtılacak ve büyük verilerin depolanması ve analiz edilmesi için kullanılan açık kaynak teknolojiler anlatılacaktır. NoSQL veritabanları, Dağıtık Dosya Sistemleri, MapReduce programlama gibi popüler kavramlar kısaca izah edilecektir. Büyük Veri analizinin ne anlama geldiği açıklanacak, bunun için kullanılan Veri Madenciliği ve Makine Öğrenmesi algoritmalarından bahsedilecek ve başarılı Büyük Veri analizi örnekleri sunulacaktır.

 
Yrd. Doç. Dr. Mehmet Bedii KAYA


Kamu hizmetleri, farklılaşan sosyal ve ekonomik gereksinimler sebebiyle karmaşık hale gelmektedir. Kamu hizmetlerinin adil, süratli, kaliteli, etkili ve verimli bir şekilde yerine getirilmesi için rasyonel olarak planlanmaları ve yürütülmeleri gerekmektedir. Kamu hizmetlerinin sunumunda bilişim sistemlerinden faydalanılması neticesinde kamunun elinde çeşitli nitelikte ve büyüklükte veriler toplanmaktadır. Yürütülen kamu hizmetinin niteliğine göre veriler, anlamlandırıldıkları takdirde somut kamu hizmetini yürüten idare dışında diğer idareler için de önemli bilgiler içerebilmektedir. Kamu hizmetleri bir bütün olarak değerlendirildiği takdirde, kamu otoriteleri arasında sürekli ve pratik şekilde veri ve bilgi paylaşımının yapılması gerekmektedir. Kamusal verilerin salt kamu otoriteleri arasında değil kamu ile özel sektör ile de belirli koşullarda paylaşılması gerekmektedir. Nihayetinde, kamusal veriler mevcut bilgi sistemlerinin işleyemeyeceği kadar geniş ve karmaşık veri kümeleri oluşturmaktadır. Bu verilerin anlamlandırılmasında özel sektörden katkısı yadsınamaz. Ayrıca, bu verilerin paylaşımı ile katma değeri yüksek, yenilikçi hizmetlerin geliştirilmesi mümkündür. Bu çalışmanın amacı kamusal verilerin yukarıda belirtilen amaçlarla akışkanlığının sağlanmasında Türk hukukunun mevcut durumunu ortaya koymaktır. Bu doğrultuda, verileri akışkan hale getirmek için hangi hukuki ilkelere dikkat edilmesi gerektiği ve nasıl bir usulle veri paylaşımı yapılması konularına etraflıca değinilecektir.

 
Murat Yaşar

- Forrester Predictions 2016 - The Government's Slow Progress
- The Chief Data Officer Crosses The Chasm
- Choose The Right Technologies For Your Big Data Plans
- Fourteen Reasons Why Federal Agencies Must Improve Their Customer Experience

 
Dr. Devrim ÜNAL
BÜYÜK VERİ VE BULUT BİLİŞİMDE MAHREMİYET TABANLI TEKNOLOJİLER

Modern iletişim ve çevrimiçi hizmetleri kullanıcıların bu hizmetleri kullanabilmeleri için büyük miktarlarda kişisel veriyi sağlamalarını beklemektedir. Örneğin arama motorları kullanılan sorgulama terimlerini açığa çıkarmakta, sosyal ağ hizmetleri kişilerin sosyal bağlantılarını ve kişisel yaşantılarına ilişkin detayları ortaya koymakta, web tarayıcıları daha önceden ziyaret edilen site ve sayfaların profilini çıkararak hedefli reklamcılık gibi hizmetlere sağlamaktadır. Mahremiyet Tabanlı Teknoloji'ler (MTT) sistemlerin tasarım ve mekanizmalar vasıtasıyla kişisel bilgilerinin gerektiğinden daha fazlasını ortaya çıkarmadan ve üçüncü partiye paylaşılan veride kişinin kendi verisi üzerinde kontrolünü kaybetmeden çevrimiçi hizmetleri alabilmelerine imkan tanıyan teknolojik çözümleri içerir. Bu teknolojilere örnek olarak anonimizasyon yöntemleri, verinin güvenli olarak depolanması ve erişilmesi, veritabanlarının mahremiyet korumalı olarak aranması, mahremiyet tabanlı kimlik yönetimi ve gizli veri üzerindeki işlemlerin karşılıklı ortaklaşa hesaplamalarla veriyi ortaya çıkarmadan yapılabilmesini sağlayan teknolojiler verilebilir. MTT’leri diğer mahremiyet korumaya yönelik teknolojilerden ayıran özellik, tehdit modelinin kısıtlayıcı olmasıdır: tek bir merkezi otorite, tanım olarak tekil bir hata noktası oluşturacağından mahremiyet hizmetleri için kullanılmaz. Kullanıcılar kendi cihazlarına veya belirli bir hizmet grubuna güvenirler ve birbiriyle işbirliği yapmadıkları varsayılır. Bu mahremiyet tasarım prensibiyle güçlü karşı tehdit unsurlarına karşı güvence sağlanır ancak bu teknolojilerin tasarım, gerçekleştirme ve uygulamasında karmaşıklık sorununu da ortaya çıkarır. Sunumda MTT'lerin büyük veri ve bulut bilişime uygulanması ele alınarak farklı mimari alternatifler ile karmaşıklık sorununun nasıl adreslenebileceği tartışılacaktır.

 
Dr. Mehmet Sabır Kiraz
Büyük Veride Gizlilik, Bütünlük ve Mahremiyet

Teknolojinin hızla gelişmesiyle birlikte mobil cihazlar ve bunların kullanımı hızla artmaktadır. Mobil teknolojiler artık Bulut içerisindeki büyük veri merkezlerine erişebilmekte, tüm verilerimiz Bulutta bulunmakta ve hatta tüm işlemler Bulut üzerinde yapılmaktadır. Milyarlarca cihazın birbirleriyle iletişiminden yüksek miktarda veriler oluşmakta, bu verilerin mahremiyet ihlal edilmeden işlenmesi gerekmektedir. Veriler artık kullanıcı tarafında bulunmadığından kendi kontrolünden çıkmakta, bundan dolayı da yeni güvenlik açıklarına sebebiyet vermektedir. Kişisel ve Kurumsal Bulut kullanımlarında güven modelleri doğal olarak farklılaşmaktadır. Kurumsal müşteriler ve paydaşlarının denkleme istediği şekilde dahil edilmesi gerekmektedir. Bu nedenle, Bulut'ta güvenlik ve mahremiyet mekanizmalarının incelenmesinde Güven ve Güvenilirlik iki önemli kavram olarak öne çıkmaktadır. Büyük veriye sahip buluta ne kadar / nasıl güvenmeliyiz? Bulut kullanımında uygulanacak güvenlik modellerinin ispatı yapılabilir mi? Büyük veriler işlenirken gizlilik ve/veya mahremiyet nasıl korunabilir?
Veri iletimi için gerekli olan SSL/TLS, SSH, VPN veya IPSEC gibi kriptografik protokollerin sağladığı güvenlik, Bulut'taki hesaplama ve depolama işlemlerindeki yeni saldırı tiplerini karşılamamaktadır. Aynı şekilde sadece AES, RSA, SHA ailesi, ve eliptik eğri kriptografi gibi standart simetrik/asimetrik kriptografik algoritma ve protokollerinin kullanımı güvenlik gereklerini sağlamada yeterli olsa da mahremiyet isterleri için ekstra kripto yapıtaşlarına ihtiyaç duyulmaktadır.
Bu konuşmada, güvenli iletişime ek olarak, güvenli hesaplama yöntemleri ile hem verileri ve hem de işlenmesini güvenli bir şekilde Buluta tevdi edilmesi, gizliliği ve mahremiyeti ihlal etmeden verilerin değiştirilememesi, silinememesi ve doğru bir şekilde işlenebilmesi gibi Buluta özgü güvenlik ve mahremiyet problemlerine değinilecek ve teknik açıdan en verimli çözümler incelenecektir.

 
Yeşim Araç Öztürk
Büyük Kararlar Büyük Veri Gerektirir

3. platform teknolojilerinden biri olan büyük veri diğer geleneksel veri ortamlarına göre farklı avantajlara sahiptir. Büyük veri, hız, çeşitlilik ve hacim gibi özelliklerinin yanı sıra kurumların daha önce inceleme imkanına sahip olmadığı kapıları açmaktadır. Bu sunumda, dünyada gerçekleştirilen büyük veri proje örnekleri paylaşılarak diğer kurumların nasıl kazanımlar elde ettikleri anlatılacak ve Türkiye’deki kamu kurumlarının büyük veri algısı üzerinde durulacaktır.

Çalıştay Programı

10-11 Aralık 2015
The Green Park Hotel Pendik, İstanbul
calistay2015.b3lab.org

10 Aralık Perşembe  
09:00-09:30 Kayıt
09:30-10:00 Açış Konuşmaları
09:30-09:45 Prof. Dr. Hacı Ali MANTAR, BİLGEM Merkez Başkanı
09:45-10:00 Dr. Mehmet SEZGİN, BTE Enstitü Müdürü
10:00-10:30 Davetli Konuşmacı - Harald Mueller
"Ensuring success in Big Data"
10:30-11:00 Davetli Konuşmacı - Assoc. Prof. Vasilis Vassalos
"Data Integration in the Human Brain Project"
11:00-11:30 Çay/Kahve Arası
11:30-11:50 Davetli Konuşmacı - Murat Yaşar
"Predictions 2016 & The Right Technologies For Your Big Data Plans"
11:50-12:10 Davetli Konuşmacı - Yeşim Araç Öztürk
"Büyük Kararlar Büyük Veri Gerektirir"
12:10-12:30 Davetli Konuşmacı - Yrd. Doç. Dr. Galip Aydın
"Büyük Veri Analizinde Açık Kaynak Teknolojiler"
12:30-13:30 Öğle Yemeği
13:30-15:30 İhtiyaç Belirleme Çalışması I
Grup Çalışmaları ve Konsolidasyon
15:30-16:00 Çay/Kahve Arası
16:00-17:00 İhtiyaç Belirleme Çalışması II
Diğer Gruplara Katkı - Önceliklendirme
11 Aralık Cuma  
09:00-09:20 Davetli Konuşmacı - Yrd. Doç. Dr. Bedii Kaya
"Kamusal Verilerin Hukuki Niteliği"
09:20-09:40 Davetli Konuşmacı - Yrd. Doç Dr. Mehmet Aktaş
"Büyük Veri ve Veri Kalitesi"
09:40-10:00 Davetli Konuşmacı - Dr. Mehmet Sabır Kiraz
"Büyük Veride Gizlilik, Bütünlük ve Mahremiyet"
10:00-10:20 Davetli Konuşmacı - Dr. Devrim Ünal
"Büyük Veri ve Bulut Bilişimde Mahremiyet Tabanlı Teknolojiler"
10:20-10:45 Çay/Kahve Arası
11:00-12:30 Çözüm Önerisi Geliştirme Çalışması I
Konsolidasyon Grup Çalışmaları
12:30-13:30 Öğle Yemeği
13:30-15:00 Çözüm Önerisi Geliştirme Çalışması II
Paylaşım Grup Çalışmaları
15:00-15:30 Çay/Kahve Arası
15:30-16:20 Çözüm Önerisi Detaylandırma Çalışması
16:30-17:00 Değerlendirme ve Kapanış

GENEL BİLGİLER

  •   BİLGEM Santral
  •   Özlem KARADENİZ
  •   Savaş DAVAZ
  •   İletişim
  • +90 (262) 648 10 00
  • +90 (262) 675 23 92
  • +90 (262) 648 13 22
  • iletişim e-postası

ÇALIŞTAY YERİ BİLGİLERİ

  •   The Green Park Hotel (Ankara Salonu)
  •   +90 (216) 585 21 21
  •   Kaynarca Mah. Erol Kaya Cad. No: 204
  •       Pendik / İstanbul

ORGANİZASYON KOMİTESİ

  • Dr. Mehmet SEZGİN
  • Dr. Yıldırım BAHADIRLAR
  • Dr. Oğuz İÇOĞLU
  • Özleyiş BAYOĞLU
  • Savaş DAVAZ
  • Özlem KARADENİZ
  • Gizem BURUN
  • Özlem Gemici GÜNEŞ
  • F. Canan Pembe MUHTAROĞLU