Büyük veri piyasası içerisinde çok sayıda araç bulunmaktadır ve hangilerinin iyi hangilerinin kötü olduğunu belirlemek bir hayli güçtür. Hangi aracın bir kurum için doğru araç olduğunu belirlemek için kimi zaman danışmanlara başvurmak faydalı olabilir ama bazen piyasaya daha derinlemesine bakmak ve hangi araçların ne işe yaradığını bilmek de bir o kadar önemlidir.
Aşağıda büyük veri piyasasında kendine yer edinmek isteyenler için en iyi 10 geliştirici aracı bulunmakta.
- Tableau
Tableau şöhretini veri görselleştirme alanında edinmişti ama bu aracın yalnızca eldeki veriden güzel resimler elde etme imkanı sunan bir şey olarak görülmemesi gerekiyor.
Şirketin bu aracı son zamanlarda ciddi seviyede gelişti ve artık piyasanın en önde gelen analiz şirketleriyle rekabet edecek hale geldi.
Bu platformun en cazip yönlerinden biri oldukça aktif olması. Bu da ihtiyacınız olan yardıma ve yeniliklere kolayca ulaşabileceğiniz anlamına geliyor.
Tableau’nun en önemli özellikleri arasında bellek içi veritabanı ve gelişmiş sorgulama dili. Ayrıca XML, User Scripts, Python ve JavaScript’i destekliyor.
- Splunk
Splunk’ın en önemli özelliği, araçlar ve bu araçların yapabildikleri söz konusu olunca ön plana çıkan bir alan olan makine verisini verimli bir şekilde kullanabilmesi.
Şirketin bu kolay kullanımlı yazılımı sayesinde web siteleri, uygulamalar ve sensörler gibi kaynaklardan veri toplama işi bir hayli kolaylaşıyor. Geliştiriciler istedikleri herhangi bir platformu, dili veya çerçeveyi kullanarak kod yazabiliyor. Bunun yanında Visual Studio gibi araçları kullanarak uygulama geliştirebiliyorlar.
Splunk yakın zamanda ticari sürümünü 6.4’e yükseltti ve platform güvenliği ve yönetimi, interaktif görselleştirme ve gelişmiş analiz konularında çok sayıda güncelleme yaptı.
Eclipse için geliştirilen eklentisinde Java uygulamaları için Splunk SDK oluşturulabilen bir şablon bulunuyor. Şirket ayrıca .NET veya Java uygulamalarının log aktivitesini kolaylaştıran günlük kütüphaneleri de sunuyor.
- Talend
Data entegrasyonu yazılımı alanında güçlü bir şirket olan Talend geliştiricilerin ekosistemdeki son yenilikleri takip edebilmelerini sağlayan açık kaynaklı bir araç olan ve aktif bir kullanıcı camiası tarafından desteklenen Open Studio’yu sunuyor.
Şirketin veri yönetimi ve uygulama entegrasyonu ürünlerinin geliştirilmesine, test edilmesine ve dağıtılmasına yönelik araçlar sunuyor. Şirket ayrıca kuruluşların sınırları dışında dahi tüm alanları yönetiyor.
Şirketler verinin entegrasyonunda sorun yaşıyorsa ve geliştiriciler bu iş için bir araca ihtiyaç duyuyorsa Talend en iyi seçeneklerden biri.
- Pentaho
Pentaho’nun gücü veri entegrasyonunu ve iş analizini büyük verinin görselleştirilmesi ve analiz edilmesi için bir araya getirmekte yatıyor. Ortada çok büyük miktarda veri varken tam bir görüş edinmek üzere bu veriyi bir araya getirmek çok zor olabilir. Pentaho bu sorunun üstesinden gelen bir geliştirici aracı.
Entegre hale getirilebilir açık bir platform olan Pentaho gelişmiş analiz özelliğiyle birlikte veri madenciliği ve tahminsel analiz işlevlerini de sunuyor.
Listedeki diğer platformlar gibi Pentaho da aktif bir geliştirici topluluğu tarafından destekleniyor. Platformun diğer bir cazip yanı ise her tür veriyle veya Hadoop, NoSQL ve analitik veritabanları için yerel destek içeren veri kaynaklarıyla bağlantı sunması.
- MongoDB
MongoDB en son sonuçlar üzerinde tam kontrol isteyen geliştiriciler için ideal bir açık kaynaklı veritabanı. Tüm özelliklerin yatay olarak indekslenebileceği bir indeks desteği ve esnekliği sunuyor ve en önemlisi de bunu işlevselliği etkilemeden yapıyor.
Belge tabanlı sorgulamalar ve dosyaların saklanması için GridFS’ler sayesinde geliştiriciler yığınların güvenliğinin riske girmesi konusunda hiçbir sorun yaşamıyor.
Ölçeklendirilebilir veritabanında ayrıca Edda ve Fluentd gibi üçüncü parti log araçları da bulunuyor.
- Cambridge Semantics
Cambridge Semantics olağanüstü akıllı araçlar üretmesiyle ünlü bir marka. Şirket kullanıcıların büyük veriyi toplayarak, entegre ederek ve analiz ederek geliştiricilerin birleşik erişim çözümleri oluşturabilmesini sağlayan açık kaynaklı bir platform olan Anzo Software Suite’i kullanıyor. Veri koleksiyonunu düzenleyen ve analizi kolaylaştıran bir veri entegrasyonu makinesiyle birlikte kullanıldığında güçlü bir ürün halini alıyor.
Önemli özellikleri arasında veriyi farklı kaynaklardan ve özel yönetim panellerinden toplayıp bir araya getirerek analizi kolaylaştırması bulunmakta.
- SAP HANA
SAP’in geniş bir portfolyosu var ve uzun zamandan beri ürünlerini tam entegre bir platformda sunuyor.
HANA platformunun gücü bellek içi özelliklerinden geliyor, bu da olağanüstü hızlı olması ve büyük miktarda iş yüklerinin üstesinden gerçek zamanda gelmesi anlamına geliyor. Platform özellikle hız arayan ve Nesnelerin İnterneti işlevleri için uygulamalar geliştiren geliştiriciler için faydalı.
Şirket SAP platformunu tamamen entegre hale getirmeyi istemenin yanı sıra, platformun daha geniş bir ekosistemin çekirdeği halini almasını da istiyor. Platform Apache Hadoop ve benzer araçlarla bir arada kullanılabiliyor.
- MarkLogic
MarkLogic bilhassa çok ağır veri yükleriyle çalışan kurumlar için iyi bir geliştirici aracı. Gerçek zamanlı güncellemelere ve uyarılara erişim sunan bu platform içerik ve konum ilişkisi ve veri filtreleme araçlarıyla birlikte kullanılarak coğrafi veri sunuyor. Ücretli içerik arama uygulamaları arayanlar için çok sayıda araca sahip.
Node.JS Client API gibi esnek API’ları desteklemesinin yanı sıra, NoSQL’i de destekliyor ve geliştiricilere MarkLogic konseptlerini ve örnek kodunu kullanarak referans mimarisinin nasıl uygulanacağını gösteren Samplestack’i içeriyor.
- Splice Machine
Hadoop hiç şüphesiz büyük veri dünyasındaki en iyi seçeneklerden biri ve Splice Machine de kullanıcıların işlenmeye müsait analizler yapabilmesini kolaylaştıran gerçek zamanlı SQL-on-Hadoop veritabanı özelliğiyle öne çıkıyor. Hızlı gelişim arayanlar için iyi bir seçenek.
Araç standart SQL kullanımı, sonrasında ise bunu ticari ürün üzerinde kullanma seçeneğini sunuyor. Splice Machine’de ne MySQL’de ne de Oracle’da istediği ölçeklendirmeyi yapabilen geliştiriciler için araçlar bulunmakta.
Splice Machine SQL %99 uyumlu, standart ANSI SQL’e sahip ve petabayt seviyesinde dağıtım yapabiliyor. Ayrıca .NET, Python, JavaScript ve Angular JS’i destekliyor.
- Google Charts
Google’ın olmadığı bir geliştirici aracı listesi düşünülemez. Google Charts da bir web sitesinden alınan verinin hiyerarşik ağaç haritaları veya basit tablolar halinde görselleştirilebilmesini sağlayan ücretsiz bir araç.
Kullanıcıların bu aracı kullanmak için yapmaları gereken tek şey bir web sitesine JavaScript kodunu yerleştirmek. Sonrasında verinin sınıflandırılması, değiştirilmesi ve filtrelenmesi mümkün. Platform ayrıca veritabanlarına bağlanma veya web sitelerinden veri çekme özelliğini de sunuyor.
Araç birçok popüler dili destekliyor ve platformda oldukça hareketli bir destek platformu var.