Michael Lewis’in çok satan kitabı Moneyball uyguladığı büyük veri analizi yöntemi sayesinde birçok kişinin, özellikle de spordan en çok kazanç sağlayan kişiler olan kulüp sahiplerinin, yöneticilerin ve sporcuların spor hakkındaki görüşlerini değiştirmişti. Lewis’in kitabı oyuncu performanslarının anekdotlar ve sezgilerden ziyade kanıta dayalı bir yaklaşımla ölçüldüğü ve değerlendirildiği bir devrim niteliğindeydi.
O zamandan beri spor bilimcileri bu büyük veri analizi anlayışını basketbol, futbol, Amerikan futbolu vs. gibi popüler sporlara uygulamaya çalışıyor. Bu bilim özellikle karşılaşma devam ederken oyuncular ve oyun hakkında büyük miktarda veri toplayabilme yaklaşımına dayanıyor.
Ne var ki bu sporların çoğunda veri toplama henüz bu veriyi anlamlı bir biçimde değerlendirme şeklinde uygulanamıyor. Bu yüzden spor bilimlerinin bu veriyi verimli bir şekilde değerlendirme sürecinde ne gibi zorluklarla karşılaştıkları ilginç bir soru halini alıyor. Hızla gelişen bu alanda hüküm süren sorular neler?
Artık bu soruya Sydney Üniversitesi’nden Joachim Gudmundsson ve Michael Horton’un bu alanı inceleyen ve araştırmacıların analizlerini anlamlı verilere dönüştürme çabası içinde karşılaştıkları zorlukları ele alan çalışması sonucunda cevap verebiliyoruz.
Bu araştırmacıların ele aldıkları sporlar genel anlamda istila oyunları olarak adlandırılıyor. Bu oyunların tümü sınırlı bir alanda topu ele geçirmek için birbiriyle mücadele eden iki takım tarafından oynanıyor. Her iki takımın da amacı topu karşı tarafın kalesine sokmak ve kendi kalelerini korumak. Daha fazla skoru yapan takım oyunun sonunda maçı kazanıyor.
Bu yapıdaki istila oyunları arasında futbol, basketbol, buz hokeyi, çim hokeyi, rugby, Avustralya futbolu, Amerikan futbolu vs. bulunmakta. Fakat en çok veri profesyonel futbol ve basketbol gibi, bu veriyi elde edecek kaynakların bol olduğu sporlardan geliyor.
Bu veriler genellikle oyuncuların oyun boyunca kat ettikleri mesafeden ve pas, şut, defansif müdahale gibi olayları tanımlayan olay kayıtlarından oluşuyor. Godmundsson ve Horton bu konu için “En yeni takip sistemleri artık oyuncuların kat ettikleri mesafenin uzay-zamansal izlerini yüksek çözünürlüklü ve yüksek frekanslı olarak sunabiliyor, bu da bu veriler hakkında yorum yapılabilecek çok çeşitli araştırma biçimlerine olanak tanıyor,” diyor.
Spor bilimlerindeki en büyük meselelerden biri bu veriyi ister oyun esnasında gerçek zamanda ister antrenman, hazırlık veya oyuncu alımı sürecinde rakiplere karşı avantaj elde edecek şekilde kullanmak. Fakat bir yandan araştırmacılar bu yönde ciddi ilerlemeler kaydederken, önlerine birçok önemli engel de çıkıyor.
Bu engellerin en önemlilerinden birini oyuncuların sahanın ne kadarına hükmedebildiğini anlamak teşkil ediyor. Spor bilimlerinde oyuncunun hükmettiği alan diğer oyunculardan önce erişebildiği alan anlamına geliyor. Bunu hesaplamanın kolay bir yolu sahayı her oyuncuya en yakın bölümlere ayıran bir Voronoi diyagramı çizmek.
Bu diyagram hükmedilen alanların hücum eden taraf için savunma yapan tarafınkinden genellikle daha geniş olduğu gibi bilgilerle geliştirilebiliyor. Fakat sahadaki her oyuncu için Voronoi diyagramını hesaplamak bilgi işlem bakımından bir hayli pahalı bir süreç. Bu, RoboCup futbolunda dahi şu ana kadar gerçek zamanlı olarak başarılabilmiş değil.
Araştırmacılar bunun yerine farklı bir özelliği (her oyuncunun belli bir zamanda ulaşabileceği alanı) hesaplayıp birbiriyle örtüşen verileri ele alıyor. Bu da hızı %10’luk bir hata payıyla 1000 kat hızlandırıyor.
Ama yine de bu yaklaşım birtakım önemli unsurları atlıyor. Bunların en önemlilerinden biri de oyuncuların momentumunu ele almıyor olması. Hareketli bir oyuncunun duran bir oyuncuya göre daha fazla alana hükmedeceği açık.
Bu durum ise sahanın karmaşık alt alanlara ayırılmasına neden olabiliyor. A oyuncusu yerinde duran B oyuncusuna doğru koşuyorsa ikisinin de birden fazla hükmedeceği alan olabiliyor ve bu alanlar birbiriyle bağlantılı olmayabiliyor. Örneğin, A oyuncusunun momentumu bazı alanlara daha iyi erişim sağlıyor ama mesela B oyuncusunun arkasındaki alana erişim sağlamıyor.
Dolayısıyla spor bilimlerindeki cevapsız sorulardan biri gerçek zamandaki gerçekçi dominant bölgelerin nasıl hesaplanacağı.
Bununla ilgili diğer bir zor soru da bir oyuncunun kendisine atılan pası alabilecek durumda olup olmadığı. Bu da topu belirli bir oyuncunun diğer oyuncudan önce alabileceği belirli bir hız ve yön olup olmadığına karar vermek anlamına geliyor. Bu da tabii oyuncunun hakim olduğu bölgeyle bağlantılı. O bölgenin ne olduğuyla ilgili doğru bir fikir edinmek için o bölgeye gelen düz bir pası ele almak en kolayı. Mevcut araçlar da bu işi işte bu şekilde yapıyor.
Sorun şu ki yalnızca belli top hareketleri düz pas kriterine karşılık geliyor. Örneğin havadan atılan bir top düz pas sayılmıyor. Bunları (veya falsolu paslar gibi daha karmaşık hareketleri) ölçebilecek bir araç henüz geliştirilmedi ve bu da spor bilimleri için büyük veri analizi anlamında henüz cevaplanmamış bir soru niteliği taşıyor.
Ayrıca bir de bir oyuncunun karşısındaki oyuncunun etrafındaki alanı kapatarak baskı kurması durumu söz konusu. Bu durum nasıl ölçülebilir ve modellere uygulanabilir?
Spor analizinin önemli bir kısmını ağ bilimleri oluşturuyor. Bu modelde her oyuncu bir düğüm olarak ele alınıyor ve top birinden öbürüne geçtiğinde aralarında bir çizgi çekiliyor. Bu yöntem verimli bir araştırma alanı halini aldı çünkü ağları analiz etmek için elimizde halihazırda birçok matematiksel araç bulunmakta.
Örneğin, merkezilik adı verilen ölçüt kullanılarak ağdaki en önemli düğümleri tespit etmek mümkün. Futbolda en düşük merkezilik kalecilerde ve forvet oyuncularındayken, en yüksek merkezilik savunma ve orta saha oyuncularında.
Aynı bilimsel yaklaşım ağların kümelere bölünebilmesini de mümkün kılıyor. Bu yaklaşıma göre bazı takım oyuncuları yalnızca birbirleriyle paslaşabiliyor veya birlikteyken daha verimli çalışabiliyorlar.
Gelgelelim, ağ bilimindeki sorun merkeziliği ölçmenin ve kümeleri belirlemenin sayısız farklı yolu olması ve bir yöntemin diğerine neden tercih edilmesi gerektiğinin her zaman net olmaması. Dolayısıyla bu farklı yöntemlerin kullanışlılıklarına ve değerlerine karar vermek üzere sistematik olarak nasıl değerlendirileceği ve karşılaştırılacağı diğer bir cevapsız soruyu oluşturuyor.
Diğer bir soru dizisi ise maç verilerinin analiziyle ilgili. Örneğin, oyun esnasındaki bir zaman dilimi içerisinde eldeki birtakım oyuncu hareketleri ve olay kayıtları ile takım dizilişini (örneğin futboldaki 4-4-2) veya savunma yapan takımın, mesela basketboldaki tam saha pres veya alan savunması gibi, nasıl bir markaj sistemi uyguladığını tespit etmek mümkün mü?
Bunun bazı sporlarda ara sıra yapılabileceğine dair bazı kanıtlar bulunmakta. Fakat hala esas amaç insan performansını yakalamak veya geçmek.
Gudmundsson ve Horton ortaya birçok başka cevapsız soru da atıyor ve futbol ve basketbol gibi sporlar için geliştirilen fikirlerin hokey veya hentbol gibi diğer istila oyunlarına uygulanabilirliğini sorguluyor.
Fakat bu soruları yanıtlayacak algoritmaları mükemmel hale getirmek hala bardağın yarısını dolduruyor. Bir sonraki aşama bu araçların hem saha içindeki hem de saha dışındaki performansı nasıl arttırabileceğini sorgulamak. Bu araçlar oyuncu performansı ve değeri için ölçüt olarak kullanılabilir mi? Bir takımda başarılı olan bir oyuncunun başka bir takımda başarılı olup olamayacağını öngörebilir mi? Ve bu büyük veri analizi bir maç esnasında teknik adamlara ve seyircilere yardımcı olmak amacıyla gerçek zamanlı olarak kullanılabilir mi?
Bunlar muhtemelen önümüzdeki yılların önemli gelişmeleri olacak. Belli ki spor alanındaki veri analistlerini heyecan verici zamanlar bekliyor.