"Gamblers can price in random quirks that statisticians
struggle to capture in their models" (The Economist).
Saat ini, demam Piala Dunia sedang melanda seluruh belahan
dunia. Mata semua penggila bola sedang tertuju ke Rusia. Salah satu pertanyaan
besar yang ditunggu jawabannya di ujung perhelatan akbar ini adalah siapa yang
bakal keluar sebagai juara?
Untuk menjawab pertanyaan ini, orang lalu mencoba membuat
berbagai prediksi dengan cara yang beragam mulai dari penggunaan hewan di kebun
binatang hingga model-model statistik canggih dan machine learning.
Kita tentu masih mengingat Paul, seekor gurita dari
Oberhausen, Jerman, yang berhasil memprediksi hasil pertandingan sepak bola
dengan, boleh dibilang, sangat akurat. Betapa tidak, sepanjang perhelatan Piala
Eropa 2008 hingga Piala Dunian 2010, prediksi Paul hanya dua kali melesat.
Sayangnya, sang prediktor hebat ini sudah mati. Lalu, di
tengah perkembangan ilmu pengetahuan yang kian pesat dan era big datasaat
ini, mampukah kita menghasilkan model saintifik yang dapat memprediksi pemenang
Piala Dunia 2018 dengan sangat akurat atau setidaknya menyamai akurasi tebakan
Paul?
Sulit
diprediksi
Memprediksi outcome dari sebuah turnamen sepak
bola seperti Piala Dunia bukanlah pekerjaan yang mudah. Pasalnya, hampir semua
tim yang berlaga di Piala Dunia kali ini memiliki kekuatan yang hampir merata.
Dalam hal ini, ungkapan bahwa bola itu bundar ada benarnya karena segala
kemungkinan bisa terjadi hingga menit akhir pertandingan.
Karena itu, kejutan akan terjadi di hampir setiap laga
karena unsur acak (randomness) dan ketidakpastiaan (uncertainty) yang sangat
dominan. Dan, memodelkan kedua komponen ini agar hasil sebuah pertandingan
dapat diprediksi secara akurat adalah pekerjaan yang sangat rumit dalam
pemodelan dengan metode kuantitatif.
Barangkali, hal ini jauh lebih rumit dibanding memprediksi
persentase perolahan suara partai politik atau calon gubernur dalam pemilihan
umum yang hampir selalu melesat meski dilakukan oleh berbagai lembaga survei
secara keroyokan.
Terkait penggunaan model saintifik untuk memprediksi
pemenang Piala Dunia kali ini, ada sebuah contoh menarik. Sebuah tim yang
beranggotakan ahli statistik dan matematik dari Jerman dan Belgia pada awal
bulan ini merilis sebuah makalah berjudul 'Prediction of the FIFA World Cup
2018 -- A random forest approach with an emphasis on estimated team ability
parameters.'
Dalam makalah ini, mereka menyajikan hasil prediksi pemenang
Piala Dunia 2018 yang didasarkan pada hasil simulasi dengan menggunakan metode
kuantitatif yang mengkombinasikan metode ranking (rangking methods) dan metode
pohon acak (random forests).
Data yang digunakan adalah hasil pertandingan Piala Dunia
sebelumnya sepanjang 2002-2014 yang merupakan representasi performa tim dan
informasi tambahan lainnya, seperti GDP per kapita, populasi, rangking FIFA,
rata-rata umur pemain, jumlah pemain yang berlaga di Liga Champion, jumlah
pemaian yang bermain di luar negeri, dan performa pelatih setiap negara
peserta.
Mereka menyimpulkan bahwa Jerman bakal keluar sebagai juara
dengan mengalahkan Brazil di partai final. Peluang Jerman bakal menang di laga
pamungkas bahkan diperkirakan mencapai 64 persen.
Di atas kertas, Jerman memang lebih difavoritkan. Dalam
sebuah publikasi bertajuk 'Investing and football', lembaga perbankan
dan investasi multinasional Swiss, UBS, juga memprediksi bahwa Jerman bakal
keluar sebagai juara berdasarkan hasil analisis 18 editor dan analis sepak bola
serta 10.000 simulasi pertandingan.
Faktanya, Jerman secara mengejutkan tersingkir di babak
penyisihan dan harus pulang lebih awal setelah ditumbangkan oleh Korea Selatan,
tim yang justru sama sekali tidak diunggulkan, dua gol tanpa balas pula. Sebuah
hasil pertandingan yang tentu saja sama sekali di luar plot cerita ideal.
Tumbangnya Sang Juara Bertahan memberi pelajaran berharga
kepada kita bahwa memprediksi masa depan adalah pekerjaan yang tidak mudah,
secanggih apa pun model yang digunakan. Terkait hal ini, statistikawan kenamaan
George P. Box pernah menulis "The most that can be expected from any
model is that it can supply a useful approximation to reality: All models are
wrong; some models are useful."
Karena itu, tidak semua yang dikemas dengan model-model
statistik canggih itu akurat, termasuk ramalan siapa yang bakal menjuarai Piala
Dunia 2018. Dalam hal ini, yang bisa kita lakukan adalah menikmati setiap
pertandingan sembari bersiap untuk setiap kejutan yang bakal terjadi. (*)
Komentar
Posting Komentar