Langsung ke konten utama

Mengapa Juara Piala Dunia Sulit Diprediksi?


"Gamblers can price in random quirks that statisticians struggle to capture in their models" (The Economist).

Saat ini, demam Piala Dunia sedang melanda seluruh belahan dunia. Mata semua penggila bola sedang tertuju ke Rusia. Salah satu pertanyaan besar yang ditunggu jawabannya di ujung perhelatan akbar ini adalah siapa yang bakal keluar sebagai juara?

Untuk menjawab pertanyaan ini, orang lalu mencoba membuat berbagai prediksi dengan cara yang beragam mulai dari penggunaan hewan di kebun binatang hingga model-model statistik canggih dan machine learning.

Kita tentu masih mengingat Paul, seekor gurita dari Oberhausen, Jerman, yang berhasil memprediksi hasil pertandingan sepak bola dengan, boleh dibilang, sangat akurat. Betapa tidak, sepanjang perhelatan Piala Eropa 2008 hingga Piala Dunian 2010, prediksi Paul hanya dua kali melesat.

Sayangnya, sang prediktor hebat ini sudah mati. Lalu, di tengah perkembangan ilmu pengetahuan yang kian pesat dan era big datasaat ini, mampukah kita menghasilkan model saintifik yang dapat memprediksi pemenang Piala Dunia 2018 dengan sangat akurat atau setidaknya menyamai akurasi tebakan Paul?

Sulit diprediksi 
Memprediksi outcome dari sebuah turnamen sepak bola seperti Piala Dunia bukanlah pekerjaan yang mudah. Pasalnya, hampir semua tim yang berlaga di Piala Dunia kali ini memiliki kekuatan yang hampir merata. Dalam hal ini, ungkapan bahwa bola itu bundar ada benarnya karena segala kemungkinan bisa terjadi hingga menit akhir pertandingan.

Karena itu, kejutan akan terjadi di hampir setiap laga karena unsur acak (randomness) dan ketidakpastiaan (uncertainty) yang sangat dominan. Dan, memodelkan kedua komponen ini agar hasil sebuah pertandingan dapat diprediksi secara akurat adalah pekerjaan yang sangat rumit dalam pemodelan dengan metode kuantitatif.

Barangkali, hal ini jauh lebih rumit dibanding memprediksi persentase perolahan suara partai politik atau calon gubernur dalam pemilihan umum yang hampir selalu melesat meski dilakukan oleh berbagai lembaga survei secara keroyokan.

Terkait penggunaan model saintifik untuk memprediksi pemenang Piala Dunia kali ini, ada sebuah contoh menarik. Sebuah tim yang beranggotakan ahli statistik dan matematik dari Jerman dan Belgia pada awal bulan ini merilis sebuah makalah berjudul 'Prediction of the FIFA World Cup 2018 -- A random forest approach with an emphasis on estimated team ability parameters.'

Dalam makalah ini, mereka menyajikan hasil prediksi pemenang Piala Dunia 2018 yang didasarkan pada hasil simulasi dengan menggunakan metode kuantitatif yang mengkombinasikan metode ranking (rangking methods) dan metode pohon acak (random forests).

Data yang digunakan adalah hasil pertandingan Piala Dunia sebelumnya sepanjang 2002-2014 yang merupakan representasi performa tim dan informasi tambahan lainnya, seperti GDP per kapita, populasi, rangking FIFA, rata-rata umur pemain, jumlah pemain yang berlaga di Liga Champion, jumlah pemaian yang bermain di luar negeri, dan performa pelatih setiap negara peserta.

Mereka menyimpulkan bahwa Jerman bakal keluar sebagai juara dengan mengalahkan Brazil di partai final. Peluang Jerman bakal menang di laga pamungkas bahkan diperkirakan mencapai 64 persen.

Di atas kertas, Jerman memang lebih difavoritkan. Dalam sebuah publikasi bertajuk 'Investing and football', lembaga perbankan dan investasi multinasional Swiss, UBS, juga memprediksi bahwa Jerman bakal keluar sebagai juara berdasarkan hasil analisis 18 editor dan analis sepak bola serta 10.000 simulasi pertandingan.

Faktanya, Jerman secara mengejutkan tersingkir di babak penyisihan dan harus pulang lebih awal setelah ditumbangkan oleh Korea Selatan, tim yang justru sama sekali tidak diunggulkan, dua gol tanpa balas pula. Sebuah hasil pertandingan yang tentu saja sama sekali di luar plot cerita ideal.

Tumbangnya Sang Juara Bertahan memberi pelajaran berharga kepada kita bahwa memprediksi masa depan adalah pekerjaan yang tidak mudah, secanggih apa pun model yang digunakan. Terkait hal ini, statistikawan kenamaan George P. Box pernah menulis "The most that can be expected from any model is that it can supply a useful approximation to reality: All models are wrong; some models are useful."

Karena itu, tidak semua yang dikemas dengan model-model statistik canggih itu akurat, termasuk ramalan siapa yang bakal menjuarai Piala Dunia 2018. Dalam hal ini, yang bisa kita lakukan adalah menikmati setiap pertandingan sembari bersiap untuk setiap kejutan yang bakal terjadi. (*)


Komentar

Postingan populer dari blog ini

Bisakah R2 (baca: R kuadrat) Bernilai Negatif?

Koefisien determinasi (R2) merupakan ukuran kecocokan hasil estimasi sebuah model regresi linier dengan data yang dimodelkan, atau biasa disebut ukuran goodness of fit dari sebuah model regresi linier. Dengan lain perkataan, R2 menunjukkan seberapa dekat garis regresi yang diestimasi dengan data yang sebenarnya atau seberapa besar proporsi variasi variabel respon yang dapat dijelaskan oleh garis regresi. Ukuran ini dapat digunakan jika semua asumsi terkait residual telah terpenuhi. Bisakah R2 Bernilai Negatif? Pada dasarnya, R2 tidak pernah bernilai negatif, kecuali model regresi yang digunakan tanpa intersep. Jika model regresi yang digunakan tanpa intersep, maka R2 tidak bermakna meskipun bernilai positif. Kelemahan mendasar dari  R2 adalah nilainya yang selalu bertambah ketika dilakukan penambahan variabel bebas ke dalam model, meskipun variabel tersebut tidak begitu penting dalam menjelaskan variabel respon (tidak signifikan). Untuk mengatasi hal ini digunakan R

Kesalahan Spesifikasi Model: Penyebab dan Solusi

Dalam ekonometrika, ketika kita bekerja dengan model-model struktural, yakni model dimana hubungan antara variabel dalam model didasarkan pada suatu kerangka teori ekonomi, keselahan spesifikasi model kerap kali terjadi. Hal ini merupakan masalah serius yang sering terjadi pada penelitian yang menggunakan model ekonometrik, khususnya regresi, sebagai  alat analisis. Kesalahan spesifikasi menyebabkan model yang dihasilkan tidak dapat digunakan untuk kepentingan analisis karena dapat menyesatkan ( misleading ). Sedikitnya,  ada dua gejala yang dapat dijadikan acuan untuk mengetahui kalau model yang kita gunakan mengalami kesalahan spesifikasi. Dua gejala tersebut adalah sebagai berikut: 1.   Hasil running model menunjukkan tanda koefisien regresi yang merepresentasikan arah hubungan antara variabel  penjelas dan variabel respon berseberangan atau tidak sesuai dengan teori.  Meski tidak selalu merupakan gejala terjadinya kesalahan spesifikasi, kehadiran gejala ini me

Di Balik Penurunan Jumlah Petani Gurem

Hingga kini, kemiskinan di Indonesia masih menjadi fenomena sektor pertanian. Secara faktual, sebagian besar penduduk miskin tinggal di desa dan bekerja sebagai petani dan buruh tani. Ditengarai, salah satu penyebab kemiskinan masih berpusat di sektor pertanian adalah penguasaan lahan pertanian oleh petani yang kian sempit. Skala usaha yang kecil mengakibatkan pendapatan dari kegiatan usaha tani tidak mencukupi untuk memenuhi kebutuhan hidup meski kegiatan usaha tani yang dijalankan sebetulnya cukup menguntungkan. Alhasil, kesejahteraan pun begitu sulit direngkuh. Kemarin (2 Desember), Badan Pusat Statistik (BPS) telah merilis jumlah petani gurem hasil Sensus Pertanian tahun 2013 (disingkat ST2013). Menurut BPS, petani gurem didefinisikan sebagai rumah tangga pertanian yang mengusahakan lahan pertanian kurang dari setengah hektar. BPS mencatat, jumlah petani gurem pada Mei 2013 sebanyak 14,25 juta rumah tangga atau sekitar 55,33 persen dari sekitar 26 juta rumah tangga