Lees meer: Hoe bijzonder was Ajax's winterse transfer-activiteit?
Alle modellen zijn gebaseerd op dezelfde model, zie hier voor uitleg hoe het model werkt.
Deze voorspellingen zijn gebaseerd op de ELO-rating. Dit houdt in dat elk team een ELO-rating heeft, die zegt hoe goed dit team op dit moment is. Als een team een wedstrijd wint, dan stijgt haar ELO; als een team verliest daalt haar ELO. Deze stijging is groter als het team tegen een op papier betere tegenstander wint, dus als die tegenstander voor de wedstrijd een hogere ELO-rating had. Bij een gelijkspel stijgt het team dat voor de wedstrijd een lagere ELO-rating had. De ELO-rating is een veel gebruikte systematiek in met name schaken maar is van toepassing op elke sport waar twee teams of mensen het tegen elkaar opnemen. Verschil van onze implementatie van de ELO-rating met veel-gebruikten is met name dat bij voetbalwedstrijden een gelijkspel kan voorkomen, en in deze drie divisies ook heel regelmatig voorkomt.
Wat eigenschappen van deze implementatie:
* wedstrijden worden enkel mee genomen als ze gespeeld worden tussen twee clubs die we mee nemen in de voorspelling. Dit betekent dat wedstrijden in Europees verband niet worden meegenomen, en beker-wedstrijden alleen als ze tussen twee betaald voetbalclubs worden gespeeld. Promotie/degradatie en Europees voetbal play-offs en de Supercup worden wel altijd meegenomen.
* de eredivisie cup (een toernooi dat enkel voor vrouwen wordt georganiseerd) wordt alleen mee genomen voor de wedstrijden die bekend zijn. Het is nogal onzeker welke wedstrijden er in de toekomst uit de uitdagingen zullen komen.
* tweede teams van dezelfde club (Ajax 2, PSV 2, Feyenoord 2 en Utrecht 2) worden mee genomen als aparte teams en hun ELO-rating heeft geen verband met de prestaties van het eerste team of vica versa.
Het algoritme kent een hoop input parameters. Deze zijn vastgesteld door te experimenteren door alle wedstrijden die bekend zijn uit het verleden (vanaf 1956 voor de mannen, vanaf 2007 van de vrouwen) te berekenen voor de laatste helft te kijken wat het beste is. Er is dus een aparte set parameters voor mannen en vrouwen: in zijn algemeenheid zie je dat bij vrouwen grotere kans op winst voor de favoriet en dus minder kans op gelijkspel of winst voor de underdog. De parameters die zijn geoptimaliseerd:
* thuis bonus. De thuisclub krijgt (voor wedstrijden die niet op neutraal terrein zijn) een bonus in haar ELO-rating.
* de breedte van de ELO verdeling, ofwel hoe groot de kans is dat de favoriet wint of dat de underdog nog een kans maakt.
* k-factor, hoe veel de ELO van een club veranderd bij een overwinning of verlies
* labda, dit beïnvloedt of een grote overwinning zwaarder weegt dan een kleine overwinning.
* factor die de hoogte van de kans op een gelijkspel beïnvloedt
* factor die de breedte van de kans op een gelijkspel beïnvloedt, ofwel hoe groot de kans nog is als er een niveau-verschil tussen beide clubs is.
* een promotiebonus: een club die van eerste divisie naar de eredivisie promoveert krijgt een bonus, want dit betekent ook een behoorlijke verhoging van het budget. Een club die degradeert verliest uiteraard dit aantal punten.
* na elk seizoen wordt elke club een beetje teruggezet naar het historisch gemiddelde voor de club. Er is ook een factor die beïnvloedt hoe sterk dit effect is.