lördag 19 januari 2008

Fotbollens framtid IV - lek med siffror

På grund av en seg och slö lördagsförmiddag bestämda jag mig lite för att leka med några enkla modeller för tävlingsbalans för en liga som jag svamlade om en del tidigare. Det tog ett tag, jag har inget vettigt program för statistiska beräkningar på burken och bestämde mig för att göra en enkel linjär regression på det gamla hederliga sättet; huvudräkning. OK jag använde mig i och för sig av ett kalkylblad - jag är inte rainman. Får la hoppas att jag hållit tungan rätt i mun.

Om antagandet om en tilltagande obalans i den inhemska ligan gäller bör skillnaden i poäng under säsongen öka över tid. Det vill säga, topplagen tar allt fler poäng av bottenlagen i nu än förr. En enkel modell för en sådan utveckling torde vara att den oberoende variabeln år (Xi) påverkar den beroende variabeln standardavikelse i poäng (Yi) för det året.

Jag har räknat om alla allsvneska tabeller under min livstid (1978-) till två poäng för seger och beräknat en enkel linjär ekvation med följande resultat:

Yi=6,104+0,0107Xi

Inte direkt någon imponerande modell med en förklaringsgrad (Rkvadrat) på 0,01. Året förklarar 1 procent av poängvariationen mellan lagen i allsvenskan 1978-2007. Slutsatsen tycks vara att tiden har ringa betydelsen för tävlingsbalansen i den svenska högstaligan. Det stämmer överens med mitt tidigare intryck att svenska topplag inte lyckats dra ifrån de mindre lagen med hjälp av inkomster från europaspel och andra inkomster.

*****

Ja, jätteseg förmiddag var det. Så jag normaliserade herfindahls index också [H*=(H-1/N)/(1/N)]:
Norge 0,68
England 0,63
Skottland 0,45
Tyskland 0,33
Danmark 0,30
Franrike 0,24
Spanien 0,20
Italien 0,20
Sverige 0,08

*****

Jackknife residualer och hat-matris? Glöm det!


Inga kommentarer: