Gdybyśmy poprosili drugą osobę o wybranie w myślach liczby od 1 do 100, a następnie spróbowali ją odgadnąć, mielibyśmy dokładnie 1 proc. szans na to, że wybierzemy poprawną liczbę. Intuicyjnie możemy ocenić, że 1 procent szans to niewiele. Z drugiej strony na Euro jedzie 10 drużyn, których szanse są jeszcze mniejsze. Prezes PZPN Zbigniew Boniek określa wyjście z grupy jako cel minimum na zbliżającym się turnieju i na osiągnięcie tego poziomu Polacy mają już zdecydowanie większe szanse - dokładnie 62 proc.

Nasze prognozy opieramy na modelu matematycznym zbudowanym i przetestowanym na historycznych danych. Nasza baza meczów zawiera ponad 20 tysięcy meczów reprezentacyjnych. Pierwszy mecz w bazie, rozegrany pomiędzy Anglią i Szkocją, datowany jest na rok 1872.

Skąd w tytule wzięła się liczba 100 tysięcy? Model ma charakter probabilistyczny, co oznacza, że dopiero po przeprowadzeniu odpowiedniej liczby powtórzeń, sumaryczne wartości prawdopodobieństwa zbliżają się do prawdy. Możemy o tym myśleć jak o rzucie monetą. Wyobraźmy sobie, że wiemy, że nasza moneta nie jest wyważona - to znaczy, któraś strona jest cięższa i będzie częściej spadać ku ziemi. Po jednym rzucie nie możemy wnioskować o tym, która strona monety jest faktycznie cięższa. Jeżeli rzucimy 10 razy i 8 razy otrzymamy orła, będziemy mieli większą pewność, że to reszka jest cięższa. Nie przestając rzucać będziemy nabywali coraz większą pewność. Tak samo jest z naszym modelem - rozgrywając wirtualnie cały turniej 100 tys. razy, nabieramy pewności, że prawdopodobieństwa są bliskie ostatecznym wartościom.

Opisany poniżej model pozwala niejako sprowadzić symulacje każdego meczu do rzutu kostką z trzema ścianami. Każda ściana oznacza wygraną gospodarzy, remis lub wygraną gości. Oczywiście wyrzucenie każdej ze ścian nie jest równie prawdopodobne. Na tym właśnie polega zadanie modelu. Chcemy, żeby na przykład w meczu Polska - Hiszpania, kostka zdecydowanie częściej wypadała na ścianę oznaczające wygraną Hiszpanii. Na tym właśnie polega symulacja całego turnieju i dlatego rzucamy tą metaforyczną kostką aż 100 tys. razy.

Zanim przeanalizujemy dokładniej turniejowe scenariusze, przyjrzyjmy się, na czym polega sztuka formułowania sportowych prognoz i dlaczego piłka nożna jest wyjątkowo niewdzięczną dyscypliną.

Ślepa sprawiedliwość

Piłka nożna jest jednym z najbardziej nieprzewidywalnych sportów zespołowych. W futbolu faworyci wygrywają tylko około 50 proc. meczów. W piłce ręcznej czy koszykówce przedmeczowi faworyci wygrywają średnio 70 proc. spotkań. Z czego to wynika? Piłka nożna to tzw. low-scoring game. Wynik w piłce nożnej jest zdeterminowany przez rzadkie wydarzenia. Liczba goli padających w jednym meczu piłkarskim jest zdecydowanie mniejsza niż liczba zdobytych punktów w koszykówce (nawet uwzględniając rzuty za 2 i 3 punkty) czy też w hokeju. 8 procent meczów kończy się bezbramkowym remisem, w niemal 19 procentach pada tylko jeden gol. Oznacza to, że średnio w 1 na 4 mecze, kibice oglądają jeden lub zero goli. Średnia liczba zdobytych goli w jednym meczu to tylko 2,6. To wszystko sprawia, że margines błędu jest zdecydowanie mniejszy i o końcowym wyniku niejednokrotnie decyduje przypadek. Dlatego właśnie bukmacherom jest zdecydowanie trudniej wytypować zdecydowanego faworyta.