| Czytelnia VIP

Sportowe predykcje, czyli wróżenie ze szklanej kuli pełnej danych. Jak dane zmieniają świat sportu

Reprezentantki Anglii zwyciężyły w piłkarskim EURO. Dokładnie tak, jak przewidziała to firma Nielsen Gracenote. (fot. Getty)
Reprezentantki Anglii zwyciężyły w piłkarskim EURO. Dokładnie tak, jak przewidziała to firma Nielsen Gracenote. (fot. Getty)
Sebastian Muraszewski

Przewidywania, prognozy i inne symulacje są nieodłączną częścią śledzenia wydarzeń sportowych. Obecne narzędzia pozwalają na to, by przewidywać przyszłość z coraz większą dokładnością. Jak się je robi i na jaką trafność pozwalają?

DALSZĄ CZĘŚĆ PRZECZYTASZ POD REKLAMĄ

Prawo gospodyń

Kobiece mistrzostwa Europy w piłce nożnej. O tym, że impreza cieszyła się zainteresowaniem jak nigdy wcześniej, świadczy fakt, że firma Nielsen Gracenote potrafiła przewidzieć, jak potoczą się jej losy. W analizie przekazanej mediom przed rozpoczęciem fazy grupowej z ośmiu drużyn poprawnie wytypowano sześć ćwierćfinalistek – tylko dobre występy Belgijek i Austriaczek zaskoczyły badaczy. Zaktualizowana prognoza po drugiej kolejce fazy grupowej wskazała trafnie finałową parę.



Nie pomylono się w kwestii zwyciężczyń. Badacze postawili słusznie na Angielki, chociaż firma nie ukrywała, że wynikało to w dużej mierze z faktu goszczenia mistrzostw przez ten kraj. Wcześniejsze badania Nielsen Gracenote przeprowadzone na podstawie wyników pierwszych kolejek Premier League pokazały, że po powrocie kibiców na trybuny po pandemicznych restrykcjach drużyny gospodarzy znowu zaczęły wygrywać znacznie częściej mecze. Podczas gry bez publiczności było odwrotnie.

Kwestia miejsca zawodów jest ważną rzeczą braną pod uwagę przy prognozowaniu wydarzeń sportowych, jednak nie jedyną. Duża część czynników i zmiennych pozostaje tajemnicą firm analitycznych, ale przy tym ogromie danych, do których dostęp dzięki wirtualnej sieci jest niemal nieograniczony, każdy może się podjąć prognozowania samodzielnie. Niemal zawsze z gorszym skutkiem niż w przypadku wielkich korporacji, ale zdarzają się wybitne jednostki.



Pięćset trzydzieści osiem do zdobycia. I miliard do wygrania

W analityce sportowej prym wiodą Stany Zjednoczone. Nie może to dziwić, uwzględniając fakt dominacji tego państwa podczas III rewolucji przemysłowej i rozwoju informatyzacji. Ważnym czynnikiem jest też duża popularność baseballa. Pozycja tego sportu nie już tak mocna jak to bywało, co wynika z mizernego już zainteresowania młodych ludzi, którzy chętniej teraz śledzą NFL lub NBA. A po części też z niedopasowania modelu transmisji oraz spotkań per se do czasów, w których żyjemy.

W sezonie zasadniczym, trwającym od początku kwietnia do końca września, każda drużyna rozgrywa po 162 spotkania. Tylko najwierniejsi fani są w stanie obejrzeć je wszystkie na żywo. Większość ogranicza się do najważniejszych meczów, wiedzę o innych nadrabiając czytaniem artykułów w prasie bądź, co zdarza się znacznie częściej, oglądaniem na ekranach telefonów. Towarzyszą temu wciąż rozbudowane statystyki.

Specyfika baseballu sprawia, że grę można idealnie skwantyfikować. Już w latach siedemdziesiątych zauważył to Bill James, który rozwinął sabermetrykę, czyli część statystyki poświęconą tylko tej dyscyplinie sportu. Jego artykuły i dokonania wykorzystało wielu menedżerów. Największa sława przypadła Billy Beane’owi. Jego metody postępowania w zespole Oakland Athletics zostały opisane w książce "Moneyball". Ta pozycja, której autorem był Michael Lewis, zdobyła duże uznanie Amerykanów. "Moneyball" pojawiło się w wielu serialach, także w popularnych Simpsonach. W ekranizacji tej książki grali tacy aktorzy jak Brad Pitt, Robin Wright, Philip Seymour Hoffman i Jonah Hill.



Ponad dziesięć lat po premierze filmu można z czystym sumieniem powiedzieć, że analityka trafiła pod strzechy. Stosowne wyliczenia i wyciągane z nich wnioski są przedstawiane w rozmaitych mediach sportowych, niezależnie od formy przekazu. Czy to w tekście, czy na wizji lub w fonii, nie może zabraknąć tak zwanego "kącika statystycznego". Amerykańska stacja ESPN emituje nawet transmisje z oddzielnym komentarzem dla widzów, którzy lubią "dłubać w cyferkach". Nie jest ich mało, wnioskując po rosnącej liczbie meczów, które doczekały się udogodnienia zwanego Statcast.

Najbardziej znaną stroną zajmującą się przewidywaniami sportowymi i politycznymi jest FiveThirtyEight. Obie te dziedziny życia łączą się ze sobą, jeśli chodzi o kwestie analityczne. Obie budzą wiele emocji w społeczeństwie i obie, dzięki zgromadzonym danym, można próbować przedstawić w formie modeli. Nazwa wzięła się od liczby elektorów, którzy wybierają prezydenta Stanów Zjednoczonych. Kilka miesięcy po uruchomieniu serwisu przedstawione tam predykcje miały pokrycie w wynikach wyborów prezydenckich 2008, a cztery lata później udało się trafnie przewidzieć wyniki z wszystkich 50 stanów.



Zwycięstwo Donalda Trumpa okazało się jednak zaskoczeniem dla autorów modeli dla FiveThirtyEight, ale trzeba przyznać, że serwis dawał większe szanse kandydatowi Republikanów na objęcie urzędu prezydenta niż inne sondażownie. Przy okazji ostatnich wyborów także okazał się bezbłędny w prognozie preferencji większości stanów. Za tym projektem stoi Nate Silver. Absolwent ekonomii na Uniwersytecie w Chicago po kilku latach nużącej pracy w consultingu postanowił poświęcić się starej pasji: matematyce i baseballowi.

FiveThirtyEight prezentuje swe predykcje dla wielu dyscyplin sportu, w tym również piłki nożnej. Algorytm stworzony przez Silvera pozwala nawet na porównywanie klubów z różnych lig. Odpowiedni wskaźnik jest wyznaczany przed startem sezonu na podstawie wartości z poprzedniego sezonu oraz wartości składu według danych z Transfermarkt. W trakcie rozgrywek wskaźnik zmienia się na podstawie wyników z poszczególnych spotkań i na podstawie mechanizmu znanego z rankingu ELO wykorzystywanego w szachach.

Oczywiście skuteczność taka jak z FiveThirtyEight jest rzadkością. Firma Electronic Arts, wydawca słynnej futbolowej gry Madden, wykorzystuje co roku najnowszą odsłonę swej produkcji, by przewidzieć wynik Super Bowl. Od 2004 roku udało się jedenaście razy na 19. A magnat giełdowy Warren Buffett oferuje miliard dolarów temu, który poprawnie wytypuje wszystkie wyniki turnieju koszykówki akademickiej March Madness. Nie udało się to dotąd nikomu.



Gdzie najlepiej szukać odpowiednich danych? Dobrą bazę można znaleźć w serwisach prowadzonych przez Sports Reference. Strona była początkowo poświęcona statystykom baseballowym, by potem rozszerzyć działalność na inne dyscypliny. Fani piłkarscy z korzyścią skorzystają z zasobów Rec.Sport.Soccer Statistics Foundation i naszego rodzimego 90minut.pl. Wyniki wielu historycznych konkursów skoków narciarskich umieszczone są na stronach Adama Kwiecińskiego, a grono statystyk ze świata Formuły 1 to domena francuskiego serwisu StatsF1.

Przeprowadzenie podobnych badań w przypadku losowań grup lub par meczowych jest łatwiejszym zadaniem niż mogłoby się wydawać. Konieczne do tego jest napisanie odpowiedniego programu, który zrobi losowania dziesiątki tysięcy razy, uwzględniając oczywiście wszelkie zasady i przeciwwskazania, które są nieodzownym elementem takich wydarzeń. Jak widać w poniższym tweecie profesora Juliena Guyona, matematyka i statystyka mogą z dużym prawdopodobieństwem podpowiedzieć nam, z kim zmierzy się dana drużyna.

Wizja na żywo

Wyższym poziomem skomplikowania cechują się analizy wykonywane w czasie rzeczywistym. Nie dość, że potrzebują większej mocy obliczeniowej, by dać wynik jak najszybciej, jak to tylko możliwe i uwzględniają więcej zmiennych, to w przypadku pomyłki, o co nietrudno przy dynamicznym rozwoju wydarzeń na arenach sportowych, wystawiają swych autorów na krytykę. Przykład tego mieliśmy podczas finału turnieju singlistów w tegorocznym Australian Open. Firma Infosys dawała Rafaelowi Nadalowi po dwóch przegranych setach zaledwie 4% szans na zwycięstwo z Daniiłem Miedwiediewem. Grafika poszła w świat. Po tym jak Hiszpan wygrał 3:2, w mediach społecznościowych zawrzało.



Algorytm spisał się jednak dobrze. Należy pamiętać o tym, że wynik modelu zależy od tego, jakich danych mu się dostarczy. A fakty były takie: Nadal w poprzednich 19 spotkaniach przed finałem, w których przegrywał 0:2, wyszedł obronną ręką jedynie z dwóch. Mało tego, tylko sześciokrotnie tenisiści znajdujący się w takiej sytuacji w finale Wielkiego Szlema wywalczyli tytuł. Poza tym prawdopodobieństwo 4% nie oznacza, że nie ma szans na wygranie meczu. Oznacza to, że na 100 spotkań zawodnikowi uda się wygrać jedynie cztery. I to jedno z nich miało miejsce właśnie w Melbourne.

Z podobnymi kłopotami boryka się Amazon Web Services podczas przygotowywania odpowiednich analiz dla Formuły 1. Kwestia transmisji i odpowiedniego przekazu w przypadku tej serii budzi spore kontrowersje. Za obrazki, jakie widzą kibice na całym świecie, odpowiedzialne jest przedsiębiorstwo Formula One Management, które obsługuje wszystkie sesje treningowe, kwalifikacyjne oraz wyścigowe, oprócz tych w Monako, gdzie odpowiedzialność bierze rodzima TMC. Specyfika sportów motorowych sprawia, że wychwycenie wszystkich wydarzeń na kilkukilometrowej nitce toru jest bardzo trudne, więc czasami realizatorowi może umknąć ważny moment wyścigu.

W przypadku grafik z prognozami AWS widzowie również nie przyjmują ich z pełnym zaufaniem. Trzeba przyznać, że analitycy starają się przedstawić przewidywania w formie przystępnej nawet dla kogoś, kto nie jest zbyt obyty ze statystyką. Zamiast pokazania liczby okrążeń, jakie są potrzebne danemu kierowcy na wyprzedzenie rywala w formie przedziału, zdecydowano się na pokazywanie odpowiedniej wartości. Jest to bardziej ryzykowne rozwiązanie, ale czytelniejsze. Tylko że istnieją zmienne, które mogą uczynić nasz model bezużytecznym, choćby takie jak błąd kierowcy lub problemy z wydajnością samochodu.



Wspomniana czytelność jest niezmiernie ważna. W formie jednej z grafik firma pokazuje nawet ocenę poczynań kierowców i samochodów w różnych elementach. W przypadku kierowców są to wartości procentowe wykorzystania możliwości bolidu, a w przypadku aut to prędkości osiągane na prostych lub w poszczególnych rodzajach zakrętów, w skali 0-10. A do tego zebrane dane historyczne wykorzystano do wyłonienia najlepszego kierowcy w dziejach F1. Mimo podanej metodologii i kodu źródłowego w języku programowania Python w środowisku zawrzało.

Była to jednak mała burza w porównaniu do tej, jaką ujrzeliśmy po grafikach dotyczących procentowego zużycia opon. Widzowie i komentatorzy byli skonfundowani, kiedy kierowca prowadząc bolid z ogumieniem o właściwościach 10% świeżo założonej mieszanki pobijał kolejne rekordy okrążeń. Uwagi pod adresem tych analiz miała również firma dostarczająca opony, czyli Pirelli. Amazon próbował się bronić udostępniając szczegóły i tajniki swego działania, lecz wskutek powszechnego braku zaufania zdecydowano się po cichu usunąć te kontrowersyjne grafiki stanu ogumienia.



Po takich sytuacjach zawsze znajdą się puryści, którzy domagają się ograniczenia publikowania wyników prognoz, tłumacząc to nieprzewidywalnością widowiska i sportu. Ale ta dziedzina życia nie potrzebuje takowych obostrzeń - i tak nie da się przewidzieć pełnego przebiegu wydarzeń oraz wyników. Analitycy wykonują bardzo dobrą pracę, nawet jeśli ich wysiłki są krytykowane. Istnieje grupa zmiennych, których nie da się skwantyfikować i które mają duży wpływ na to, jak potoczą się losy danego meczu bądź wyścigu. Warto jednak zaglądać do danych. To one wzbogacają wiedzę na temat sportu i sprawiają, że doznania przy jego śledzeniu są znacznie lepsze.

Najnowsze
Wicemistrz świata zostaje w Wiśle!
pilne
Wicemistrz świata zostaje w Wiśle!
(fot. TVP)
Damian Pechman
| Piłka ręczna / ORLEN Superliga kobiet 
Mirko Alilović (z prawej) bramkarz Orlen Wisły Płock oraz asystent Dawid Nilsson (fot. Jerzy Stankowski / Orlen Wisła Płock)
O której dzisiaj mecz Legia – Pogoń? Relacja na żywo w TVP
Legia Warszawa – Pogoń Szczecin: relacja na żywo dzisiaj w TVP (fot. Getty Images)
O której dzisiaj mecz Legia – Pogoń? Relacja na żywo w TVP
| Piłka nożna / PKO BP Ekstraklasa 
Wszystko jasne! To on będzie nowym trenerem polskich skoczków!
Maciej Maciusiak (fot. PAP)
nowe
Wszystko jasne! To on będzie nowym trenerem polskich skoczków!
| Skoki narciarskie 
Stało się! Początek nowej ery w Widzewie! Potężna zmiana
Piłkarze Widzewa Łódź (fot. Getty)
pilne
Stało się! Początek nowej ery w Widzewie! Potężna zmiana
| Piłka nożna / PKO BP Ekstraklasa 
UEFA przyznała rację Marciniakowi. A to cios w... PZPN
Szymon Marciniak mógł być zaskoczony, gdy PZPN zasugerował, że "fakt iż sędzia w opisywanych sytuacjach podjął taką a nie inną decyzję nie oznacza, że automatycznie została uznana przez UEFA za referencyjną/wzorcową a nie za np. akceptowalną lub błędną". (fot. Getty Images)
UEFA przyznała rację Marciniakowi. A to cios w... PZPN
Fot. TVP
Rafał Rostkowski
Małysz tłumaczy powody rezygnacji z Thurnbichlera. Mówi o zawodnikach
Adam Małysz (fot. Getty)
Małysz tłumaczy powody rezygnacji z Thurnbichlera. Mówi o zawodnikach
| Skoki narciarskie 
Thurnbichler skomentował zwolnienie. Mocne słowa!
Thomas Thurnbichler (fot. Getty Images)
Thurnbichler skomentował zwolnienie. Mocne słowa!
| Skoki narciarskie 
Do góry