Analiza kontuzji graczy NFL – zrozumienie i wizualizacja danych

INTRO

Od jakiegoś czasu hobbystycznie (po godzinach) interesuję się analizą danych i szeroko pojętym uczeniem maszynowym (z ang. Machine Learning lub ML). Tu i tam często słyszymy o rozwoju nowych technologii i o tym w jak wielu dziedzinach algorytmy sztucznej inteligencji (AI) i uczenia maszynowego wpływają na nasze życie. Z wielu zastosowań AI/ML ogromna ilość ludzi nawet nie zdaje sobie sprawy. Mnie interesuje zastosowanie AI/ML w sporcie, czyli Computer Science in Sport albo krócej Sport Science. Poniżej pierwszy wpis pokazujący moją skromną analizę danych udostępnionych przez amerykańską ligę futbolu NFL na platformie Kaggle.

Szczegóły wyzwania i udostępnionych danych podane są tutaj.

SKRÓTOWY OPIS ZAGADNIENIA

NFL chce zbadać wpływ rodzaju nawierzchni, na której rozgrywane są mecze (naturalna lub syntetyczna) na ilość kontuzji kończyn dolnych (aby docelowo chronić zdrowie zawodników) – chodzi tutaj tylko o kontuzje wynikające z poruszania się zawodników na danym podłożu, a nie powstające wskutek zderzenia/faulów od innych zawodników.

NFL udostępnia 3 zbiory danych w postaci plików CSV (link do danych): zbiór opisujący kontuzje odniesione przez 100 graczy w ciągu dwóch regularnych sezonów, zbiór opisujący dokładną lokalizację, prędkość i kierunek ruchu 250 graczy (dane zbierane dzięki kamerom nagrywającym każdy mecz) oraz zbiór z Więcej…

Oryginalny wpis: Analiza kontuzji graczy NFL – zrozumienie i wizualizacja danych