Funzioni di scoring e ranking

Funzioni di scoring: misure che riducono record multidimensionali in un singolo valore per evidenziare alcune peculiarità importanti del dato

Funzioni di ranking: ordinano elementi solitamente in base agli score

Sono tecniche utili ed euristiche per iniziare a stuzzicare la comprensione di grandi dataset (pur essendo tecniche difficilmente convalidabili scientificamente contrariamente ai metodi statistici)

Esempio: University Rankings

Esempio: IronMan

Esempio: Voti universitari

Problema critico

Il problema critico nella progettazione di funzioni di scoring è che non esiste un gold standard / risposta giusta.

le tecniche di machine learning come la regressione lineare possono apprendere una funzione di scoring dalle funionalità se si dispone di dati di training, cosa che in genere non è possibile.

Gli algoritmi di ranking di Google, ad esempio, si addestrano sui dati dei clic.

Il BMI (Body Mass Index)

Un esempio convincente di quanto detto è quello del BMI (indice definito per verificare se il ns peso è sotto contorllo)

$$ BMI = peso / altezza^2 $$

Peso è in Kg e altezza in m:

$$ Tosi = \frac{67.0}{1.75^2} = 21.8 $$