Funzioni di scoring: misure che riducono record multidimensionali in un singolo valore per evidenziare alcune peculiarità importanti del dato
Funzioni di ranking: ordinano elementi solitamente in base agli score
Sono tecniche utili ed euristiche per iniziare a stuzzicare la comprensione di grandi dataset (pur essendo tecniche difficilmente convalidabili scientificamente contrariamente ai metodi statistici)
Il problema critico nella progettazione di funzioni di scoring è che non esiste un gold standard / risposta giusta.
le tecniche di machine learning come la regressione lineare possono apprendere una funzione di scoring dalle funionalità se si dispone di dati di training, cosa che in genere non è possibile.
Gli algoritmi di ranking di Google, ad esempio, si addestrano sui dati dei clic.
Un esempio convincente di quanto detto è quello del BMI (indice definito per verificare se il ns peso è sotto contorllo)
$$ BMI = peso / altezza^2 $$
Peso è in Kg e altezza in m:
$$ Tosi = \frac{67.0}{1.75^2} = 21.8 $$