La teoria della probabilità fornisce un quadro formale per ragionare sulla probabilità degli eventi.
La probabilità $p(s)$ di un evento $s$ soddisfa:
Queste proprietà di base sono spesso violate nell’uso casuale della “probabilità” nella scienza dei dati.
La probabilià si occupa di prevedere la probabilità di eventi futuri, mentre la statistica analizza la frequenza degli eventi passati.
La probabilità è una branca teorica della matematica sulle conseguenze delle definizioni, mentre la statistica è la matematica applicata che cerca di dare un senso alle osservazioni del mondo reale.
Supponiamo che:
qual è la probabilità che uno studente sia sia A che B?
Gli eventi A e B sono indipendenti se e solo se:
$$ P(A\cap B) = P(A)\times P(B) $$
L’indipendenza (correlazione zero) è buona per semplificare i calcoli ma cattiva per la previsione
Supponiamo di avere una moneta equilibrata e un dado a sei facce equilibrato. Vogliamo calcolare la probabilità di ottenere testa lanciando la moneta e un numero pari lanciando il dado.
$$ P(testa, \ numPari) = \frac 12 * \frac 36 =0,25 $$
La probabilità condizionata $P(A|B)$ è definita come: