Esistono molti algoritmi di Machine Learning più o meno complessi, più o meno performanti.
Quali dimensioni di valutazione ci interessano?
Cosa ci dice questa Survey?
Non esiste l’algoritmo di ML perfetto!
Quindi seleziona i metodi che meglio si adattano alle esigenze del problema e acquisisci sufficiente esperienza con i vari algoritmi per imparare ad ottimizzare le loro prestazioni.
Ricordati che la qualità del dato in ingresso è fondamentale, a prescindere dall’algoritmo.
Algoritmo di machine learning di classificazione supervisionata basato sul teorema di Bayes.
Si usa il termine “naive” (ingenuo) perchè usa l’assunto che le variabili di input siano tra loro indipendenti, cioè $p(A \ \&\& B)=p(A)*p(B)$.
In generale $p(A \text{ and } B)=p(A)*p(B|A)=p(A)+p(B)-p(A \text{ or } B)$.
PRO: Algoritmo particolarmente utile in caso di grandi quantità di dati di addestramento e di feature (il calcolo delle probabilità è veloce)
CONTRO: l’assunzione di indipendenza tra le variabili può essere limitante
Funzionamento: