Il Machine Learning è sempre più diffuso nonostante sia nato diversi anni fa.
Un sistema di apprendimento automatico ricava da un dataset una conoscenza non fornita a priori, descrivendo dati non forniti in precedenza. Si estrapolano informazioni facendo assunzioni sulle informazioni già conosciute, creando una classe delle ipotesi H.
Bisogna però mettere in conto anche eventuali errori, cercando di capire se esiste davvero un’ipotesi coerente e, in caso di assenza, si cerca di approssimare. In quest’ottica bisogna mediare tra fit e complessità. Si ha sempre il rischio di overfitting, cercando una precisione dei dati che magari non esiste.
Definiamo alcuni concetti base:
In merito alle parti “software” distinguiamo:
Durante l’apprendimento si estrapolano dati da istanze di addestramento o test, quindi:
L’ipotesi da apprendere viene chiamata concetto target.
Si ha inoltre un controllo dell’esperienza da parte del learner:
L’esperienza deve essere presentata in modo casuale.