Classification models with keras


Comprensione dei Dati
Un dataset può essere suddiviso in categorie, con colonne di predittori e una colonna target.
È necessario trasformare la colonna target in un array di valori binari per i problemi di classificazione.
Costruzione del Modello
Si utilizza la funzione
to_categorical
del pacchetto Keras Utilities per la trasformazione.Il modello di classificazione è simile a quello di regressione, ma con un output layer che ha più neuroni, corrispondenti alle categorie della variabile target.
Addestramento e Previsione
Si specificano funzioni di attivazione come softmax per l'output e si utilizza la cross-entropy come misura di perdita.
Il metodo
predict
fornisce probabilità per ciascuna classe, aiutando a determinare la decisione migliore per l'acquisto di un'auto basata sui dati forniti.







Il risultato finale di un modello di classificazione costruito con Keras è un vettore di probabilità che rappresenta la confidenza del modello riguardo a ciascuna delle classi possibili. Immagina di avere un gruppo di amici e di dover decidere dove andare a cena. Ogni amico esprime la propria preferenza, e alla fine, tu vuoi sapere quale ristorante ha ricevuto il maggior numero di voti. Allo stesso modo, il modello di classificazione fornisce un vettore che indica quanto è probabile che un dato punto appartenga a ciascuna delle classi.
Ad esempio, se il tuo modello ha quattro classi (0, 1, 2, 3), il risultato finale potrebbe apparire così:
[0.99, 0.01, 0.00, 0.00]
In questo caso, il vettore indica che il modello è molto sicuro (99%) che il dato appartenga alla classe 0 (non accettabile), mentre è quasi certo che non appartenga alle altre classi. La somma di tutte le probabilità nel vettore sarà sempre 1, il che significa che il modello ha distribuito la sua "fiducia" tra le diverse classi.
Ogni valore nel vettore rappresenta la probabilità che il dato appartenga a quella specifica classe.
La classe con la probabilità più alta è quella che il modello suggerisce come la migliore decisione.
In questo laboratorio impareremo a usare la libreria Keras per costruire model per problemi di Classification. Per cambiare, utilizzeremo il popolare dataset MNIST, un insieme di immagini.
Il database MNIST, acronimo di Modified National Institute of Standards and Technology, è un grande database di cifre scritte a mano che viene comunemente utilizzato per l'addestramento di vari sistemi di elaborazione delle immagini. Il database è anche ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico.
Il database MNIST contiene 60.000 immagini di addestramento e 10.000 immagini di test di cifre scritte da studenti delle scuole superiori e da dipendenti del Census Bureau degli Stati Uniti.
Last updated