Apprendimento supervisionato vs. non supervisionato: qual è il modello di machine learning più adatto a te?

Pubblicato il giorno 31/1/2022 da Chiara Casse e Sierra Rogers

Se il machine learning è ancora un concetto nuovo per te, in questo articolo ti presentiamo i due tipi più comuni e i relativi casi d’uso.

I diversi modelli di Machine Learning

In qualità di leader aziendale, sai bene che le nuove tecnologie possono aiutarti a superare determinati punti critici e a rendere il tuo business più competitivo. L’esempio più chiaro l’abbiamo avuto nell’ultimo anno, quando a causa della pandemia molte aziende si sono affidate alla trasformazione digitale  per mantenersi in vita.

Probabilmente sei anche già a conoscenza del potenziale per il futuro della tua azienda che hanno tecnologie emergenti come il machine learning. Ma se non sai quali sono le applicazioni di quest’ultimo, corri il rischio di sprecare denaro in risultati inutilizzabili. Nell’esempio qui sotto ti spieghiamo cosa intendiamo.

In preparazione alla stesura di questo articolo, abbiamo utilizzato uno strumento di generazione del linguaggio naturale (NLG) per cercare di capire come analizzare al meglio le differenze tra apprendimento supervisionato e non supervisionato. Ecco un estratto del risultato ottenuto dal nostro strumento NLG:

“Ogni modello di apprendimento non supervisionato fornisce matrici tensoriali anticipate basate sul coefficiente di correlazione, risposta falsa positiva, dati statisticamente utili piuttosto minimi (o fortemente dipendenti da esso), viene utilizzato per la riduzione della dimensionalità utilizzando grafici e alberi per generare i propri punti di dati limite.”

 

Un po’ confuso? Anche noi. Ma nonostante la sintassi ottenuta dallo strumento NLG sia piuttosto sconcertante, questo esperimento con l’intelligenza artificiale (AI) non si è rivelato del tutto inutile. Ci ha fatto capire che per ottenere i migliori risultati dall’intelligenza artificiale, è necessario affidarsi all’applicazione giusta. Ed è proprio per questo che abbiamo scritto questa guida.

Abbiamo parlato con Thomas Wood, consulente di data science per Fast Data Science, che ci ha aiutato a rendere l’argomento facilmente comprensibile. Spiegheremo quindi la differenza tra due comuni metodi di machine learning, l’apprendimento supervisionato e l’apprendimento non supervisionato, e quali casi d’uso sono più adatti a ciascun metodo.

Prima di iniziare, ecco alcune nozioni chiave sul machine learning:

  • Il machine learning (ML) è una sottocategoria dell’intelligenza artificiale (IA) che risolve problemi mediante l’uso di algoritmi e modelli statistici per estrarre conoscenza dai dati. In generale, tutti i modelli di machine learning possono essere classificati in apprendimento supervisionato o non supervisionato.
  • Un algoritmo di machine learning è una procedura eseguita sui dati per creare un modello di machine learning.
  • Un modello di machine learning è il risultato ottenuto dall’esecuzione di un algoritmo di ML sui dati. In altre parole, un modello rappresenta ciò che è stato appreso da un algoritmo di machine learning.

Quali sono le principali differenze tra apprendimento supervisionato e non supervisionato?

Se dovessimo riassumerlo in una frase, la principale differenza tra l’apprendimento supervisionato e l’apprendimento non supervisionato è che il primo, a differenza di quello non supervisionato, utilizza dati etichettati per aiutare a prevedere i risultati.

Tuttavia, tra i due approcci ci sono anche altre sfumature, che analizzeremo nei prossimi paragrafi affinché tu possa scegliere quello più adatto alle tue esigenze.

Come funziona il machine learning supervisionato

Come abbiamo accennato poco fa, l’apprendimento supervisionato utilizza dati etichettati per addestrare il modello. Ma cosa significa esattamente? Vediamo alcuni esempi.

Con l’apprendimento supervisionato, il modello riceve sia input che output corrispondenti. Supponiamo che stiamo addestrando il modello a identificare e classificare diversi tipi di frutta. Forniremo come input diverse immagini di frutta, insieme a informazioni quali forma, dimensione, colore e profilo aromatico. Successivamente, forniremo al modello i nomi di ciascun frutto come output.

Infine, l’algoritmo riconoscerà uno schema che unisce le caratteristiche dei frutti (gli input) ai loro nomi (gli output). A questo punto, possiamo fornire al modello un nuovo input per fargli prevedere l’output da solo. Questo è il tipo di apprendimento supervisionato più comune, ed è chiamato anche classificazione.

Apprendimento supervisionato vs. non supervisionato

Come funziona il machine learning non supervisionato

Viceversa, l’apprendimento non supervisionato funziona insegnando al modello a identificare gli schemi da solo (quindi senza supervisione) da dati non etichettati. Ciò significa che viene fornito un input, ma non un output.

Per capirne il funzionamento, riprendiamo l’esempio della frutta. Con l’apprendimento non supervisionato, forniremo al modello l’insieme dei dati di input (le immagini dei frutti e le loro caratteristiche), ma non l’output (i nomi dei frutti).

Il modello utilizzerà un algoritmo idoneo per allenarsi autonomamente a dividere i frutti in diversi gruppi in base alle caratteristiche che li accomunano maggiormente. Questo è il tipo di apprendimento non supervisionato più comune, chiamato anche clustering.

Se hai ancora qualche dubbio, guarda questo breve video per una spiegazione esemplare dei due modelli di machine learning:

Quando dovrei usare l’apprendimento supervisionato piuttosto che l’apprendimento non supervisionato?

La scelta di usare l’apprendimento supervisionato piuttosto che quello non supervisionato dipende dai tuoi obiettivi e dalla struttura e dal volume dei dati che hai a disposizione. Prima di prendere una decisione, chiedi al tuo data scientist di valutare i seguenti aspetti:

  • I dati di input sono un set di dati etichettati o non etichettati? Se non sono etichettati, il tuo team sarebbe in grado di fornire l’etichettatura aggiuntiva?
  • Qual è l’obiettivo che desideri raggiungere? Stai lavorando con un problema ricorrente e ben definito, o l’algoritmo dovrà prevederne di nuovi?
  • Esistono algoritmi che supportano il volume e la struttura dei dati in questione? Hanno la stessa dimensionalità di cui hai bisogno (numero di caratteristiche o attributi)?

Quando usare il machine learning supervisionato

Secondo Gartner, l’apprendimento supervisionato è il tipo di machine learning più popolare e utilizzato negli scenari aziendali. Ciò è probabilmente dovuto al fatto che, sebbene la classificazione di big data possa essere particolarmente difficile per questo metodo, i risultati ottenuti sono altamente accurati e affidabili (fonte completa disponibile per i clienti).

Di seguito ti proponiamo qualche esempio di casi d’uso per l’apprendimento supervisionato. Alcuni sono specifici del settore, mentre altri possono essere applicati a qualsiasi organizzazione:

  •     Identificare i fattori di rischio per le malattie e pianificare misure preventive
  •     Classificare un’e-mail come spam o non spam
  •     Prevedere i prezzi degli immobili
  •     Prevedere l’abbandono dei clienti
  •     Prevedere precipitazioni e condizioni meteorologiche
  •     Scoprire se il richiedente di un prestito è a basso o ad alto rischio
  •     Prevedere il guasto di componenti meccanici nei motori delle automobili
  •     Prevedere il tasso di condivisione e le prestazioni sui social media

Wood ha condiviso con noi un modo in cui ha usato l’apprendimento supervisionato per creare un sistema di smistamento per le e-mail in arrivo di un cliente. Con l’aiuto di un sistema CRM, le e-mail sono state classificate in gruppi che rappresentavano argomenti comuni (ad es. cambio di indirizzo del cliente, reclami). Wood ha quindi utilizzato queste categorie per addestrare un modello in modo che quando riceve una nuova e-mail, sappia a quale categoria assegnarla. Lo spiega così:

Stai pensando di pulire la tua casella di posta? Inizia subito con un software CRM.

Quando usare il machine learning non supervisionato

A differenza dell’apprendimento supervisionato, l’apprendimento non supervisionato può gestire grandi volumi di dati in tempo reale. Dal momento che il modello identifica automaticamente la struttura nei dati (classificazione), è utile nei casi in cui un essere umano farebbe fatica a trovare da solo le tendenze all’interno dei dati.

Ad esempio, se stai cercando di segmentare i potenziali consumatori in gruppi ai fini di marketing, un metodo di clustering senza supervisione sarebbe un ottimo punto di partenza.

Di seguito ti proponiamo qualche esempio di casi d’uso per l’apprendimento non supervisionato.

  • Raggruppare i clienti in base al loro comportamento di acquisto
  • Trovare correlazioni nei dati dei clienti (ad esempio, chi acquista un certo tipo di borsa potrebbe essere interessato anche a un certo tipo di scarpe)
  • Segmentare i dati in base alla cronologia degli acquisti
  • Classificare le persone in base a interessi diversi
  • Raggruppare le scorte in base a metriche di produzione e di vendita

Wood ci ha raccontato di aver lavorato per un’azienda farmaceutica con stabilimenti di produzione in tutto il mondo. Il software utilizzato dall’azienda per registrare gli errori rilevati nei propri stabilimenti non disponeva di un menu a discesa con gli errori più comuni.

Per questo motivo, i dipendenti documentavano gli errori in file di testo semplici (in inglese o nella lingua locale). L’azienda desiderava conoscere le cause dei problemi di produzione più frequenti, ma senza una categorizzazione degli errori era impossibile eseguire analisi statistiche sui dati.

Wood ha utilizzato un algoritmo di apprendimento non supervisionato per scoprire le caratteristiche comuni dei vari errori. Ciò ha permesso di identificare le aree più rilevanti e di produrre statistiche sotto forma di grafici dei problemi di produzione più comuni dell’azienda. Come afferma Wood:

“Questo ha dato all’azienda una panoramica immediata dei problemi, che altrimenti avrebbe richiesto un notevole lavoro manuale.”

Preparati per un futuro intelligente con il machine learning

Il machine learning è uno strumento potente che può aiutarti a risolvere i problemi aziendali e a prendere decisioni basate sui dati. Con questo articolo speriamo di averti dato un’idea di come potresti implementare l’apprendimento supervisionato o non supervisionato nella tua organizzazione.

Se sei pronto ad accogliere la tecnologia del machine learning, il tuo prossimo passo dovrebbe essere quello di valutare le capacità del tuo attuale stack software. Dopodiché, chiedi ai tuoi fornitori i casi d’uso di altri clienti nel tuo settore che coincidano con le applicazioni per le quali desideri utilizzare il machine learning.

Cerchi un software di business intelligence? Consulta l’elenco messo a punto da Capterra con i migliori software di business intelligence.

 

Questo articolo potrebbe far riferimento a prodotti, programmi o servizi che potrebbero non essere disponibili nel tuo paese o potrebbero essere soggetti a restrizioni nel rispetto delle disposizioni legislative vigenti. Ti suggeriamo di contattare direttamente il provider per richiedere maggiori informazioni sulla disponibilità del prodotto e sulla sua compliance con le leggi locali.

Conosci l'autore

Content Analyst per Capterra. Esperta di tecnologia e responsabile degli studi su hi-tech e digitalizzazione rivolti alle PMI. Amante della natura e delle spiagge di Barcellona.

Content Analyst per Capterra. Esperta di tecnologia e responsabile degli studi su hi-tech e digitalizzazione rivolti alle PMI. Amante della natura e delle spiagge di Barcellona.