Ricerca economica
Le politiche sulla sostenibilità e la crescente consapevolezza sui problemi ambientali influenzano il consumatore nelle sue scelte di acquisto?
Nell’ultimo ventennio l’attenzione al tema dell’ecosostenibilità ambientale è cresciuta esponenzialmente a causa delle problematiche ambientali note a tutti. Abbiamo studiato la corrispondenza di questa problematica all’interno delle recensioni della piattaforma di e-commerce più diffusa al mondo: Amazon.
Approcciandoci alla piattaforma abbiamo da subito identificato come i prodotti più venduti si dividano in 3 categorie principali:
- Alimentari
- Articoli per la casa
- Elettrodomestici
Per ogni categoria il termine ecosostenibilità assume diverse accezioni: ad esempio per la categoria alimentari si fa spesso riferimento al “biologico”, per gli elettrodomestici ha molta rilevanza il “risparmio energetico” ed infine negli articoli per la casa ci si sofferma maggiormente sull’aspetto della “riciclabilità”.
Dopo un’attenta fase di campionamento dei prodotti ecosostenibili e non (campione di controllo) da confrontare, abbiamo scaricato le informazioni, recensioni comprese, relative hai prodotti selezionati. Da tali informazioni ci sono sorti i seguenti quesiti:
- Quanto si parla nelle recensioni di ecosostenibilità?
- Quali sono gli argomenti più trattati nelle recensioni? Dove si posiziona l’ecosostenibilità?
- Da quando e quanto si parla di ecosostenibilità nelle recensioni Amazon?
- Che voti sono stati attribuiti ai prodotti ecosostenibili?
Campione di prodotti analizzati per categorie:
Una volta individuate le categorie di interesse, una prima analisi sull’ecosostenibilità è stata fatta valutando i prodotti “Più venduti” presenti nella sezione apposita di Amazon. Non avendo riscontrato aspetti relativi all’ecosostenibilità né nei titoli né nella descrizione dei prodotti, si è deciso di estrarre i prodotti tenendo conto del numero delle recensioni associate, in modo tale da avere più testo a disposizione per un’analisi linguistica accurata. Per identificare le parole inerenti al mondo dell’ecosostenibilità si è utilizzato il dizionario di Wikipedia, mappando i termini a seconda della categoria di prodotto. Per ogni categoria infatti il termine ecosostenibilità assume diverse accezioni: ad esempio per la categoria alimentari si fa spesso riferimento al “biologico”, per gli elettrodomestici ha molta rilevanza il “risparmio energetico” ed infine negli articoli per la casa ci si sofferma maggiormente sull’aspetto della “riciclabilità”. Per identificare le parole inerenti all’ecosostenibilità all’interno delle descrizioni, al fine di classificare i prodotti in “eco/non ecosostenibile”, sono stati utilizzati gli ExtremeTrees, una variante dei RandomForest. I modelli basati su alberi decisionali, infatti, si sono dimostrati i più adatti a questo tipo di classificazione.
Il campione finale di prodotti scelto per l’analisi è composto da 58 elementi e 10.292 recensioni. Come esplicato nel grafico troviamo 29 prodotti classificati come “ecosostenibili” (in base al nome o alle caratteristiche nella descrizione) e altrettanti 29 prodotti perfettamente confrontabili in termini di prezzo e tipologia di prodotto (senza alcun riferimento al tema della “ecosostenibilità” nel nome o nella descrizione) che vengono utilizzati come campione di controllo. In particolare il grafico mostra la numerosità dei prodotti presi in esame suddivisi nelle 3 macrocategorie: la categoria alimentare che conta 28 elementi, la categoria articoli per la casa composta da 14 prodotti ed i rimanenti 16 per la macroarea degli elettrodomestici.
Percentuale di recensioni ecosostenibili per categorie di prodotto:
Ai 58 prodotti del campione finale sono associate 10.292 recensioni. Dati i buoni risultati ottenuti dagli algoritmi utilizzati per classificare i prodotti in “eco/non ecosostenibile” si è deciso di riutilizzare tali algoritmi, gli ExtremeTrees, una variante dei RandomForest, addestrandoli questa volta non sulle descrizioni ma bensì sulle recensioni dei prodotti scritte dagli utenti.
Nella fase di training i testi delle recensioni sono stati preprocessati nel seguente modo:
- trasformazione in minuscolo,
- lemmatizzazione (le parole sono state riportate alla loro forma canonica come si troverebbero in un dizionario),
- rimozione delle stopwords (parole senza valore semantico), della punteggiatura, e dei numeri.
Dopo una fase di test, gli algoritmi sono riusciti ad ottenere buoni risultati nel suddividere le recensioni in “eco/non ecosostenibile”. Le keywords utilizzate in fase di test degli algoritmi sono state:
- energetico
- a+, a++, a+++
- consumo
- ambient
- eco
- compost
- riciclabile
- smaltimento
- bio
- sostenibile
- biodegradabile
- ecologico
Il grafico riporta la percentuale di recensioni rispetto al totale, suddiviso per le tre macrocategorie, nelle quali viene citato il tema oggetto d’analisi. La categoria degli elettrodomestici è quella in cui gli utenti che hanno rilasciato una recensione si sono soffermati maggiormente sull’aspetto dell’ecosostenibilità, seguita da gli articoli per la casa ed infine dai prodotti alimentari. Dunque le 10.292 recensioni sono così distribuite: 7.649 recensioni per la categoria dei prodotti alimentare di cui 301 classificate dall’algoritmo come ecosostenibili, 976 recensioni sui prodotti per la casa di cui 114 ecosostenibili ed infine 1.667 recensioni totali per la categoria degli elettrodomestici di cui 230 ecosostenibili.
L’argomento “sostenibilità” nelle recensioni nel tempo per categoria
Proseguendo con l’analisi effettuata nello step precedente si è allargato l’utilizzo dell’algoritmo di analisi testuale per identificare quali altri argomenti sono maggiormente trattati all’interno delle 10.292 recensioni prese in esame. Gli stessi algoritmi sono stati dunque addestrati su quell’insieme di parole riguardanti, come ben noto in letteratura, le due aree tematiche principali: prezzo e qualità utilizzando inoltre soglie di tolleranza maggiori rispetto a quelle usate nel caso dell’ecosostenibilità.
Dall’analisi è emerso, come da aspettative, che le tematiche più affrontate nelle recensioni dagli utenti riguardano il “prezzo” e la “qualità” dei prodotti. Queste analisi vengono riportate nel grafico, mantenendo la divisione per le 3 macrocategorie. Tutto quello che non riguarda ecosostenibilità, prezzo o qualità è stato classificato come “altro”. Esclusa la categoria “altro” il ranking degli argomenti trattati nelle recensioni vede, per tutte e 3 le categorie, al primo posto la qualità, seguita dal prezzo ed infine l’ecosostenibilità.
Continuando con l’analisi il grafico mostra le tematiche affrontate all’interno delle recensioni suddivise questa volta per macrocategorie di prodotto e per tipologia (eco/non ecosostenibile). Come ipotizzabile a priori, l’argomento ecosostenibilità appare principalmente per i prodotti classificati come ecosostenibili, eccezion fatta per la categoria elettrodomestici nella quale troviamo un 1% di recensioni che vergono sull’ecosostenibilità all’interno di quei prodotti non classificati come tali. Nella categoria degli elettrodomestici inoltre, nei prodotti classificati come “eco” troviamo nelle recensioni che l’argomento ecosostenibilità viene trattato tanto quanto il prezzo (17%). Tale simmetria è probabilmente dovuta alla forte correlazione che c’è tra i due argomenti in quanto, come da considerazioni iniziali, si è classificato come ecosostenibile la classe energetica del prodotto, la quale incide molto sul consumo e quindi sulla “convenienza” economica dello stesso.
Argomenti trattati all’interno delle recensioni divisi per categorie di prodotto:
Lo scraping dei dati dal sito Amazon ci ha permesso di ottenere l’informazione aggiuntiva relativa alla data di pubblicazione di tutte le recensioni. Tale informazione comprende un arco temporale che va dal 1°trimestre 2012 al 2° trimestre 2020, mostrato sull’asse dell’ascisse del grafico. Da questa analisi è stato possibile dunque valutare quanto la sensibilità dei consumatori sull’argomento ecosostenibilità sia variata nel tempo.
Dalla serie storica ottenuta con le numerosità cumulate delle recensioni in cui si parla di ecosostenibilità appare evidente come tale tematica abbia preso maggior piede negli ultimi 5 anni come evidenziato dal trend sempre crescente dal 3° trimestre 2014 in poi. È altresì interessante lo studio degli andamenti suddivisi per macrocategorie tramite il quale si nota come per gli elettrodomestici, forse per un discorso legato ai consumi e dunque al risparmio economico, l’attenzione all’ecosostenibilità si sia manifestata prima rispetto alle altre macrocategorie prese in esame e come l’andamento della stessa sia più stabile nel tempo. Contrariamente per la categoria dei prodotti alimentari l’attenzione all’ecosostenibilità si è manifestata successivamente rispetto agli elettrodomestici, ma mostra un trend di crescita più sostenuto superando a fine 2019 le altre categorie.
Un focus sulla curva che rappresenta il totale delle recensioni mostra come fino al 2° trimestre 2016 essa coincida con quella degli elettrodomestici; in seguito si nota una crescita esponenziale della curva totale che però sembrerebbe avere un’inversione di tendenza, mostrando un punto di flesso, nei trimestri finali del 2019. La derivata seconda di tale curva cambia infatti di segno a ridosso dell’ultimo trimestre 2019.
Distribuzione delle “star” attribuite ai prodotti divisi per categoria:
L’ultimo aspetto preso in considerazione nell’analisi concerne lo studio del gradimento del prodotto tramite le “stelle” che gli utenti hanno attribuito ad ogni prodotto nel momento in cui hanno rilasciato la recensione. Tale studio è stato, anche in questo caso, suddiviso per macrocategorie e per tipologia di prodotto (eco/ non ecosostenibile). L’aspetto interessante che è emerso è, come evidenziato nei grafici, la tendenza degli utenti che prestano attenzione al tema dell’ecosostenibilità a rilasciare valutazioni positive ma non eccelse (3/4 stelle piuttosto che 5). Si può ipotizzare che questa tendenza sia dovuta ad un atteggiamento più critico degli utenti attenti alla tematica analizzata rispetto all’utente “comune”.