Società
La Sedentarietà nelle Regioni Italiane
Un’ analisi della sedentarietà nelle regioni italiane tra il 2005 ed il 2020 attraverso l’utilizzo della clusterizzazione, della network analysis e degli algoritmi di machine learning per la predizione.
DI ANGELO LEOGRANDE
E’ diminuita in media del 19,33%
*immagini elaborate dall’autore Angelo Leogrande.
L’Istat-BES calcola il valore della sedentarietà nelle regioni italiane. La sedentarietà è definita come la proporzione standardizzata delle persone di 14 anni che non praticano alcuna attività fisica sul totale delle persone di 14 anni e più. I dati disponibili fanno riferimento al periodo tra il 2005 ed il 2020.
Ranking delle regioni italiane per valore della sedentarietà nel 2020. La Sicilia è al primo posto per valore della sedentarietà con un valore pari a 56,6, seguita dalla Campania con un valore pari a 56,2 e dalla Calabria con un valore pari a 49,6. A metà classifica vi sono il Lazio con un valore pari a 32,7, seguita dalla Sardegna con un valore pari a 31 e dalle Marche e Piemonte a parimerito con un valore pari a 28,9. Chiudono la classifica la Liguria con un valore pari a 22,2 unità, seguita dal Veneto con un valore pari a 19,8 e dal Trentino-Alto Adige con un valore pari a 15.
Ranking delle regioni per variazione percentuale della sedentarietà nel periodo tra il 2005 ed il 2020. La Campania è al primo posto per valore della variazione percentuale della sedentarietà tra il 2005 ed il 2020 con un valore pari a -1,58% pari a -0,90 unità, seguita dalla Sicilia con un valore pari a -9,58% pari a -6,00 unità, Calabria con una variazione percentuale pari a -12,52% equivalente ad un ammontare di 7,10 unità. A metà classifica vi sono il Molise con una variazione pari ad un ammontare di -20,39% equivalente ad un ammontare di -10,50 unità, seguito dall’Emilia Romagna con un valore pari a -21,00% pari ad un ammontare di -6,70 unità, seguita dalla Lombardia con una variazione pari ad un ammontare di -21,14% pari ad un valore di -6,70 unità. Chiudono la classifica la Valle d’Aosta con una variazione pari a -34,18% pari ad una variazione di -13,40 unità, seguita dalla Sardegna con una variazione di -35,55% pari ad un ammontare di -17,10 unità, e dalla Liguria con una variazione di -46,38% pari ad un ammontare di -19,20 unità.
Macro-regioni italiane. La sedentarietà è diminuita in tutte le macro-regioni italiane. Nel Nord Italia la sedentarietà è diminuita da un ammontare di 31,20 nel 2005 fino ad un valore di 24,10 unità nel 2020 ovvero una riduzione pari ad un ammontare di -7,10 unità pari ad un valore di -22,76%. Nel Centro Italia la sedentarietà è diminuita da un ammontare di 40,20 unità fino ad un valore di 30,20 unità ovvero pari ad una variazione di -10,00 unità pari ad una variazione del -24,88%. La sedentarietà è diminuita nel Mezzogiorno da un ammontare di 56,40 fino ad un valore di 49,10 unità ovvero apri ad una variazione di -7,30 unità pari ad una variazione di -12,94%. Complessivamente in Italia la sedentarietà è diminuita da un ammontare di 41,90 unità fino ad un valore di 33,80 unità ovvero pari ad un valore di -8,10 unità pari ad una variazione di -19,33%.
Clusterizzazione con algoritmo k-Means ottimizzato attraverso il coefficiente di Silhouette. Di seguito viene presentata una clusterizzazione con algoritmo k-Means. L’applicazione del coefficiente di Silhouette è possibile individuare l’esistenza di due diversi clusters ovvero:
- Cluster 1: Calabria, Puglia, Campania, Basilicata, Sicilia, Molise, Lazio, Abruzzo;
- Cluster 2: Emilia-Romagna, Lombardia, Piemonte, Friuli-Venezia Giulia, Valle d’Aosta, Veneto, Toscana, Marche, Trentino-Alto Adige, Liguria, Umbria, Sardegna.
Ne deriva pertanto un valore mediano della sedentarietà che nel cluster 1 è pari a 44,3 e invece nel cluster 2 pari a 25,5 unità. Ne deriva pertanto il seguente ordinamento dei cluster ovvero: C1=44,3>C2=25,5 unità. Nella contrapposizione tra i due clusters appare evidente la distinzione tra un Sud Italia caratterizzato da un elevato livello di sedentarietà ed un Centro-Nord Italia con un valore della sedentarietà pari a circa il 73% in più rispetto al valore del cluster 2. Tale distinzione mette in evidenza una contrapposizione tra comportamenti individuali che possono essere anche in un qualche modo connessi alla redditività ed alle possibilità di vita.
Network Analysis con il metodo della distanza di Manhattan. Di seguito viene realizzata una network analysis attraverso l’applicazione del metodo della distanza di Manhattan. Attraverso tale analisi vengono individuate due strutture a network delle quali una è complessa e l’altra è semplificata. La struttura a network complessa è costituita da Toscana, Lombardia, Piemonte, Emilia-Romagna, e Friuli-Venezia Giulia. Tale struttura è indicata di seguito ovvero:
- La Toscana ha un link con la Lombardia per un valore pari a 0,76 unità;
- La Lombardia ha un link con il Piemonte avente un valore pari a 0,56 unità, con la Toscana con un valore pari a 0,76 e con l’Emilia-Romagna con un valore pari a 0,39 unità;
- Il Piemonte ha un link con la Lombardia per un valore pari a 0,56 unità e con l’Emilia-Romagna con un valore pari a 0,54 unità;
- L’Emilia-Romagna ha un link con il Friuli-Venezia Giulia avente un valore pari a 0,75 unità, con il Piemonte con un valore pari a 0,54 e con la Lombardia con un valore pari a 0,39 unità;
- Il Friuli-Venezia Giulia ha un link con l’Emilia-Romagna con un valore pari a 0,75 unità.
Esiste un link semplificato costituito da una relazione biunivoca tra Basilicata e Molise con un valore della connessione pari a 0,72.
Machine Learning e predizioni. Di seguito è stata realizzata una attività di predizione attraverso l’utilizzo di otto algoritmi di machine learning. Gli algoritmi sono stati confrontati in base alla loro capacità di massimizzare l’R-quadro e di minimizzare il Mean Absolute Error, il Mean Squared Error, ed il Root Mean Squared Error. Gli algoritmi sono stati addestrati con il 70% dei dati disponibili mentre il restante 30% è stato utilizzato per la predizione vera e propria. Viene così determinato il seguente ordinamento degli algoritmi ovvero:
- Tree Ensemble Regression con un valore del payoff pari a 4;
- Gradient Boosted Trees Regression con un valore del payoff pari a 8;
- ANN-MLP con un valore del payoff pari a 12;
- PNN e Simple Regression Tree con un valore del payoff pari a 18;
- Random Forest Regression con un valore del payoff pari a 24;
- Polynomial Regression con un valore del payoff pari a 28;
- Linear Regression con un valore del payoff pari a 32.
Pertanto applicando il best performing algorithm è possibile predire l’andamento della sedentarietà nelle seguenti regioni ovvero:
- Valle d’Aosta con una variazione da un ammontare di 25,80 unità fino ad un valore di 25,36 unità con una variazione assoluta pari a -0,44 unità ed una variazione percentuale pari ad un valore di -1,70%;
- Lombardia con una variazione aumentativa da un ammontare di 25,00 unità fino ad un valore di 25,17 unità ovvero pari ad una variazione di 0,17 unità pari ad un ammontare di 0,69%;
- Veneto con una variazione aumentativa da un ammontare di 19,80 unità fino ad un valore di 23,43 unità ovvero pari ad una variazione di 3,63 unità pari ad una variazione di 18,33%;
- Emilia-Romagna con una variazione diminutiva da una variazione di 25,20 unità fino ad un valore di 24,99 unità ovvero pari ad una variazione di -0,21 unità pari ad una varazione di -0,82%;
- Campania con una variazione diminutiva da un ammontare di 56,20 unità fino ad una variazione di 44,76 unità ovvero pari ad una variazione di -11,44 unità pari ad un ammontare del -20,36%;
- Sicilia con una variazione diminutiva da un ammontare di 56,60 unità fino ad un valore di 44,76 unità ovvero pari ad una variazione di -11,84 unità pari ad un ammontare di -20,92%.
Complessivamente l’algoritmo predice una riduzione media della sedentarietà da un ammontare di 34,77 unità fino ad un valore di 31,41 unità ovvero pari ad una variazione di -3,35 unità pari ad un valore di -9,65%.
Conclusioni. I dati mostrano una riduzione significativa della sedentarietà nelle regioni italiane tra il 2005 ed il 2020. Nello specifico in media in Italia c’è stata una riduzione del -19,33% della sedentarietà. Tuttavia i dati mostrano che la sedentarietà è ancora molto presente nelle regioni meridionali. In Sicilia, Campania e Calabria la metà della popolazione è sedentaria. E’ probabile che vi siano delle problematiche reddituali che rendano difficile la cultura dello sport e dell’attività fisica. In questo senso è necessario sottolineare che tali aree sono anche in genere dotate di una dotazione di strutture sportive inferiore rispetto al Centro Nord. In questo senso l’investimento nelle infrastrutture sportive, come per esempio i palazzetti dello sport, le palestre etc, e anche il sostegno al sistema dell’associazionismo sportivo potrebbero contribuire significativamente ad una riduzione del sedentarismo nelle regioni meridionali d’Italia.
RIPRODUZIONE RISERVATA ©