import pandas as pd
= pd.read_csv('https://geoviews.link/PIB_2022') pib
Discrétisation de données
À faire
- Téléchargez le fichier d’exercice (lien ci-contre)
- Enregistrez-le dans votre dossier de DO Informatique.
- Ouvrez-le avec Positron.
Objectifs
- Charger des données depuis une source externe
- Explorer et manipuler des données
Exercices
- Amplitude fixe
- Créez une colonne dans le tableau
pib
en divisant la colonnePIB_hab
en 3 catégories d’amplitude égale : faible < moyen < élevé. Dans quelle catégorie se trouve Neuchâtel ? - Combien de valeurs chacune des catégories contiennent-elles ?
- Avancé: Que se passe-t-il si on créé 4 catégories d’amplitude égale ?
- Créez une colonne dans le tableau
- Effectifs fixes
- Créez une colonne dans le tableau
pib
en divisant la colonnePIB_hab
en 3 catégories d’effectifs fixes : faible < moyen < élevé. Dans quelle catégorie se trouve Neuchâtel à présent ? - Combien de valeurs chacune des catégories contiennent-elles ?
- Créez une colonne dans le tableau
- Avancé: Seuils observés
- Considérez le graphique du PIB par habitants.
- Créez une colonne dans le tableau
pib
en divisant la colonnePIB_hab
en 3 catégories manuelles. Quelle répartition vous semblent la plus pertinente ?
Amplitude fixe
Effectifs fixes
Seuils observés
import matplotlib.pyplot as plt
= plt.subplots()
fig, ax
= pib.sort_values("PIB_hab")
pib
"Canton"], pib["PIB_hab"])
ax.bar(pib[for tick in ax.get_xticklabels():
50) tick.set_rotation(