Discrétisation de données

À faire
  • Téléchargez le fichier d’exercice (lien ci-contre)
  • Enregistrez-le dans votre dossier de DO Informatique.
  • Ouvrez-le avec Positron.

Objectifs

  • Charger des données depuis une source externe
  • Explorer et manipuler des données

Exercices

  • Amplitude fixe
    • Créez une colonne dans le tableau pib en divisant la colonne PIB_hab en 3 catégories d’amplitude égale : faible < moyen < élevé. Dans quelle catégorie se trouve Neuchâtel ?
    • Combien de valeurs chacune des catégories contiennent-elles ?
    • Avancé: Que se passe-t-il si on créé 4 catégories d’amplitude égale ?
  • Effectifs fixes
    • Créez une colonne dans le tableau pib en divisant la colonne PIB_hab en 3 catégories d’effectifs fixes : faible < moyen < élevé. Dans quelle catégorie se trouve Neuchâtel à présent ?
    • Combien de valeurs chacune des catégories contiennent-elles ?
  • Avancé: Seuils observés
    • Considérez le graphique du PIB par habitants.
    • Créez une colonne dans le tableau pib en divisant la colonne PIB_hab en 3 catégories manuelles. Quelle répartition vous semblent la plus pertinente ?
import pandas as pd

pib = pd.read_csv('https://geoviews.link/PIB_2022')

Amplitude fixe

Effectifs fixes

Seuils observés

import matplotlib.pyplot as plt

fig, ax = plt.subplots()

pib = pib.sort_values("PIB_hab")

ax.bar(pib["Canton"], pib["PIB_hab"])
for tick in ax.get_xticklabels():
    tick.set_rotation(50)