Pour partager cette vidéo sur les réseaux sociaux ou sur un site, voici son url :
Sujets que vous pourriez aussi aimer :Regrouper les données dissociées
Dans le volet précédent, nous avons découvert la
méthode Python stack pour
transformer linéairement un
tableau Excel fait de plusieurs colonnes. Dans ce nouveau chapitre, nous allons entreprendre le chemin inverse pour
regrouper les données dissociées.

C'est ce que démontre le résultat illustré par la capture. Et c'est ainsi que nous allons découvrir la
méthode Python unstack.
Classeur Excel à télécharger
Nous suggérons d'établir l'étude à partir d'un
classeur Excel existant.

Nous découvrons un tableau de données dissociées entre les
colonnes K et M. Nous souhaitons les regrouper par Ville et par Mois sur la droite, dans un tableau encore vide, placé entre les
colonnes O et V.
Le DataFrame
Comme vous le savez, nous devons commencer par embarquer le tableau à travailler dans un
DataFrame Python.
- Cliquer sur la case grisée au-dessus du tableau de droite pour sélectionner la cellule O4,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Puis, débuter la syntaxe comme suit : tabR=,
tabR est le nom que nous souhaitons attribuer à notre nouveau
DataFrame.
- Dès lors, sélectionner toutes les données du tableau à travailler, soit la plage K4:M32,
Ce qui donne :
tabR=xl("K4:M32", headers=True).
- Valider la formule par le raccourci clavier CTRL + Entrée,
Nous obtenons un nouveau
DataFrame prêt à l'emploi.
Regrouper les données
Sur ce nouveau
DataFrame, il est temps d'exploiter la
méthode Python unstack pour
consolider les données dissociées.
- Cliquer sur la première case de la grille d'extraction pour sélectionner la cellule O6,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Construire le début de syntaxe suivant :
tableau_original = tabR.set_index(['Ville', 'Mois']).unstack().reset_index()
Nous nommons le tableau de réception
tableau_original. La
méthode Python unstack crée un
DataFrame avec une structure multi-indexée, et les colonnes résultantes incluent à la fois les niveaux de l'index et les noms des colonnes d'origine.
- Enfoncer la touche Entrée du clavier pour passer à la ligne,
- Puis, ajouter les deux lignes suivantes à la syntaxe :
tableau_original.columns = ['Ville'] + [col[1] for col in tableau_original.columns[1:]]
tableau_original
Nous regroupons sur les villes puis nous engageons une
boucle Python pour recréer toutes les colonnes du tableau structuré opérant les regroupements, [col[1] for col in tableau_original.columns[1:]]. C'est ainsi que nous restituons tous les mois pour les données recoupées sur chaque ville.
- Valider la formule par le raccourci clavier CTRL + Entrée,
Nous obtenons un nouveau
DataFrame.
- A gauche de la barre de formule, cliquer sur la flèche orientée vers le bas,
- Dans les propositions, choisir Valeur Excel,
Comme vous pouvez l'apprécier, les données qui étaient dissociées sont désormais regroupées par Ville et dans le même temps, énumérées par Mois.