formateur informatique

Regrouper les données dissociées par formule Python dans Excel

Accueil  >  Bureautique  >  Excel  >  Excel Avancé  >  Regrouper les données dissociées par formule Python dans Excel
Livres à télécharger


Pour partager cette vidéo sur les réseaux sociaux ou sur un site, voici son url :


Inscription Newsletter    Abonner à Youtube    Vidéos astuces Instagram
Sujets que vous pourriez aussi aimer :


Regrouper les données dissociées

Dans le volet précédent, nous avons découvert la méthode Python stack pour transformer linéairement un tableau Excel fait de plusieurs colonnes. Dans ce nouveau chapitre, nous allons entreprendre le chemin inverse pour regrouper les données dissociées.

Regrouper les données séparées dans un tableau Excel par formule Python

C'est ce que démontre le résultat illustré par la capture. Et c'est ainsi que nous allons découvrir la méthode Python unstack.

Classeur Excel à télécharger
Nous suggérons d'établir l'étude à partir d'un classeur Excel existant. Tableau Excel pour regrouper les données par formule Python

Nous découvrons un tableau de données dissociées entre les colonnes K et M. Nous souhaitons les regrouper par Ville et par Mois sur la droite, dans un tableau encore vide, placé entre les colonnes O et V.

Le DataFrame
Comme vous le savez, nous devons commencer par embarquer le tableau à travailler dans un DataFrame Python.
  • Cliquer sur la case grisée au-dessus du tableau de droite pour sélectionner la cellule O4,
  • Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
  • Puis, débuter la syntaxe comme suit : tabR=,
tabR est le nom que nous souhaitons attribuer à notre nouveau DataFrame.
  • Dès lors, sélectionner toutes les données du tableau à travailler, soit la plage K4:M32,
Ce qui donne : tabR=xl("K4:M32", headers=True).
  • Valider la formule par le raccourci clavier CTRL + Entrée,
Nous obtenons un nouveau DataFrame prêt à l'emploi.

Regrouper les données
Sur ce nouveau DataFrame, il est temps d'exploiter la méthode Python unstack pour consolider les données dissociées.
  • Cliquer sur la première case de la grille d'extraction pour sélectionner la cellule O6,
  • Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
  • Construire le début de syntaxe suivant :
tableau_original = tabR.set_index(['Ville', 'Mois']).unstack().reset_index()

Nous nommons le tableau de réception tableau_original. La méthode Python unstack crée un DataFrame avec une structure multi-indexée, et les colonnes résultantes incluent à la fois les niveaux de l'index et les noms des colonnes d'origine.
  • Enfoncer la touche Entrée du clavier pour passer à la ligne,
  • Puis, ajouter les deux lignes suivantes à la syntaxe :
tableau_original.columns = ['Ville'] + [col[1] for col in tableau_original.columns[1:]]
tableau_original


Nous regroupons sur les villes puis nous engageons une boucle Python pour recréer toutes les colonnes du tableau structuré opérant les regroupements, [col[1] for col in tableau_original.columns[1:]]. C'est ainsi que nous restituons tous les mois pour les données recoupées sur chaque ville.
  • Valider la formule par le raccourci clavier CTRL + Entrée,
Nous obtenons un nouveau DataFrame.
  • A gauche de la barre de formule, cliquer sur la flèche orientée vers le bas,
  • Dans les propositions, choisir Valeur Excel,
Comme vous pouvez l'apprécier, les données qui étaient dissociées sont désormais regroupées par Ville et dans le même temps, énumérées par Mois.

Réunir les données séparées par formule Python dans Excel

 
Sur Facebook
Sur Youtube
Les livres
Contact
Mentions légales



Abonnement à la chaîne Youtube
Partager la formation
Partager sur Facebook
Partager sur Twitter
Partager sur LinkedIn