Pour partager cette vidéo sur les réseaux sociaux ou sur un site, voici son url :
Sujets que vous pourriez aussi aimer :Compter les données distinctes
Comment compter les
valeurs distinctes colonne à colonne ou ligne à ligne avec des
formules Python dans
Excel ? C'est ce que nous allons découvrir avec la
méthode Python nunique.
Classeur Excel à télécharger
Pour asseoir l'étude, nous suggérons de récupérer un
classeur Excel existant.

Nous découvrons un tableau de valeurs numériques entre les
colonnes B et F. Les chiffres qui sont énumérés ne dépassent jamais la valeur 4. Forcément sur plus de 10 lignes, de
nombreuses répétitions sont à observer colonne à colonne.
Ce tableau est représenté par un
DataFrame en cellule B16 :
df=xl("B3:F14", headers=True). En-dessous, deux petites grilles vides sont en attente pour livrer les
statistiques sur les éléments distincts.
Eléments distincts en colonnes
La
méthode Python nunique permet donc de
compter le nombre d'éléments distincts dans un axe spécifié (colonnes ou lignes) d'un
DataFrame. Utilisée
sans argument, elle raisonne par défaut sur les
colonnes. C'est ce que nous allons découvrir.
- Cliquer sur la première case vide de la première grille pour sélectionner la cellule B19,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Construire la syntaxe suivante : df.nunique(),
- Valider la formule par le raccourci clavier CTRL + Entrée,
- A gauche de la barre de formule, cliquer sur la flèche orientée vers le bas,
- Dans les propositions, choisir Valeur Excel,

Dans les deux premières et dans les deux dernières colonnes, les quatre chiffres (de 1 à 4) sont représentés. C'est pourquoi la
méthode nunique indique à chaque reprise avoir trouvé 4 éléments distincts. En revanche, elle renseigne sur le fait que tous ces éléments ne sont pas représentés dans la
colonne C. En effet si vous y regardez de plus près, le chiffre 1 manque à l'appel.
Eléments distincts en lignes
Pour compter les éléments distincts par ligne, nous devons introduire un paramètre de la
méthode nunique. Il se nomme
axis.
- Cliquer sur la première case vide de la seconde grille pour sélectionner la cellule E19,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Construire la syntaxe suivante : df.nunique(axis=1),
- Valider la formule par le raccourci clavier CTRL + Entrée,
- A gauche de la barre de formule, cliquer sur la flèche orientée vers le bas,
- Dans les propositions, choisir Valeur Excel,

Cette fois, nous constatons instantanément que seules la troisième et la huitième lignes accueillent les quatre chiffres. Imaginez l'intérêt et la puissance de cette
méthode Python nunique sur des tableaux faits de textes, pour dévoiler des analyses précieuses et déceler des anomalies rapidement.