formateur informatique

Filtrer les données dupliquées avec Excel

Accueil  >  Bureautique  >  Excel  >  Excel Avancé  >  Filtrer les données dupliquées avec Excel
Livres à télécharger


Pour partager cette vidéo sur les réseaux sociaux ou sur un site, voici son url :


Inscription Newsletter    Abonner à Youtube    Vidéos astuces Instagram
Sujets que vous pourriez aussi aimer :


Compter les données répétées

Nous avons déjà imbriqué les fonctions Unique et Filtre pour notamment créer des listes purgées de leurs doublons. Nous récidivons ici dans une optique légèrement différente. Il est question de dresser des statistiques sur des valeurs répétées.

Extraire les données répétées souvent par formule Excel

Sur l'exemple illustré par la capture, nous travaillons sur une base de données des activités de sorties. Certains départements sont mieux renseignés que d'autres. Pour avoir une idée des proportions et répartitions, nous construisons une formule de filtre, sur la droite du tableau, répondant à un critère numérique saisi par l'utilisateur. C'est ainsi et dans ce cas illustré que nous dressons la liste des départements enregistrant plus de cent activités de sorties.

Classeur Excel à télécharger
Nous suggérons d'axer l'étude sur un classeur Excel hébergeant cette base de données. Nous découvrons le tableau des activités de sorties. De nombreuses suggestions sont renseignées dans chaque département. C'est la raison pour laquelle, cette information en colonne D, est répétée à de nombreuses reprises. L'idée ici est d'établir une formule unique capable d'extraire les départements riches en activités, selon une contrainte numérique à dépasser, livrée par l'utilisateur en cellule H4. En déployant la zone Nom en haut à gauche de la feuille Excel, vous constatez que la colonne des départements est reconnue sous le nom dep.

Filtrer au-delà
Pour extraire les départements proposant au moins le nombre d'activités désirées, nous devons déployer plusieurs astuces. Nous devons commencer par compter les répétitions grâce à la fonction Nb.Si. Ce score, nous devons l'exploiter dans la fonction Filtre pour retourner les données répondant favorablement.
  • Sélectionner la case du premier département à extraire en cliquant sur sa cellule G4,
  • Taper le symbole égal (=) pour débuter la construction de la formule matricielle,
  • Inscrire la fonction d'extraction suivie d'une parenthèse, soit : Filtre(,
  • Désigner la plage des départements à filtrer par son nom, soit : dep,
  • Taper un point-virgule (;) pour passer dans l'argument du critère de la fonction Filtre,
  • A gauche de la barre de formule, cliquer sur le bouton de l'assistant fonction (fx),
Grâce à lui, nous verrons comment seront repérées les données concordantes, dans ce raisonnement matriciel.
  • Dans la boîte de dialogue, cliquer dans la zone intitulée Inclure,
  • Inscrire la fonction de dénombrement conditionnel, suivie d'une parenthèse, soit : Nb.Si(,
  • Désigner la plage des départements à analyser par son nom, soit : dep,
  • Taper un point-virgule (;) pour passer dans l'argument de la donnée à comptabiliser,
  • Désigner de nouveau la plage des départements par son nom, soit : dep,
Dans ce raisonnement matriciel, donc récursif, ce sont tous les départements qui vont être analysés tour à tour dans cette même colonne des départements, pour compter leurs nombres respectifs.

Compter les données par catégories par formule Excel

Et d'ailleurs, vous remarquez que l'assistant fonction réagit aussitôt en répondant par une matrice de nombres. Chaque nombre indique la quantité de fois que le département repéré sur cette position, intervient dans la colonne. C'est ainsi, en ajoutant la contrainte numérique définie par l'utilisateur, que nous allons pouvoir exclure tous ceux qui ne dépassent pas ce seuil.
  • Fermer la parenthèse de la fonction Nb.Si,
  • Puis, ajouter le critère suivant : >H4,
Cette fois, c'est une nouvelle matrice qui apparaît, en bas à droite de l'assistant. Elle retranscrit les noms des départements répondant favorablement à la contrainte numérique. Dans ce court visuel, seul le département de la Drôme ressort car il est répété à de nombreuses reprises en début de base de données.
  • Cliquer sur le bouton Ok de l'assistant pour valider la formule matricielle,
Comme vous pouvez le voir, tous les départements qui répondent favorablement au critère numérique sont retranscrits dans la colonne G. Ils apparaissent a priori dans le même ordre que dans celui de la base de données source. Mais il n'en est rien. Vous pouvez le constater en faisant défiler les lignes jusqu'à atteindre celles des départements peu fournis comme c'est le cas du Vaucluse par exemple.

Si vous changez la contrainte numérique, les extractions s'adaptent bien entendu.

Extraire les données répétées au-delà d-un certain nombre de fois

Eliminer les répétitions
La formule que nous venons de construire est certes un succès mais elle est peu exploitable dans la mesure où elle répète un département concordant autant de fois qu'il apparaît dans la base de données source. Pour corriger le défaut, il suffit d'intégrer le précédent calcul dans la fonction matricielle Unique.
  • Sélectionner de nouveau la cellule G4,
  • Cliquer dans la barre de formule après le symbole égal (=) pour y placer le point d'insertion,
  • Inscrire la fonction pour éliminer les doublons, suivie d'une parenthèse, soit : Unique(,
  • Cliquer alors à la fin de la syntaxe, après la dernière parenthèse fermante,
  • Fermer la parenthèse de la fonction Unique,
  • Puis, valider la formule par la touche Entrée du clavier,
Le résultat est beaucoup plus épuré et donc beaucoup plus clair à interpréter. Par exemple, seuls quatre départements proposent plus de 140 activités de sorties. La syntaxe de la formule que nous avons construite est la suivante : =Unique(FILTRE(dep; NB.SI(dep;dep)>H4)).

Son mécanisme est intéressant en inversant le critère d'inégalité pour repérer rapidement tous les départements dépourvus d'idées de sorties et donc à travailler en priorité.

Isoler les groupes peu renseignés par formule Excel

C'est ainsi que nous pouvons rapidement faire ressortir la liste des départements offrant moins de 20 activités de sorties.

 
Sur Facebook
Sur Youtube
Les livres
Contact
Mentions légales



Abonnement à la chaîne Youtube
Partager la formation
Partager sur Facebook
Partager sur Twitter
Partager sur LinkedIn