Pour partager cette vidéo sur les réseaux sociaux ou sur un site, voici son url :
Sujets que vous pourriez aussi aimer :Nettoyer un tableau
A l'occasion des chapitres précédents, nous avons déjà découvert quelques précieuses
méthodes Python pour alimenter des
formules puissantes dans
Excel, certaines d'ailleurs se suffisant à elles-mêmes. C'est encore le cas ici pour découvrir une nouvelle méthode permettant de
nettoyer automatiquement des
tableaux Excel.
Classeur Excel à télécharger
Pour démontrer cette nouvelle pépite, nous suggérons de baser l'étude précisément, sur un
tableau Excel bourré d'anomalies.
Nous découvrons un tableau Excel dans lequel en troisième colonne notamment, de nombreuses erreurs se cumulent (#Valeur, #Div/0...).
Le Dataframe
Avant de dégainer la
méthode Python tombée du ciel, comme il est de coutume, nous devons commencer par embarquer le
tableau Excel dans un
objet Python, un
DataFrame.
- Cliquer sur la case grisée vide pour sélectionner la cellule B3,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Puis, débuter la syntaxe comme suit : tab=,
tab est effectivement le nom que nous souhaitons attribuer à notre
DataFrame.
- Dès lors, sélectionner toutes les cellules du tableau,
Cette action conduit à la syntaxe suivante :
tab=xl("B5:D12", headers=True).
Les entêtes sont reconnus comme tels (headers=True) et notre tableau, après avoir validé par
CTRL + Entrée, est désormais encapsulé prêt à être piloté par
Python grâce à son nom
tab.
La méthode magique dropna
Python offre une solution magique pour
nettoyer un tableau Excel à plus forte raison s'il est dense tel une base de données. Cette méthode se nomme
dropna,
na pour
Not Availiable soit
Non Disponible. Elle se charge de tout, toute seule. Elle élimine automatiquement toutes les lignes embarquant ne serait-ce qu'une seule erreur, faisant de la ligne une rangée inexploitable.
- Cliquer sur la première case de la grille d'extraction pour sélectionner la cellule F5,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Désigner le DataFrame à purger par son nom, soit : tab,
- Taper un point (.) pour appeler la méthode Python à suivre,
- Puis, enclencher la méthode dropna avec deux parenthèses : dropna(),
En effet, elle ne requiert pas de paramètre.
- Dès lors, valider la formule par le raccourci CTRL + Entrée,
Nous obtenons un nouveau
DataFrame que nous souhaitons transformer en
données Excel.
- A gauche de la barre de formule, cliquer sur la flèche orientée vers le bas,
- Dans les propositions, choisir Valeur Excel,
Et aussitôt, vous avez le plaisir de constater que nous réceptionnons un
tableau Excel dans lequel chaque ligne portant une erreur a été supprimée. Imaginez la productivité et donc le gain de temps que peut offrir cette méthode pour purger des bases de données denses, importées avec de nombreuses anomalies, pour offrir des informations propres et prêtes à l'emploi.