Pour partager cette vidéo sur les réseaux sociaux ou sur un site, voici son url :
Sujets que vous pourriez aussi aimer :Remplir les vides
Lors du volet précédent, nous avons découvert la
méthode Python dropna pour
nettoyer un tableau Excel de ses
erreurs. Nous allons voir que nous pouvons aussi l'utiliser sur un tableau embarquant des
cellules vides.
Classeur Excel à télécharger
Pour étayer les démonstrations, nous suggérons de récupérer un classeur existant.
Nous découvrons un tableau des ventes mais certaines lignes sont incomplètes. Des
trous se sont glissés çà et là .
Le DataFrame
Avant de débuter et comme il est de coutume, nous proposons de représenter le tableau par un objet Python, un
DataFrame.
- Cliquer sur la case grisée au-dessus du tableau pour sélectionner la cellule B3,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Taper le début de syntaxe suivante: tab=,
tab est le nom que nous souhaitons attribuer à notre
DataFrame.
- Sélectionner alors toutes les données du tableau, soit la plage de cellules B5:E31,
Nous obtenons la syntaxe suivante :
tab=xl("B5:E31", headers=True).
- Valider la formule par le raccourci clavier CTRL + Entrée,
Le
DataFrame est né. Vous pouvez obtenir un aperçu des données qu'il embarque en cliquant sur son préfixe
PY.
Exclure les lignes des vides
Même si ce n'est pas la finalité de ce sujet, nous allons démontrer dans un premier temps l'efficacité de la
méthode dropna sur ce type de tableau.
- Cliquer sur la première case de la grille d'extraction pour sélectionner la cellule G5,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Taper le nom du DataFrame suivi d'un point, soit : tab.,
- Dès lors, appeler la méthode dropna : dropna(),
- Puis, valider la formule par le raccourci clavier CTRL + Entrée,
Nous obtenons un nouveau
DataFrame. Mais cette fois, nous souhaitons exploiter visuellement les données qu'il renferme.
- A gauche de la barre de formule, cliquer sur la flèche orientée vers le bas,
- Dans les propositions, choisir Valeur Excel,
Nous obtenons l'extraction des lignes du tableau d'origine mais comme vous le constatez, purgée des lignes qui portaient des cellules vides, donc jugées comme inexploitables.
Remplir les trous
Lorsque l'opération consiste en revanche à conserver toutes les lignes, considérant que les trous sont des données qui seront bientôt renseignées,
Python offre une autre méthode pour
remplir automatiquement les cellules vides avec une indication. Cette méthode se nomme
fillna.
- Sélectionner de nouveau la cellule G5,
- Enfoncer la touche Suppr du clavier pour effacer le précédent calcul,
- Puis, sélectionner la cellule H5 voisine,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Taper le nom du DataFrame suivi d'un point, soit : tab.,
- Puis, appeler la méthode fillna avec une indication textuelle en paramètre : fillna("soon"),
- Valider la formule par le raccourci clavier CTRL + Entrée,
- Enfin, transformer le DataFrame en valeur Excel,
Cette fois toutes les lignes sont bien extraites mais les trous sont remplis de l'information
Soon pour indiquer qu'ils seront vraisemblablement prochainement renseignés.