Dans le cours : Python : Le nettoyage des données
Accédez à ce cours grâce à un essai gratuit
Inscrivez-vous aujourd’hui pour accéder à plus de 24 900 cours dispensés par des experts.
Normaliser et transformer les données - Tutoriel Python
Dans le cours : Python : Le nettoyage des données
Normaliser et transformer les données
La mise à l'échelle des données est une étape cruciale pour préparer les données à l'analyse, ou encore à l'utilisation des algorithmes de machine learning. Dans cette vidéo, nous passerons en revue différentes approches de mise à l'échelle des données en utilisant Python. Nous commençons par importer la librairie Pandas, ainsi que MinMaxSscaler, StandardScaler, RobustScaler et MaxAbsScaler, à partir de scikitlearn. Nous exécutons. Ensuite, nous nous intéressons à notre jeu de données. Ici, il s'intitule ' données_enregistrées.csv ', que vous pouvez trouver dans les fichiers d'exercice. Nous le récupérons en utilisant read_csv, et nous affichons les données en utilisant la fonction print. C'est parti ! Ici, nous avons l'identifiant le salaire, l'âge, l'expérience en nombre d'années, ainsi que la taille en centimètres. Nous pouvons rapidement nous rendre compte que l'échelle n'est pas la même, que ce soit pour les salaires, l'âge, l'expérience, ou encore la taille. Il est aussi à noter…
Entraînez-vous tout en suivant la formation avec les fichiers d’exercice.
Téléchargez les fichiers utilisés par l’instructeur pour enseigner le cours. Suivez attentivement et apprenez en regardant, en écoutant et en vous entraînant.
Table des matières
-
-
-
-
(Verrouillé)
Traiter les valeurs manquantes avec imputation3 m 53 s
-
Traiter les valeurs manquantes avec des données externes1 m 56 s
-
(Verrouillé)
Éliminer les doublons2 m 27 s
-
(Verrouillé)
Corriger les erreurs et les valeurs aberrantes3 m 8 s
-
(Verrouillé)
Normaliser et transformer les données4 m 18 s
-
(Verrouillé)
-
-
-
-