Dans le cours : Python : Le nettoyage des données

Accédez à ce cours grâce à un essai gratuit

Inscrivez-vous aujourd’hui pour accéder à plus de 24 900 cours dispensés par des experts.

Normaliser et transformer les données

Normaliser et transformer les données

La mise à l'échelle des données est une étape cruciale pour préparer les données à l'analyse, ou encore à l'utilisation des algorithmes de machine learning. Dans cette vidéo, nous passerons en revue différentes approches de mise à l'échelle des données en utilisant Python. Nous commençons par importer la librairie Pandas, ainsi que MinMaxSscaler, StandardScaler, RobustScaler et MaxAbsScaler, à partir de scikitlearn. Nous exécutons. Ensuite, nous nous intéressons à notre jeu de données. Ici, il s'intitule ' données_enregistrées.csv ', que vous pouvez trouver dans les fichiers d'exercice. Nous le récupérons en utilisant read_csv, et nous affichons les données en utilisant la fonction print. C'est parti ! Ici, nous avons l'identifiant le salaire, l'âge, l'expérience en nombre d'années, ainsi que la taille en centimètres. Nous pouvons rapidement nous rendre compte que l'échelle n'est pas la même, que ce soit pour les salaires, l'âge, l'expérience, ou encore la taille. Il est aussi à noter…

Table des matières