> Formations > Technologies numériques > Langages et développement > Python > Formation Python Data Science, manipuler et visualiser les données > Formations > Technologies numériques > Formation Python Data Science, manipuler et visualiser les données

Formation : Python Data Science, manipuler et visualiser les données

maîtrisez NumPy, SciPy, Pandas, Matplotlib, Seaborn, Bokeh, Plotly, Dask et Xarray pour l’Analyse, la Visualisation et la Manipulation de Données Massives

Python Data Science, manipuler et visualiser les données

maîtrisez NumPy, SciPy, Pandas, Matplotlib, Seaborn, Bokeh, Plotly, Dask et Xarray pour l’Analyse, la Visualisation et la Manipulation de Données Massives


Formation incontournable Formation Blended

La science des données est un domaine multidisciplinaire en constante expansion. Elle s’appuie sur des méthodes scientifiques, des algorithmes et des processus que Python a su maîtriser grâce à un écosystème particulièrement riche. Il est devenu aujourd’hui le langage de référence pour l’analyse de données, quels qu’en soient les formats. Notre formation vous permet la prise en main des outils, bibliothèques et modules Python pour obtenir de rapides compétences en data science avec ce langage.


INTER
INTRA
SUR MESURE

Cours pratique en présentiel ou à distance
Disponible en anglais, à la demande

Réf. IYT
  4j - 28h00
Prix : 2440 € H.T.
Pauses-café et
déjeuners offerts
En option :
Dynamique.Model.Bean_FormationOption
Blended : 190 € HT




La science des données est un domaine multidisciplinaire en constante expansion. Elle s’appuie sur des méthodes scientifiques, des algorithmes et des processus que Python a su maîtriser grâce à un écosystème particulièrement riche. Il est devenu aujourd’hui le langage de référence pour l’analyse de données, quels qu’en soient les formats. Notre formation vous permet la prise en main des outils, bibliothèques et modules Python pour obtenir de rapides compétences en data science avec ce langage.


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Posséder une vue d’ensemble de l’écosystème scientifique de Python
Connaître les librairies scientifiques incontournables pour la science des données
Être capable de manipuler des données volumineuses avec Python
Comprendre l’intérêt de la datavisualisation
Savoir visualiser des données avec Python

Public concerné
Ingénieur, développeur, chercheur, data scientist, data analyst et toute personne désireuse de se former à l'univers scientifique de Python.

Prérequis
Pratique du langage Python.
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Méthodes et moyens pédagogiques
Travaux pratiques
De nombreux exercices sont réalisés pour illustrer les sujets.
Méthodes pédagogiques
Pédagogie active, retours d'expériences, des démonstrations sont mises en œuvre par le formateur pour une mise en pratique plus rapide par les participants.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

1
Présentation de l'écosystème Python scientifique

  • Panorama de l’écosystème scientifique de Python : les librairies incontournables.
  • Savoir où trouver de nouvelles librairies et juger de leur pérennité.
  • Les principaux outils et logiciels open source pour la data science.
  • Pourquoi utiliser une distribution scientifique, Anaconda.
  • Comprendre l’intérêt d’un environnement virtuel et savoir l’utiliser.
  • L’interpréteur IPython et le serveur Jupyter.
  • Les bonnes pratiques pour bien démarrer votre projet de data science avec Python.
  • Les formats de fichiers scientifiques et les librairies pour les manipuler.
Travaux pratiques
Mise en place de l’environnement de développement : installation d’Anaconda, création d’un environnement virtuel, export et duplication d’un environnement, utiliser les notebooks Jupyter.

2
La SciPy Stack

  • Le socle de librairies scientifiques incontournables sur lequel sont basées toutes les autres : la SciPy Stack.
  • NumPy : calcul numérique et algèbre linéaire (les vecteurs, matrices, images).
  • SciPy, basée sur NumPy pour les statistiques, les analyses fonctionnelles, géospatiales, le traitement du signal, etc.
  • Pandas : l’analyse de données tabulaires (CSV, Excel, etc.), statistiques, pivots, filtres, recherche…
  • Matplotlib : la librairie de visualisation de données incontournable.
Travaux pratiques
Mesurer les performances du NumPy installé par votre Linux et celui d’Anaconda. Traitement d’images avec NumPy. Premiers tracés. Analyses statistiques de fichiers CSV. Premiers éléments de cartographie. Transformées de Fourier.

3
Les librairies de visualisation

  • Panorama des librairies de visualisation de Python : 2D/3D, desktop/web, statistiques, cartographie, big data...
  • Les librairies orientées desktop : Matplotlib, Pandas, Seaborn.
  • Les librairies orientées web : Bokeh, Altair, Plotly...
  • Les librairies pour la 3D : Plotly, pythreejs, ipyvolume...
  • Les librairies cartographiques : Cartopy, folium, ipyleaflet, Bokeh, cesiumpy…
  • Les librairies big data : datashader, Vaex...
Travaux pratiques
Réalisation de multiples exercices avec quelques librairies présentées. Visualisation big data, cartographique, 2D et 3D.

4
La datavisualisation

  • L'intérêt de la datavisualisation
  • Utiliser PyViz et l’écosystème HoloViz.
  • Présentation des outils SuperSet, Mayavi, Paraview et VisIt.
Travaux pratiques
Poursuivre l'utilisation des librairies de visualisation et manipulations des outils.

5
Les formats de fichiers scientifiques et la manipulation de données volumineuses

  • Panorama des principaux formats de fichiers scientifiques : NetCDF, HDF5, GRIB, JSON, PARQUET, MATLAB, CGNS...
  • Manipuler des données volumineuses avec Dask, Vaex et Xarray.
Travaux pratiques
Manipulation de données dépassant les Go, lecture et écriture de fichiers NetCDF/HDF5. Visualisation de données climatiques, images satellites, création de vidéos/animations graphiques.


Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Options
Blended : 190 € HT
Approfondissez les connaissances acquises en formation grâce aux modules e-learning de notre Chaîne e-learning Python Data Science. Un apprentissage flexible et complet, à suivre à votre rythme dès le premier jour de votre présentiel et pendant 1 an.

Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.

Avis clients
4,7 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
CÉLINE R.
08/04/25
4 / 5

Le contenu est vraiment complet, beaucoup de choses à assimiler. Formateur très pédagogue
LOUISA H.
08/04/25
5 / 5

Le contenu était bien. Il n’y a pas de chapitre sur lesquels j’aurais pu faire l’impasse
YOHANN C.
19/11/24
5 / 5

Gael a été une intervenante remarquable, toujours soucieuse de s’assurer que chacun progresse à son rythme, sans ralentir les plus rapides. Il a constamment mis à disposition des documents complémentaires pertinents pour approfondir nos connaissances et a répondu à toutes nos questions avec clarté et exhaustivité. Sa pédagogie et son engagement ont véritablement enrichi l’expérience de formation. Je regrette de ne pas avoir pu suivre cette formation sur site.



Horaires
les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance

Dernières places
Date garantie en présentiel ou à distance
Session garantie




PARTICIPANTS
Futurs managers et responsables d’équipe souhaitant structurer leur pratique managériale

PRÉREQUIS
Aucun

COMPÉTENCES DU FORMATEUR
Les experts qui animent la formation sont des spécialistes des matières abordées. Ils ont été validés par nos équipes pédagogiques tant sur le plan des connaissances métiers que sur celui de la pédagogie, et ce pour chaque cours qu’ils enseignent. Ils ont au minimum cinq à dix années d’expérience dans leur domaine et occupent ou ont occupé des postes à responsabilité en entreprise.

MODALITÉS D’ÉVALUATION
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques… Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

MOYENS PÉDAGOGIQUES ET TECHNIQUES
• Les moyens pédagogiques et les méthodes d’enseignement utilisés sont principalement : aides audiovisuelles, documentation et support de cours, exercices pratiques d’application et corrigés des exercices pour les stages pratiques, études de cas ou présentation de cas réels pour les séminaires de formation. • À l’issue de chaque stage ou séminaire, ORSYS fournit aux participants un questionnaire d’évaluation du cours qui est ensuite analysé par nos équipes pédagogiques. • Une feuille d’émargement par demi-journée de présence est fournie en fin de formation ainsi qu’une attestation de fin de formation si le stagiaire a bien assisté à la totalité de la session.

MODALITÉS ET DÉLAIS D’ACCÈS
L’inscription doit être finalisée 24 heures avant le début de la formation.

ACCESSIBILITÉ AUX PERSONNES HANDICAPÉES
Pour toute question ou besoin relatif à l’accessibilité, vous pouvez joindre notre équipe PSH par e-mail à l'adresse psh-accueil@orsys.fr.