> Formations > Technologies numériques > Intelligence Artificielle, Big Data > IA, Machine Learning, analyse de données > Formation Machine learning engineer, Bootcamp (5 mois) (Titre RNCP) > Formations > Technologies numériques > Formation Machine learning engineer, Bootcamp (5 mois) (Titre RNCP)

Machine learning engineer, Bootcamp (5 mois) (Titre RNCP)

by DataScientest

Machine learning engineer, Bootcamp (5 mois) (Titre RNCP)

by DataScientest


New

ORSYS et DataScientest, leader dans le domaine de la data science en France, proposent un parcours en ligne de 620 heures pour vous exercer au métier d'ingénieur IA. Vous y apprendrez notamment à récupérer et analyser des données liées au processus de l’entreprise, à élaborer des modèles prédictifs afin d’anticiper l’évolution des données et les tendances relatives à l’activité de l’entreprise, à modéliser des résultats pour les rendre plus lisibles et exploitables. Ce parcours en ligne aborde les fondamentaux du langage Python, l'usage de ses principales bibliothèques pour la data science, ainsi que les technologies autour de l’analyse de la donnée comme la data visualisation, le machine learning, le big data, le deep learning ou les systèmes complexes et l’intelligence artificielle (IA). Il vous permettra en plus de préparer la certification AWS Cloud Practitioner.


Catalogue
Sur mesure

Formation en ligne

Réf. 3BZ
  20h00
Prix : Nous contacter
Langue : FR




ORSYS et DataScientest, leader dans le domaine de la data science en France, proposent un parcours en ligne de 620 heures pour vous exercer au métier d'ingénieur IA. Vous y apprendrez notamment à récupérer et analyser des données liées au processus de l’entreprise, à élaborer des modèles prédictifs afin d’anticiper l’évolution des données et les tendances relatives à l’activité de l’entreprise, à modéliser des résultats pour les rendre plus lisibles et exploitables. Ce parcours en ligne aborde les fondamentaux du langage Python, l'usage de ses principales bibliothèques pour la data science, ainsi que les technologies autour de l’analyse de la donnée comme la data visualisation, le machine learning, le big data, le deep learning ou les systèmes complexes et l’intelligence artificielle (IA). Il vous permettra en plus de préparer la certification AWS Cloud Practitioner.


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Connaître les fondamentaux du langage Python
Déployer son propre modèle de machine learning
Modéliser des résultats d’analyse des données pour les rendre lisibles et exploitables
Utiliser les technologies autour de la data science (data visualisation, machine learning, big data, deep learning, etc.)
Comprendre les systèmes complexes et l’IA
Créer des API avec Flask et FastAPI
Maîtriser les outils de versioning Git/GitHub et gérer des tests unitaires
Automatiser des tâches précises grâce à la maîtrise d'Apache Airflow
Maîtriser les techniques et outils de conteneurisation et d'orchestration des conteneurs
Faire preuve d'agilité et mener un projet data et une équipe

Public concerné
Toutes les personnes ayant une appétence pour la data souhaitant se reconvertir ou faire évoluer ses compétences.

Prérequis
Avoir un niveau Bac +3 en mathématiques ou un niveau Bac +5 en sciences. Des notions de marketing et de communication sont un plus.

Certification incluse
Un certificat “Machine Learning Engineer” des Mines Paris – PSL Executive Education. La certification de niveau 7 “Chef de projet en intelligence artificielle”, délivrée par Ascencia et enregistrée au RNCP en date du 26-01-2022 sous le n°RNCP36129.

Méthodes et moyens pédagogiques
Activités digitales
Test de positionnement sous forme de QCM d'une heure, séance d’introduction à la plateforme à distance, classes collectives, classe de soutien sur mesure, simulation et codage en direct, exercices, fiches de synthèse, projet fil rouge dédié, social learning, échanges avec data scientists, soutenance de projet devant un jury de 3 personnes.
Tutorat
Un expert accompagne par e-mail l’apprenant dès son entrée en formation. Il échange avec lui et l'aide à assimiler les compétences théoriques et pratiques nécessaires à la réussite de sa formation. Lui ou un second expert anime des classes à distance collectives durant 15 % du temps, ainsi que des ateliers collectifs de soutien. L'apprenant dispose également d'un mentor dédié au suivi de son projet fil rouge avec qui il fait des points réguliers. Les partages entre apprenants sur le forum de discussion et pendant les moments en groupe sont aussi très riches.
Pédagogie et pratique
Parcours en ligne basé sur une pédagogie active et conçu avec des experts. Une combinaison de théorie, de démonstrations, de mises en pratique, de partages d’expérience et de bonnes pratiques. Un test de positionnement, un accompagnement sur mesure dès le début du parcours, un projet fil rouge et des séquences pédagogiques de courte durée permettent de renforcer l’apprentissage et d’évaluer l’apprenant tout au long de son parcours. En cas de besoin technique, une cellule support est disponible en ligne 5 jours sur 7 de 9 h à 18 h 30. À l’issue de son parcours en ligne, l’apprenant soutient son projet devant un jury de 3 personnes. Il reçoit ensuite un certificat délivré par MINES ParisTech | PSL Executive Education, ce qui lui permet de bénéficier de la reconnaissance d’un acteur de référence dans le domaine. Il pourra aussi valider le titre RNCP "Chef de projet en Intelligence Artificielle".

Programme de la formation

1
Fondamentaux de Python

  • Découverte des différents types de variables, des listes et des tuples.
  • Initiation au concept de boucles et ses différents types.
  • Introduction aux fonctions et à leur documentation.
  • Instanciation de classes et utilisation de modules.

2
Bibliothèques NumPy et Pandas

  • Création et manipulation d’un tableau NumPy array.
  • Présentation des opérations matricielles et manipulation d'un NumPy array.
  • Création d’un indicateur statistique et opérations sur un NumPy array.
  • Introduction à la bibliothèque Pandas.
  • Chargement et première exploration d’un jeu de données.
  • Introduction au data cleaning.
  • Introduction au data processing.

3
Matplotlib, Plotly et Seaborn

  • Matplotlib, présentation des différents types de graphes.
  • Matplotlib, introduction à la personnalisation des graphiques.
  • Plotly, formation à tous types de graphiques interactifs et intégrables sur page Web.
  • Plotly, découverte et création de Widgets.
  • Seaborn, maîtrise de l'analyse des distributions.
  • Seaborn, mise en place de l'analyse statistique.
  • Seaborn, initiation à l'analyse multivariée.

4
Machine learning

  • Introduction à Scikit-learn.
  • Présentation des algorithmes classiques : Logistic Regression, KNN, SVM...
  • Techniques de bagging et boosting.
  • Modèles de classification non supervisée (K-Means, CAH, Mean Shift...).
  • Métriques d’évaluation pour le clustering.
  • Introduction à la régression linéaire simple et multiple.
  • Régression linéaire régularisée.

5
Machine learning avancé

  • Découverte des modèles ARIMA et SARIMA.
  • Analyse et décomposition d’un signal temporel.
  • Feature selection process.
  • Initiation aux analyses en composantes principales.
  • Application de l’approche Manifold Learning.
  • Apprendre à identifier des problématiques de détection d’anomalies.
  • Modèles supervisés : KNN, Local Outlier Factor.
  • Robust Covariance.
  • DBScan.

6
Machine learning appliqué

  • Introduction au langage web (HTML, CSS).
  • Extraction de contenu Web avec BeautifulSoup.
  • Application du scraping sur Google.
  • Sensibilisation aux problématiques d’utilisation de données sensibles.
  • Enjeux éthiques de l’IA.
  • Technique d’analyse des biais.
  • Interprétabilité des modèles avec SHAP.
  • Introduction aux expressions régulières.
  • Gestion de données textuelles.
  • Création d’un WordCloud.
  • Analyse de sentiments.

7
Modèles complexes

  • Introduction aux fonctionnement et enjeux des systèmes de recommandations.
  • Méthodes content-based et collaborative.
  • Mathématiques des systèmes de recommandation.
  • Mathématiques pour le Reinforcement Learning.
  • Application de la méthode de Monte-Carlo.
  • Découverte du Temporal Difference Learning.
  • Comparaison des learning : SARSA et Q-Learning.
  • Introduction à la théorie des graphes.
  • Application des algorithmes fondamentaux : Krustal et Dijkstra.
  • Détection de communautés.
  • Application de l’algorithme PageRank au classement de page Web.
  • Utilisation de NetworkX.

8
Fondamentaux du Deep learning

  • Théorie des réseaux de neurones.
  • Découverte du framework Keras.
  • Optimisation d’un réseau dense.
  • Analyse d’image par convolution.
  • Architecture LeNet.
  • Transfer Learning.
  • Optimisation avec TensorFlow.
  • Callbacks et modèles personnalisés.
  • TensorBoard.

9
Data Engineering

  • Savoir requêter une base de données grâce à SQL.
  • Comprendre les différents types de jointure et dans quel cas les utiliser.
  • Maîtriser les requêtes imbriquées.
  • Introduction au calcul distribué avec PySpark.
  • Présentation des API RDD et DataFrame de Spark.
  • Pipeline de processing de données distribuées.
  • Machine Learning distribué avec MLLib.
  • Introduction aux API.
  • Présentation des différentes méthodes HTTP et de leurs fonctions.
  • Utilisation de FastAPI pour développer des API RESTful.
  • Documentation d’une API avec la spécification OpenAPI.

10
De Linux au déploiement

  • Présentation des systèmes Linux.
  • Prise en main et utilisation d’un terminal.
  • Mise en place des scripts Bash.
  • Découverte des outils du CLoud avec AWS.
  • Préparation à la certification AWS Cloud Practitioner.
  • Présentation de l’architecture MLFlow.
  • MLFlow Tracking.
  • MLFlow Projects.
  • MLFlow Models.
  • MLFlow Registry.
  • Gestion du cycle de vie d’un projet de Machine Learning.

11
Intégration et déploiement continus

  • Introduction à la sécurité des APIs et des clés API (API Keys).
  • Maîtrise de l’authentification HTTP Basique.
  • Introduction aux JSON Web Token et HTTPS.
  • Introduction au système de contrôle de version Git.
  • Initialisation d’un dépôt Git.
  • Présentation des concepts Git : Branches, Tags, Merge.
  • Découverte de la plateforme Github.
  • Présentation des fonctionnalités majeures : Fork, Pull Request, Issues.
  • Utilisation des github actions.
  • Apprentissage des principales composantes du cloud avec AWS (EC2, CLI, IAM, Auto Scaling, VPC, Lambda...).
  • Préparation à la certification AWS Solution Architect.

12
DataOps

  • Présentation de la conteneurisation et de son utilité par rapport à la virtualisation.
  • Initiation au fonctionnement de Docker.
  • Manipulation des images et des conteneurs.
  • Communication avec les conteneurs.
  • Persistance des données grâce aux volumes.
  • Création d’une image Docker via Dockerfile.
  • Partage des images sur Dockerhub.
  • Utilisation de docker-compose.
  • Mise en place de tests unitaires avec Pytest.
  • Introduction aux tests d’intégration et leurs fonctions.
  • Présentation des avantages des tests.
  • Intégration des tests unitaires dans un environnement de développement.
  • Déployer et gérer des conteneurs.
  • Orchestrer plusieurs services et gérer les montées en charge.
  • Approfondissement des notions cloud AWS pour le MLOps with Amazon SageMaker.
  • Présentation des composantes secondaires d’AWS (Comprehend, Lex, Polly, Rekognition, Translate, Marketplace...).

13
Monitoring

  • Comprendre l’utilité du monitoring pour le MLOps.
  • Utilisation de Prometheus Query Language.
  • Création de Dashboard avec Grafana.
  • Intégration dans un environnement de production.
  • Monitorer une application de Machine Learning.
  • Intégrer un outil de monitoring à un environnement de production.
  • Comprendre l’écosystème Data en globalité.

14
Introduction au Data Product Management

  • Contexte du métier.
  • Historique.
  • Product vs Projet.
  • Les principales responsabilités.
  • Les professionnels avec lesquels le DPM interagit.
  • Les outils.
  • La terminologie d’un DPM en data science.
  • Comprendre un besoin.
  • Proposer une solution.
  • Monitorer la réussite de l’implémentation.
  • Et sans DPM ? Quelle alternative ?

15
Acculturation et Data Gouvernance

  • Métiers de la Data.
  • Gérer une équipe Data.
  • Définitions des termes les plus utilisés en Data.
  • Présentation des différentes sources et bases de données.
  • Stockage des données.
  • Gouvernance de la donnée.
  • Optimisation de l’exploitation d’une base de données relationnelles.
  • RGPD et Éthique dans la Data.
  • Anonymisation et pseudonymisation.

16
Chefferie de projet

  • Les enjeux d’un projet Data.
  • Les principaux modèles de gestion de projet.
  • La conduite du changement.
  • Introduction à la méthode agile.
  • Les différents outils et méthodes.
  • Application à la Data.
  • L’impact de l’agilité au sein d’une entreprise.
  • Product strategy.
  • Product discovery.
  • Product delivery.


Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.