Data Mining & Machine Learning

Réf. : DN-33398

Durée : 5 jours

Tarif : 3850,00 € HT

Objectifs • Contenu • Public • Pré-requis • Pédagogie • Devis

Introduction à la formation

De la donnée brute à l’intelligence opérationnelle-Data Mining & Machine Learning

À l’ère de l’intelligence artificielle généralisée, la donnée est devenue l’actif le plus précieux — et le plus complexe — des entreprises. Pourtant, posséder des données ne suffit plus : le véritable défi de 2026 réside dans la capacité à les transformer, les sécuriser et les faire parler.

La formation « Machine Learning : Fondations et Ingénierie » va bien au-delà d’une simple initiation théorique. Elle a été conçue pour les professionnels qui exigent une maîtrise concrète du cycle de vie de la donnée. Nous avons éliminé le superflu pour nous concentrer sur l’essentiel : l’ingénierie de précision.

Objectifs

A l’issue de la formation, vous serez capable de :

Maîtriser les piliers de l’apprentissage automatique
Concevoir des pipelines d’ingénierie de données
Mettre en œuvre des algorithmes prédictifs
Détecter des anomalies et des comportements atypiques
Évaluer la performance et la fiabilité
Industrialiser la démarche Data

Contenu de la formation

JOUR 1 : L’Écosystème Data 2026 & Python Scientifique

Panorama de la Data Science :
- Différences entre Data Mining, ML, Deep Learning et IA Générative.
Environnement de travail :
- Jupyter Lab, Google Colab et gestion des environnements virtuels.
La pile scientifique Python : * NumPy :
- Calcul matriciel et manipulation de Tensors.
Pandas :
- DataFrames, indexation et agrégation de données complexes.
Atelier :
- Audit et exploration d’un jeu de données hétérogène (Logs système ou données transactionnelles).

JOUR 2 : Data Wrangling & Feature Engineering

Qualité de la donnée :
- Gestion des valeurs manquantes, des doublons et des aberrations (Outliers).
Ingénierie des caractéristiques :
- Encodage des variables, normalisation, discrétisation.
Sélection de variables :
- Identifier les signaux les plus pertinents pour le modèle.
Atelier :
- Construction d’un pipeline de nettoyage automatisé et reproductible.

JOUR 3 : Apprentissage Supervisé : Prédiction & Classification

Algorithmes de Classification :
- Arbres de décision, Random Forest, SVM.
Algorithmes de Régression :
- Prédire des valeurs numériques continues.
Optimisation :
- Recherche d’hyper-paramètres (GridSearch, Optuna) pour maximiser les performances.
Atelier :
- Création d’un moteur de scoring pour la détection de risques.

JOUR 4 : Apprentissage Non-Supervisé & Détection d’Anomalies

Clustering :
- K-Means, DBSCAN (regrouper des données similaires).
Réduction de dimension :
- PCA (Analyse en Composantes Principales) pour visualiser les menaces.
Algorithmes de détection d’anomalies :
- Isolation Forest, Local Outlier Factor.
Atelier :
- Analyse d’un flux réseau pour isoler des comportements atypiques (Signaux faibles).

JOUR 5 : Évaluation, MLOps & Éthique de l’IA

Métriques de performance :
- Matrice de confusion, Courbe ROC, Précision vs Rappel.
Introduction au MLOps :
- Cycle de vie du modèle, versioning (DVC) et monitoring de la dérive (Drift).
Biais et Éthique :
- Détecter les biais algorithmiques et assurer la gouvernance des données.
Projet Final « Anomaly Hunt » :
- Challenge de synthèse intégrant l’ensemble du pipeline, du nettoyage à la détection finale d’anomalies.

Evaluation et fin de session

La session se clôture par une épreuve de validation des acquis (QCM post-TP) réalisée en environnement réel.La réussite de cet examen permet l’obtention de votre badge de certification DNDA.

Profil Formateur : Tristan P

cybersécurité et expert Python.
- Spécialiste du scripting sécurisé, il possède une maîtrise avancée de l’automatisation des processus au sein d’infrastructures critiques.Il apporte une vision « SecOps » indispensable à travers une expertise pratique éprouvée dans les environnements applicatifs et industriels (OT) de grande envergure.

Autres formations complémentaires

Pour construire votre parcours d’expertise, dndagency vous suggère les modules suivants :

Profil Formateur : Alban.V

Le module est animé par Alban V., praticien-formateur confirmé et Expert Data Scientist. Ingénieur spécialisé en intelligence artificielle, il met à profit sa solide expérience dans le déploiement de modèles prédictifs et sa maîtrise des architectures de données complexes. Son expertise pratique est éprouvée au sein d’environnements de haute précision et de systèmes industriels (OT), garantissant la mise en œuvre de modèles robustes et exploitables sur le terrain.

Public

Développeurs, Analystes métier,
Statisticiens,
Ingénieurs souhaitant pivoter vers la Data

Pré-requis

Connaissance de base de Python (obligatoire) et notions de statistiques

Méthodes pédagogiques

Approche 70/30 (Pratique Intensive)
Live Coding & Mentorat
- Sessions de programmation en direct avec nos consultants seniors. Vous apprenez les « bons réflexes » de structuration de code (Clean Code) appliqués à la Data Science.

Toutes nos formations sont disponibles en présentiel ou en distanciel.

Réf. : DN-33398

Durée : 5 jours

Tarif : 3850,00 € HT

Partager cette formation

Demande de devis

Prochaines sessions

Inter
Intra
Sur-mesure

Format	Paris – Lille
Durée	5 jours

Demande de devis

Format	Dans vos locaux ou à distance
Durée	5 jours
Prix	Nous contacter

Demande de devis

Vous souhaitez une formation sur-mesure ou vous disposez d’un cahier des charges ?

Nous contacter

13/07/2026

21/09/2026

02/11/2026

14/12/2026

*Sous réserve de maintien de la session
Sessions inter entreprises ouvertes à partir de 3 participants
Intra : base tarifaire pour un groupe de 3 personnes

Télécharger la fiche

Nouvelles formations

Nous contacter

Par Téléphone : 01 85 09 69 75
(Du lundi au vendredi, 9h-18h)

Par Email

Data Mining & Machine Learning

Introduction à la formation

Objectifs

Contenu de la formation

JOUR 1 : L’Écosystème Data 2026 & Python Scientifique

JOUR 2 : Data Wrangling & Feature Engineering

JOUR 3 : Apprentissage Supervisé : Prédiction & Classification

JOUR 4 : Apprentissage Non-Supervisé & Détection d’Anomalies

JOUR 5 : Évaluation, MLOps & Éthique de l’IA

Evaluation et fin de session

Autres formations complémentaires

Public

Pré-requis

Méthodes pédagogiques

Demande de devis

Prochaines sessions

Nouvelles formations

IA & Deep Learning pour la Cybersécurité

Architecturer et Développer une IA Souveraine : RAG et LLM locaux

GitHub Copilot et Assistants de Code : Propulser la productivité Dev

Chef de Projet IA : Cadrer, piloter et déployer un projet d’IA

Google Gemini : Maîtriser l’IA et le Prompt Engineering

Dernières actualités

Formation Cybersécurité et IA

Pourquoi et Comment Mettre en Place un PRA / PCA Cybersécurité

Formation FORTINET

Nous contacter

Nous suivre

Implantations & Contact

Informations Légales

Agrément Formation

Certifications