data mining et - ifgpe.fr€¦ · analyse procédurale hiérarchique problème d’association...

1
13 rue Molière , 75001 Paris , France Téléphone:+33(0) 1 42 60 10 55 Telécopie:+33 (0)1 42 60 10 50 www.ifgpe.fr Partenaires DATA MINING ET MACHINE LEARNING Pour qui? Ingénieurs, analystes, responsables marketing Data Analysts, Data Scientists, Data Steward Toute personne intéressée par les techniques de Data Mining et de Learning Machine Pré-requis Objectifs du cours Connaître l’utilité du Data Mining et les problématiques du Big Data dans le ciblage économique Détails de la formation L’accueil au centre en salle dédiée 15 minutes avant le début de la formation, petits déjeuners, boissons, pauses gourmandes Présentation du formateur et des participants Le support de cours format papier personnalisé La formation par un formateur expert La préparation intensive à l’examen de certification Le passage de la certification L’envoi des résultats par e-mail puis certificat officiel envoyé par courriel Les déjeuners complets Formation en français 1190 2 jours ifg-bi105 Programme Comprendre les différences entre apprentissage automatique supervisé, non supervisé et meta-ap- prentissage? Savoir transformer un gros volumes de données à priori hétérogène en information utile Maîtriser l’utilisation d’algorithmes d’auto-appren- tissage adaptés à une solution d’analyse Comprendre comment exploiter de gros volumes de données textuelles Être capable d’appliquer ces différentes techniques aux projets Big Data Régression logistique binaire GLM One-R (technique de règle unique de regroupement) Regroupement ID-3 Liste de décision Regroupement par régression d’arbres (CRT) Arbres aléatoires (CRT bootstrap) K plus proches voisins (K-NN) Classification bayésienne naïve Détections automatiques d’interactions par le chi-2 (CHAID) Analyse discriminante linéaire et quadratique (LDA/QDA) Réseaux de neurones Machine Learning Introduction Sélection d’instances Data Mining vs Big Data Data Mining vs Machine Learning vs Deep Learning Apprentissage supervisé vs Apprentissage non supervisé et méta-apprentissage Échantillonnage balancé Échantillonnage stratifié (probabilité non égales) Ingénierie de la décision Analyse procédurale hiérarchique Problème d’association stable (algorithme de Lloy Shaply) Chaîne de Markov discrète (DTMC) Jeu d’entraînement et jeu de test Data Mining (fouille de données) Analyse en composantes principales Analyse d’affinité Agglomération hiérarchique et dendrogrammes Bagging de dendrogrammes (bootstrop aggregating) Positionnement multidimensionnel K-means SVM (Support Vector Machines) ANOVA à un facteur fixe (ANOVA-1 canonique) désempilé ANOVA à deux facteurs fixes (ANOVA-2 canonique) sans répétitions avec ou sans interactions ANOVA à deux facteurs fixes (ANOVA-2 canonique) avec répétitions avec ou sans interactions Comparaisons multiples du test de Student avec correction de Bonferroni Test de (l’étendue) de Tukey HSD Test de Levene et Bartlett d’égalité des variances d’une ANOVA canonique ANOVA Imbriquée/Hiérarchique complète ANOVA Carré Latin ANCOVA (Analyse de la Covariance) MANOVA ACP (Analyses en Composantes Principales) paramétrique Analyse factorielle exploratoire (AFE) AFE avec méthode ACP sans rotation AFE avec méthode ACP et rotation VariMax Text Mining Une formation très pratique : 90% du temps de la formation est dédié à la mise en pratique pour une meilleure assimilation de notions de base Cette formation est basée sur des exercices principalement proposés par le formateur et tirés de l’ouvrage qui sert de support pour la formation Des consultants expérimentés partagent leur savoir-faire avec les participants. Les plus de cette formation Big Data Gestion de gros volumes de données

Upload: others

Post on 03-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DATA MINING ET - ifgpe.fr€¦ · Analyse procédurale hiérarchique Problème d’association stable (algorithme de Lloy Shaply) Chaîne de Markov discrète (DTMC) Jeu d’entraînement

13 rue Molière , 75001 Paris , FranceTéléphone:+33(0) 1 42 60 10 55

Telécopie:+33 (0)1 42 60 10 50

www.ifgpe.fr

Partenaires

DATA MINING ETMACHINE LEARNING

Pour qui?Ingénieurs, analystes, responsables marketingData Analysts, Data Scientists, Data StewardToute personne intéressée par les techniques de Data Mining et de Learning Machine

Pré-requis

Objectifs du cours

Connaître l’utilité du Data Mining et les problématiques du Big Data dans le ciblage économique

Détails de la formationL’accueil au centre en salle dédiée 15 minutes avant le début de la formation, petits déjeuners, boissons, pauses gourmandesPrésentation du formateur et des participantsLe support de cours format papier personnaliséLa formation par un formateur expertLa préparation intensive à l’examen de certi�cationLe passage de la certi�cationL’envoi des résultats par e-mail puis certi�cat o�ciel envoyé par courrielLes déjeuners completsFormation en français

11902 jours

ifg-bi105

Programme

Comprendre les di�érences entre apprentissage automatique supervisé, non supervisé et meta-ap-prentissage?Savoir transformer un gros volumes de données à priori hétérogène en information utileMaîtriser l’utilisation d’algorithmes d’auto-appren-tissage adaptés à une solution d’analyseComprendre comment exploiter de gros volumes de données textuellesÊtre capable d’appliquer ces di�érentes techniques aux projets Big Data

Régression logistique binaireGLMOne-R (technique de règle unique de regroupement)Regroupement ID-3Liste de décisionRegroupement par régression d’arbres (CRT)Arbres aléatoires (CRT bootstrap)K plus proches voisins (K-NN)Classi�cation bayésienne naïveDétections automatiques d’interactions par le chi-2 (CHAID)Analyse discriminante linéaire et quadratique (LDA/QDA)Réseaux de neurones

Machine Learning

Introduction

Sélection d’instances

Data Mining vs Big DataData Mining vs Machine Learning vs Deep LearningApprentissage supervisé vs Apprentissage non supervisé et méta-apprentissage

Échantillonnage balancéÉchantillonnage strati�é (probabilité non égales)

Ingénierie de la décisionAnalyse procédurale hiérarchiqueProblème d’association stable (algorithme de Lloy Shaply)Chaîne de Markov discrète (DTMC)Jeu d’entraînement et jeu de test

Data Mining (fouille de données)Analyse en composantes principalesAnalyse d’a�nitéAgglomération hiérarchique et dendrogrammesBagging de dendrogrammes (bootstrop aggregating)Positionnement multidimensionnel K-meansSVM (Support Vector Machines)

ANOVA à un facteur �xe (ANOVA-1 canonique) désempiléANOVA à deux facteurs �xes (ANOVA-2 canonique) sans répétitions avec ou sans interactionsANOVA à deux facteurs �xes (ANOVA-2 canonique) avec répétitions avec ou sans interactionsComparaisons multiples du test de Student avec correction de BonferroniTest de (l’étendue) de Tukey HSDTest de Levene et Bartlett d’égalité des variances d’une ANOVA canoniqueANOVA Imbriquée/Hiérarchique complèteANOVA Carré LatinANCOVA (Analyse de la Covariance)MANOVAACP (Analyses en Composantes Principales) paramétriqueAnalyse factorielle exploratoire (AFE)AFE avec méthode ACP sans rotationAFE avec méthode ACP et rotation VariMax

Text Mining

Une formation très pratique : 90% du temps de la formation est dédié à la mise en pratique pour une meilleure assimilation de notions de baseCette formation est basée sur des exercices principalement proposés par le formateur et tirés de l’ouvrage qui sert de support pour la formationDes consultants expérimentés partagent leur savoir-faire avec les participants.

Les plus de cette formation

Big DataGestion de gros volumes de données