exl group - offre data science

19
1 Offre « Data Science » Fournir les moyens de valoriser les données de l’entreprise

Upload: ashraf-grioute

Post on 15-Apr-2017

702 views

Category:

Business


1 download

TRANSCRIPT

Page 1: EXL Group - Offre Data Science

1

Offre « Data Science »

Fournir les moyens de valoriser les données de l’entreprise

Page 2: EXL Group - Offre Data Science

2

1. Présentation EXL Group

2. Le Big Data en bref

3. Quelques projets Big Data

4. Notre vision Data Science

5. Notre offre

6. Nos références

EXL GROUP - Tout droits réservés

Page 3: EXL Group - Offre Data Science

3

Présentation EXL Group

1.1 EXL Group : un groupe aux expertises multiples

300collaborateurs

5 agences régionales

Un multi-spécialiste du système d’Informations, créé en 2008

(M€)

2011

13,5

2012

21

2013

28

34

2014

150Comptes actifs

EXL GROUP - Tout droits réservés

Page 4: EXL Group - Offre Data Science

4

Le Big Data en bref

2.1 De nouveaux moyens pour valoriser vos données

Des données internes/externes, structurée/non structurées

Variété

Volume

Vitesse

Une offre logicielle vaste et innovante, Open source/acteurs BI historiques

De nouveaux besoins métier

EXL GROUP - Tout droits réservés

Page 5: EXL Group - Offre Data Science

5

Le Big Data en bref

2.2 Une évolution apportée sur 3 axes majeurs

Données : Enrichissement des données exploitées

Stockage : Optimisation des processus et traitements existants, réduction des coûts

Analyse : Fiabilisation et amélioration des indicateurs calculés et des modèles développés

Structurées et homogènes Sources internes Volumétrie contrôlée

Non structurées et hétérogènes Sources externes Volumétrie scalable

BI Classique Big Data

Entrepôt de données (Datawarehouse) Serveurs physiques internes Modélisation en étoile ou en flocon

Statistiques descriptives Requêtage par ligne/individu Algorithmes prédictifs développés par

des « Data Analyst »

Distribué sur un cluster Hadoop (HDFS) Cloud computing Traitement parallèle : MapReduce

Statistiques inférentielles Requêtage par colonne/objet Nouveaux algorithmes développés par des

« Data Scientist »

EXL GROUP - Tout droits réservés

Page 6: EXL Group - Offre Data Science

6

Le Big Data en bref

2.3 Traiter diverses problématiques à travers la Data Science

Marketing Contrôle DSI

Energie

Données de compteurs nouvelle génération et facteurs climatiques

pour prédire les consommations en temps réel

Données de réseaux sociaux afin de prévoir les pics de

consommation évènementiels

Bénéficier du calcul distribué pour optimiser les temps de traitement

TransportsDonnées de capteurs, bornes Wifi et traces GSM pour une meilleure

connaissance du trafic

Données vidéo pour la lutte contre la fraude

Réduire les coûts en stockant sur une même plateforme tous types

de données

Banques & Assurances

Un meilleur profiling des clients : fidélisation et rétention via

l’analyse des retours clients (sms, mails, forums, …)

Analyser les comportement clientssur le net afin d’identifier les

risques de Fraude, découverts, …

Requêter et traiter rapidement des volumes importants de données

transactionnelles

Télécom

Données des réseaux sociauxpour proposer aux clients de

nouvelles offres optimales : one to one marketing

Analyser et mettre à jour les données CRM en temps réel

Ces exemples ne représentent pas une liste exhaustive. L’imagination est le plus

grand incubateur de projets Big Data !!

EXL GROUP - Tout droits réservés

Page 7: EXL Group - Offre Data Science

7

Quelques projets Big Data

3.1 BANQUE ASSURANCE : Crédit Mutuel ARKEA

• Lutte anti-blanchiment : 6 mois d'historique traité en moins de 20 secondes

• Ratios de solvabilité : le traitement prenait 48 Heures sur un échantillon de clients

Résultat sur toute la base, en moins de 15 minutes

• Analyse des zones de saisie libre dans les formulaires

• Prospection ciblée : l’analyse des logs, parcours web … croisée avec la détention

Assurer la promotion des produits / services vers les bons prospects

• Banque de détail : usuellement l'historique des comptes était de 3 à 5 mois

Historique pour tous les clients depuis mai 2001 (des milliards de données)

EXL GROUP - Tout droits réservés

Page 8: EXL Group - Offre Data Science

8

Quelques projets Big Data

3.2 TRANSPORT et LOGISTIQUE : Port d’Hambourg

• Des ponts mobiles adaptés au trafic : l’ouverture des ponts dépendait d’un

calendrier fixe inadapté au trafic réel

Ouverture uniquement lorsque les navires passent

• Identification des défauts ou des pannes : la réparation rapide ou même

préventive permet d’éviter le ralentissement de l'activité

• Police et douane : le poids des charges prévu comparé au réel permet de

détecter le transport de marchandises illégales

• Service aux utilisateurs : les données de localisation permettent d’informer les

utilisateurs des retards, des espaces de stationnement disponibles …

EXL GROUP - Tout droits réservés

Page 9: EXL Group - Offre Data Science

9

Quelques projets Big Data

3.3 Ils ont également fait appel au Big Data

• Energie : Les compteurs Linky

Des compteurs nouvelle génération avec des relevés de consommation

réelle transmis toutes les 15 minutes

Des courbes de charge actualisées en quasi-temps réel

Optimisation des coûts et des volumes achetés par rapport au consommé

• Loisirs et Multimédia :

La plateforme de vidéos en continu « Netflix » a développé un algorithme

prédictif pour suggérer aux utilisateurs des films et séries adaptées

Lors de la coupe du monde 2014, l’équipe nationale d’Allemagne a placé

des capteurs sur ses joueurs afin d’optimiser leur entraînement

EXL GROUP - Tout droits réservés

Page 10: EXL Group - Offre Data Science

10

Notre vision Data Science4.1 Enrichir le patrimoine de données existant

Exploiter de nouveaux types de données internes/externes, structurées/non structurées

Réseaux sociaux

Média

Objets / capteurs connectés

Mails

Pages Web

Opendata

Pourquoi ?

•Contrôler les données en

téléchargement libre

•Maîtriser la communication

externe à l’entreprise

•Améliorer les indicateurs et

modèles existants : scoring,

détection de fraude, …

•Optimiser ses offres : one-to-

one marketing, profiling

temps réel, …

Comment ?

• Identifier et contractualiser :

Réseaux sociaux, start-up,

data brokers, opérateurs

mobiles …

•Qualifier : statistiques

descriptives ou inférentielles,

corrélations, valeurs

aberrantes, panels, …

• Stocker : identifier scénarios

pour un stockage industriel

(Hadoop, serveur classique,

Cloud, …)

EXL GROUP - Tout droits réservés

Page 11: EXL Group - Offre Data Science

11

Notre vision Data Science4.2 Scalabilité et temps réel

Bénéficier de la force d’une architecture Big Data, via sa capacité à allier le stockage physiqueparallèle des données à leur traitement parallèle en mémoire

Pourquoi ?

• Etre indépendant du volume

et de la structure des

données

•Calculer des indicateurs en

temps réel

•Réduire les temps de

requêtes et de traitement de

données volumineuses :

transactions fines, historique

important …

•Mutualiser les coûts de

stockage et d’exploitation

Comment ?

• Identifier l’apport du

MapReduce : algorithmes et

traitements à paralléliser

•Définir les fréquences

souhaitées et réalisables de

rafraîchissement des

indicateurs

• Lister des applications

pouvant être mutualisées

Cluster Hadoop

EXL GROUP - Tout droits réservés

Page 12: EXL Group - Offre Data Science

12

Notre vision Data Science4.3 De nouveaux moyens pour explorer et analyser la donnée

Une offre logicielle Open source ou fournie par les éditeurs historiques, pour développer depuissants algorithmes

Pourquoi ?

•Algorithmes classiques Data

mining : Adaptation et

optimisation

•Machine learning : des

algorithmes puissants

adaptés au calcul distribué

•Nouveaux algorithmes : pour

de nouveaux types de

données

Comment ?

•Classification descriptive :

ACP, ACM, ACF, CAH, K-

means, Kohonen, …

• Prévision : ARIMA, lissage

exponentiel, régression

logistique et linéaire

•Machine learning : réseaux de

neurone (perceptron),

Bootstrap, algorithmes

génétiques, …

•Optimisation combinatoire,

théorie des graphes

•Analyse de sentiments (SNA),

web analytics, texte mining,

taxonomie automatisée, …

EXL GROUP - Tout droits réservés

Page 13: EXL Group - Offre Data Science

13

Notre vision Data Science4.4 Une approche innovante orientée métier

Au travers de son offre Data Science, EXL GROUP vous accompagne dans

l’exploitation et la valorisation de vos données via le déploiement de projets Big Data

d’un point de vue métier :

Le Big Data ne se restreint pas à l’exploitation de gros volumes de données ou

à une plateforme Hadoop

Identifier des traitements et modèles à optimiser grâce au Big Data

Faire évoluer des projets existants en projets Big Data

Mettre en place de nouveaux algorithmes efficaces, exploitables en mode

industriel

Mettre à disposition des profils alliant des compétences en : mathématiques

appliquées, programmation et technologies Hadoop

EXL GROUP - Tout droits réservés

Page 14: EXL Group - Offre Data Science

14

Notre offre

5.1 Des connaissances mathématiques associées à une expertise technique

R, SAS, SPSS, Python

MapReduce

Java, C++, …

Algorithmique Programmation

EXL group vous accompagne lors de vos projets Big Data avec des équipes de

« Data Scientists » alliant l’expertise technique aux connaissances

mathématiques, dans un écosystème Hadoop

Classification, Prévision, Machine

learning, Optimisation combinatoire,

Théorie des graphes, Analyse de

sentiments, Web analytics, Taxonomie

automatisée, Analyse sémantique, Text

mining, …

Hadoop

Statistiques : Spark, Mahout, RHadoop

Requêteurs : Hive, Impala, Pig, Sqoop

Bases NoSQL : HBase, Cassandra,MongoDB, Oracle NoSQL, …

EXL GROUP - Tout droits réservés

Page 15: EXL Group - Offre Data Science

15

Notre offre

5.2 Une démarche projet en mode itératif

Initier une démarche Big Data

Assistance à la mise en œuvre

Déploiement et formation

• Disposez-vous de données

suffisantes pour couvrir tout

votre périmètre d’analyse ?

• Quels sont les processus et

modèles existants

susceptibles d’être optimisés

?

• Quelles sont les applications

pouvant être mutualisées

grâce à une infrastructure

Big Data ?

• Quelles données pour

enrichir votre patrimoine et

comment les récolter ?

• Comment exploiter, qualifier

et maîtriser ses données ?

• Quelle est la meilleure

solution pour explorer et

restituer les résultats ?

• Comment industrialiser la

récolte de données ?

• Quels algorithmes peuvent

être déployés ?

• Quels utilisateurs à former et

sur quel périmètre ?

EXL GROUP vous accompagne pour valoriser vos données, identifier de nouvelles sources et lesexploiter via la mise en place d’algorithmes performants dans une démarche itérative :

EXL GROUP - Tout droits réservés

Pilotage de projet

Page 16: EXL Group - Offre Data Science

16

Notre offre

5.3 Initier une démarche Big Data

Initier une démarcheAssistance à la mise

en œuvre

Déploiement et formation

• Identification du potentiel Big Data dans l’entreprise

•Cadrage d’un projet BigData identifié

De 1 à 5 ateliers, selon le

niveau de maturité du

besoin, avec les thèmes :

•Prise de contexte et

présentation Data Science

•Processus métier

•Architecture SI

•Datamining

• Focus sur un ou plusieurs

projets

•Compte-rendu des différents ateliers

•Note de cadrage

EXL GROUP - Tout droits réservés

Pilotage de projet

Missions Déroulement Livrables type

Page 17: EXL Group - Offre Data Science

17

Notre offre

5.4 Assistance à la mise en œuvre

Initier une démarcheAssistance à la mise

en œuvre

Déploiement et formation

•Collecte et qualification de nouvelles sources

•Réalisation de POC

•Préparation de Hackathon

•Benchmark de solutions

•Benchmark de modèles

Collecte :

•Contractualisation de

fournisseurs

•Définition de la solution

• Suivi et qualification des

résultats : statistiques,

restitutions, …

POC et Hackathon :

•Définition du périmètre et de

jeux de données anonymisés

•Comparaison des résultats

Benchmarks :

•Modélisation

•Programmation sous R, SAS, …

•Rapports : potentiel des données, comparaison avec l’existant, …

•Datavisualisation

•Spécifications fonctionnelles

•Programmes développés

EXL GROUP - Tout droits réservés

Pilotage de projet

Missions Déroulement Livrables type

Page 18: EXL Group - Offre Data Science

18

Notre offre

5.5 Déploiement, formation et pilotage

Initier une démarcheAssistance à la mise

en œuvre

Déploiement et formation

• Industrialisation de la

collecte de données

• Industrialisation

d’algorithmes prédictifs

•Conduite du changement

• Formation des utilisateurs

•Assistance des directions

métiers et SI dans le suivi

et la gouvernance

•Développement et sélection d’algorithme

•Cadrage de la solution industrielle

•Définition de la stratégie de déploiement

•Assurer l’autonomie des utilisateurs

•Documentation des modèles

•Cahier des charges

•Stratégie et plan de formation

•Supports de formation

•Supports et compte-rendu d’instances projet

EXL GROUP - Tout droits réservés

Pilotage de projet

Missions Déroulement Livrables type

Page 19: EXL Group - Offre Data Science

19

Nos références

6.1 Nos références Data Science

CAP’TN : Qualification, restitution et industrialisation de la récolte de données issues de capteurs

innovants et d’objets connectés.

COMOB : Accompagnement AMOA pour la récolte de données et la définition d’une solution

industrielle cible sur un cluster Hadoop (Distribution Hortonworks), dans le cadre de la mise en place

d’un outil de data visualisation et pilotage temps-réel.

POC : Accompagnement de la DSI de l’infrastructure pour le POC d’un projet Big Data en

partenariat avec la direction de l’innovation (stockage et traitement de photographies des voies aucentimètre près prises par un train à chaque passage – solution MAP-R).

Portail Culture Versailles : projet de recherche fédérée parmi 1 million de fiches provenant de SI

différents (Bibliothèque, Musée, Archives et site portail)http://versailles.demo4u.net

ONISEP : Assistance à maitrise d’ouvrage pour un projet de création d’un entrepôt de données

sémantique (Web Sémantique)

PRESSTALIS : Réalisation d’une base de connaissance

EXL GROUP : Réalisation d’un Wiki avec une recherche instantanée

Open Data : Conception d’une application d’exposition de la donnée en open data

EXL GROUP - Tout droits réservés