analyse user generated content
DESCRIPTION
Solution to analize the User Generated Content. Solution d'analyse du contenu généré par les utilisateurs.TRANSCRIPT
Que se passe-t’il en une minute sur le web?
2
Bla Bla Bla
Les conversations représentent la
majorité du trafic
3
Analyser le langage naturel est une obligation!
•U don't got da jack but remember we got da
screenin 2mro at 8
•C vré ke C pa + facil ! G mi 2x + 2 tan a lir C 2
post en langaj SMS ke 2 posts ékri normleman
• Hexo x ti y xa ti, tú pones las reglas
• Sda7med ya 5ouya Ma chba3tech biiik allah
ghaleb...nchallah kol 3aam wenti 7ay b5iiir
4
analyse en temps réel des
communications digitales pour fournir de
l’information décisionnelle aux éditeurs de logiciels,
a g e n c e s m a r k e t i n g é d i t e u r s d e s e r v i c e s …
fonctionnement
Forums, blogs E-mails Instant Messaging
Notre Text Meaning Technology est capable d’analyser en temps réel
u n f l u x d e c o m m u n i c a t i o n s t e x t e s , d e d é t e c t e r l e s é l é m e n t s v o u s i n t é r e s s a n t e t d ’ a l e r t e r b o n n ela personne ou de déclencher l’action appropriée –
tout cela automatiquement
Réseaux sociaux
A proposhttp://scanandtarget.com/ - [email protected]
Solution française. 10 personnes.
créée en 2008 par:
� Bastien Hillen, CEO, ex DG Digiplug
� David Tilloy, CTO, ex Neocom Multimedia
� Ian Sprunck, COO, ex Neocom Multimedia et Telestore
(chez.com, ibazar…)
� Crédit Agricole Private Equity
� Truffle Capital
fonds levés depuis la création: 2,5M€ auprès
d’investisseurs comme:
Références
Contrairement aux solutions à base de sémantique ou de mots-clés,
notre technologie peut traiter les différentes variantes et altérations des expressions pour analyser le contenu comme :
La technologie
� Utilisation lettres majuscules / minuscules ;
� Répétition de lettres (vvviiiagrrra par exemple) ;
� Variantes orthographiques (vi@gra, vlagra, v1@gra, v149r4) ;
� Elision de lettres dans certains cas (v|agra, v agra…)
� Utilisation de symboles non alpha numériques (v.i.a.g.r.a, v_i°ag#r:a, v-
iagra, viagr"a...) ;
� Altérations phonétiques ;
� Inversion, omission (hilter, v_agra, etc.) ;
� Formes plurielles et conjuguées ;
� Langages SMS et chat (« a 2m1 », etc.) ;
� Arabizi / translitération .
Ainsi que la combinaison de chacun de ces formes
La technologie ttp://scanandtarget.com/ -
La solution est basée sur un moteur intelligent qui note non seulement
les mots pris individuellement mais également le contenu dans son
intégralité. Les termes sont ainsi remis dans leur contexte afin
d’extraire le sens du contenu
La solution utilise des thesauri thématiques : les Smart Wordbooks.
L’analyse se fait au niveau des concepts et non seulement sur des mots-clés
Grâce à un système puissant et précis d’analyse conditionnelle nos
clients bénéficient d’un très faible niveau de faux positifs
Concurrence
•Solutions à base de mots
clés
– problème de précision
(V1@gr@)
–Bcp de faux positifs
•Solutions sémantiques:
– Pas adaptées aux
conversations + forte
volumétrie + temps réel
–Implémentation longue
et complexe
Big Data? Pas de problème.
•La solution est disponible en SaaS ou sous forme
d’appliance à héberger chez vous (matériel IBM)
•Capacité à traiter en temps réel de très fortes
volumétries
–L’intégralité du trafic de Twitter (10 TB / jour, moyenne de 2000
Tweets par seconde)* peut être analysé en temps réel avec un IBM
blade center
–*Source - Twitter
Notre offre
APIs
Applications
Centre
Que pouvons-nous identifier pour vous?
Intention d’achat
plaintes D’accord / Pas d’accord
questions Perception de la marque
d’intérêt J’aime / J’aime pas
Déjà client?
Nos APIs
•Nos APIs peuvent être implémentées sur n’importe
–Disponible en PHP5.2+, Java1.4+, C#.NET 2.0+, Ruby…
•Simple à implémenter
–Entre quelques heures à 2 jours en moyenne
•Possibilité de récupérer le contenu sur les réseaux sociaux
•Nos APIs sont aujourd’hui disponibles en Anglais et en
–Bientôt en Espagnol, Portugais, Arabe…
quelle plate-forme en utilisant le connector
Français
Use case: Moderation API
LB Poker chat rooms monitoring
Alerts for human
Approved
Le contenu non conforme est passé de 15% à < 3%
–Détournement de trafic
–Insultes, vulgarité
–Triche
Modération full automatique
0
100000
200000
300000
400000
500000
600000
Sep-10 Oct-10 Nov-10 Dec-10 Jan-11 Feb-11
Refused
700000
•Customer: Pixmania
•Challenge: analyser en 5 langues les avis
consommateurs à des fins de:
–Modération automatique (environ 80%), 20% avis
litigieux revus par agents
–Identification des problématiques clients dans les avis
(produit incomplet problème de livraison…) et alerte
•Résultats: diminution des coûts de modération,
avis publiés plus rapidement, amélioration
relation client
du service concerné
Use case: analyse avis
consommateurs
Use case: Fan Page monitoring
Modération: jusqu’ 7K
posts / comments par jour
CRM : détection des
questions / pb liés à la
vente de tickets
Use case: social profiling
•Customer: client US pour le compte de Motorola
•Challenge: –65K messages de différentes sources (blogs, Facebook, Twitter),
fort besoin de NLP (exemple utilisation de Motorola Zoom au
lieu de Motorola Xoom)
–Identification des clients existants (avec le produit associé),
intntions d’cht (vc l produit ssocié) qustions
répondre
•Résultats: –98% élimination du bruit
–Environ 500 positive hits avec précision > 95%
Interface Oorook CRM
Votre distributeur
SARL Business-on-Line 68, bd Garibaldi
75015 Paris www.business-on-line.fr
www.business-on-line.typepad.fr
Cyril BLADIER [email protected]
@businesson_line
09.50.16.21.98 06.42.67.30.43