cuándo usar las diferentes herramientas de analítica de texto - meaningcloud
Post on 12-Apr-2017
305 Views
Preview:
TRANSCRIPT
Herramientas de Analítica
de Texto: cuándo y cómo
usarlas
7 febrero 2017
Webinar
Herramientas de Analítica de Texto
Antes de empezar
Ponente
Cómo vamos a funcionar
• Enviar preguntas de texto a través del chat
• “Levanta la mano” para hablar y abriremos tu micro
• Publicaremos enlace a webinar grabado
y contenidos como tutoriales en blog
Antonio Matarranz
CMO
Herramientas de Analítica de Texto
El propósito de este webinar…
Aprender cuáles son las
principales funciones de la
Analítica de Texto y para
qué nos pueden servir
Herramientas de Analítica de Texto
Agenda
Introducción a la analítica de texto
Escenarios de aplicación de la analítica de texto.
Beneficios y retos
Funciones de analítica de texto. Descripción y casos
de uso
Calidad de las herramientas de analítica de texto
Un vistazo al roadmap de MeaningCloud
Conclusiones y preguntas
Herramientas de Analítica de Texto
¿Por qué deberíamos usar analítica de texto?
Datos estructurados
Contenido
no estructurado
Herramientas de Analítica de Texto
OpinionesTemasHechos
Conceptos
Organizaciones
Personas
Análisis
Semántico
Relaciones
Analítica de texto
Extrae significado e insights actuables del contenido no estructurado
Automatización de costosas actividades manuales
Herramientas de Analítica de Texto
Funciones de analítica de texto
Extracción de
información, NER
Categorización
Clustering
Análisis de
sentimiento
Análisis morfosintáctico
…
Herramientas de Analítica de Texto
ESCENARIOS DE APLICACIÓN
Herramientas de Analítica de Texto
Análisis de medios sociales
Gestión de contenido generado por usuarios
Seguridad y defensa
Reto: lenguaje informal
Entender la conversación en redes sociales, blogs, foros…
Monitorización de marca, reputación
Señales, viaje del cliente, intención, leads sociales
Perfilado de usuarios
Herramientas de Analítica de Texto
Voz del Cliente (VoC) / Experiencia del Cliente
Extiende tu visión del cliente
hacia fuentes de datos nuevas y
no tradicionales: comentarios en
encuestas, interacciones en el
contact center, conversaciones
sociales…
Demographic data
CRM / Mktng.automation
Contact Center interactions
Devices
Product use
Navigation
Social
360º vision
Orders and Payments
Las fuentes no solicitadas y no
estructuradas contribuyen a crear
una visión integrada de 360º de
los clientes
La visión integrada del cliente
ayuda a proporcionar
experiencias personalizadas,
consistentes, específicas del
contexto y relevantes
Herramientas de Analítica de Texto
Voz del Ciudadano / Votante
Análisis de opiniones sociales y segmentación que permiten
entender las actitudes y los comportamientos de los ciudadanos
Perfilado de ciudadanos. Opiniones y tendencias sobre la situación política, el gobierno y sus
servicios
Detección y gestión del ciclo de vida de emergencias
Herramientas de Analítica de Texto
Voz del Empleado / People Analytics
LeadersRegular
ArmyGeeks
Mejorar la comprensión de nuestros empleados
Análisis de encuestas, evaluaciones de desempeño, entrevistas de salida, CVs, comunicaciones
Actitudes/habilidades/comportamientos más habituales entre los mejores empleados
Gestión de talento y retención de empleados eficaz
Herramientas de Analítica de Texto
Análisis semántico de contenidos para una mejor explotación y relación
Mejor comprensión y uso del archivo. Generación de contenidos de alto valor
Mayor engagement de la audiencia gracias a la personalización, recomendación y
contenidos tópicos
Nuevas vías de monetización: publicidad enfocada, distribución y sindicación
Moderación y comprensión del contenido generado por los usuarios
Contenidos inteligentes (medios, editoriales)
Herramientas de Analítica de Texto
Para sectores y departamentos intensivos en conocimiento
Sacar partido del conocimiento tácito oculto en los repositorios de
documentos
Etiquetado semántico y análisis de los documentos para una recuperación y
explotación avanzada
Gestión de conocimiento
Herramientas de Analítica de Texto
E-discovery y cumplimiento normativo
Análisis de documentos y comunicaciones electrónicas para descubrir
evidencias
Procedimientos legales, sectores regulados (ej., servicios financieros)
Fuentes: documentos, transcripción de llamadas telefónicas, email, chat, social…
La baja latencia permite la prevención de comportamientos criminales y una rápida
respuesta
Herramientas de Analítica de Texto
FUNCIONES DE ANALÍTICA DE
TEXTO
Herramientas de Analítica de Texto
MeaningCloud: “Meaning as a Service”
(SaaS y on-premises)
Regístrate y úsalo GRATIS en
http://www.meaningcloud.com
Herramientas de Analítica de Texto
APIs MeaningCloud
Identifica apariciones de
nombres de personas,
organizaciones…, conceptos
abstractos, cantidades, etc.
Clasifica por temas
según taxonomías
predefinidas
Identifica polaridad
general y por atributos
Identifica el lenguaje de
entre un conjunto de 60
Análisis morfosintáctico detallado Evalúa el impacto de opinión
sobre varios ejes
reputacionales
Descubre temas significativos y
similitudes entre textos, sin
partir de taxonomías
predefinidas
Herramientas de Analítica de Texto
Add-in para Excel
Totalmente integrado en experiencia Excel
Fácil de usar - ¡sin programar!
La manera más sencilla de evaluar, prototipar y usar MeaningCloud
19
Herramientas de Analítica de Texto
Topic Extraction API
Disambigua apariciones de marcas, empresas, organizaciones, personas,
conceptos… y mucho más
Desambiguación contextual
• Apple = empresa (no fruta)
Correferencia
Basado en ontología estándar
Diccionarios extensibles/personalizables
En una comunicación a la SEC hoy, Apple reveló que el CEO Tim Cook ha donado el equivalente a aproximadamente $ 6,5 millones en acciones de Apple a la caridad esta semana. Desde que se convirtió en CEO en 2011, Cook ha promovido la caridad como una parte clave de la misión de Apple. Al asumir el cargo, Cook inició un programa de caridad para empleados. Apple también ha ampliado sus ofertas para que los empleados ayuden a sus comunidades.
Topic
detectado
Información semántica
Tim Cook Persona, Timothy Donald Cook,
Ejecutivo en Apple Inc.
Apple Empresa, Apple Inc., Tecnología, USA
SEC Organización, Securities and
Exchange Comission, Gobierno, USA
$6.5
millones
Cantidad monetaria, USD, 6.5
millones
caridad Concepto, caridad
Herramientas de Analítica de Texto
MeaningCloud: ontología estándar
Ontología incorporada
437 nodos
78 temas
250,000+ lemas/idioma
Actualizada continuamente
https://www.meaningcloud.com/developer/
documentation/ontology
Herramientas de Analítica de Texto
¿Para qué sirve la extracción de topics?
Detección sofisticada de apariciones/menciones de marcas, personas,
empresas, conceptos…
• Desambiguando en función del contexto
• Teniendo en cuenta variantes
• Correferencia
Ejemplos de aplicaciones:
• Extracción de palabras clave
• Anotación de documentos: noticias, libros, emails, expedientes
• Monitorización de medios sociales
• Análisis de la Voz del Cliente / Empleado / Ciudadano / Paciente
• Perfilado (intereses) de usuarios
Herramientas de Analítica de Texto
Text Classification API (incluye modelos estándar, ej. IAB)
Mezcla aprendizaje automático y reglas para clasificar textos con exactitud
según categorías predefinidas
La Copa del Mundo es la mejor manera de ver el
potencial que el fútbol puede tener para el turismo de
entrada, el éxito económico y la imagen pública
positiva:
La Copa del Mundo 2006 en Alemania fue un
excelente ejemplo de este poder con: $ 200 + por día
de gasto turístico promedio, 50.000 nuevos puestos
de trabajo creados, 18 millones de personas en Fan-
Fests, el total de la audiencia mundial de televisión en
30 mil millones y 4,2 mil millones de vistas oficiales de
páginas web. En una encuesta, el 90% de los
extranjeros que visitaron la Copa Mundial dijeron que
se sentían bienvenidos allí y recomendarían a
Alemania como destino de vacaciones. "La Copa del
Mundo marca un enorme aumento en la imagen de
Alemania, incluso si es difícil poner una cifra
económica en este cambio de imagen, la economía
en su conjunto se beneficiará sin duda de ella". Dijo el
ministro de Economía alemán, Michael Glos.
Categorías Relevancia
Deportes – Fútbol mundial 0.7
Viajes – Europa 0.2
Artes & Entretenimiento – Televisión 0.3
IAB (Spanish)
Tecnología híbrida
• Aprendizaje automático y/o reglas
Incluye modelos de clasificación estándar
• IPTC (noticias), IAB (publicidad), EuroVoc
(administración pública), Medios Sociales,
Reputación de Negocios
Modelos de clasificación personalizables
Herramientas de Analítica de Texto
MeaningCloud: modelos de clasificación estándar
Incluye soporte a modelos de
clasificación predefinidos
estándar
IPTC: noticias
IAB: publicidad enfocada
EuroVoc: administración
pública
Business Reputation:
reputación corporativa
Social Media: conversaciones
sociales
… y más en preparación https://www.meaningcloud.com/developer/documentation/supported-models
Herramientas de Analítica de Texto
Tecnologías de clasificación
Los clasificadores trabajan sobre patrones/vectores que representan
a cada categoría
Tecnologías para generar estas representaciones
• Estadística
• Basada en reglas
Documentos
ejemplo para
categoría
Aprendizaje
automático
Reglas para
categoría
Codificador
de reglas
Regla 1
Regla 2
Regla 3
Regla 4
Representación
de la categoría
Representación
de la categoría
Herramientas de Analítica de Texto
¿Para qué sirve la clasificación?
Categorización “temática”: la categoría se infiere del conjunto del contenido
• Texto similar a otros que pertenecen a la categoría
• Texto que cumple ciertas reglas
• En general no es necesario que un
cierto término aparezca explícitamente
Ejemplos de aplicaciones:
• Anotación de documentos: noticias, libros, emails, expedientes
• Análisis de la Voz del Cliente / Empleado / Ciudadano / Paciente
• Análisis de la conversación en medios sociales
• Perfilado (intereses) de usuarios
Herramientas de Analítica de Texto
Text Clustering API
Agrupa textos smilares y descubre temas significativos
27
Crisis financiera
Efecto invernadero
No requiere taxonomías predefinidas
(aprendizaje no supervisado)
Procesamiento específico de texto
Agrupamiento de textos basado en
• Adherencia a un tema
• Similaridad de contenidos
Título cluster Tam. Score Lista documentos
Crisis
financiera
4 0.96 Doc1, Doc4, Doc7,
Doc8
Efecto
invernadero
5 0.34 Doc2, Doc3, Doc5,
Doc6, Doc9
Herramientas de Analítica de Texto
¿Para qué sirve el clustering de texto?
Agrupación de textos similares y descubrimiento de temas significativos
• Sin partir de taxonomías predefinidas
Ejemplos de aplicaciones:
• Detección de duplicados
• Descubrimiento de estructura en colecciones
de documentos
• Descubrimiento de temas de conversación
en medios sociales
• Descubrimiento de la “nueva voz” del Cliente /
Empleado / Ciudadano / Paciente
Herramientas de Analítica de Texto
Sentiment Analysis API
Asigna una polaridad multinivel a entidades y otros aspectos, discrimina
hechos de opiniones y detecta la ironía
Aspect Sentiment
Hotel Excelsior - paisajes P+
Hotel Excelsior - habitaciones N-
General NEU, DESACUERDO
SUBJETIVO, NO IRÓNICO
Scoring con 5 niveles de polaridad (más ausiencia de polaridad)
Análisis basado en aspectos
Discriminación objetivo (hecho) / subjetivo (opinión)
Detección de ironía (beta)
Modelos de sentimiento personalizables
El Hotel Excelsior tiene los paisajes
más increíbles que he visto, pero las
habitaciones son horrendas.
Herramientas de Analítica de Texto
¿Para qué sirve el análisis de sentimiento?
Análisis y minería de opiniones (polaridad)
• General y detallada a nivel de atributo/aspecto
• Discriminando opiniones de hechos
Ejemplos de aplicaciones:
• Monitorización de medios sociales
• Análisis de la Voz del Cliente / Empleado / Ciudadano / Paciente
Herramientas de Analítica de Texto
Lemmatization, PoS and Parsing API
Análisis morfosintáctico y semántico detallado
Análisis sintáctico
Lematización
Etiquetado gramatical
Relaciones
CItas
Topics: entidades, conceptos, etc.
Análisis de sentimiento
Herramientas de Analítica de Texto
¿Para qué sirve el análisis morfosintáctico?
Análisis de la estructura profunda de un texto
• Morfológica, gramatical y semántica
Ejemplos de aplicaciones:
• Revisión de textos: morfológica,
gramatical y de estilo
• Soporte a detección de
relaciones semánticas,
p. ej., “EmpresaX ha invertido
en EmpresaY”
• En el caso de MeaningCloud,
aplicaciones de Topics
Extraction y Sentiment Analysis
Úsalo gratis en www.mystilus.com
Herramientas de Analítica de Texto
Corporate Reputation API
Combina Extracción de Topics, Clasificación y Análisis de Sentimiento para
evaluar el impacto de las opiniones según un modelo de ejes y variables
reputacionales
Los beneficios de Telefónica han aumentado.
Igualmente, Vodafone ha lanzado nuevos
productos con éxito
Entidad Variable reputacional Sentim.
Telefónica,
empresa telco
Situación financiera -
Resultados financieros +
Vodafone,
empresa telco
Innovación y flexibilidad -
Innovación +
7 ejes reputacionales
• 24 variables reputacionales
Herramientas de Analítica de Texto
¿Para qué sirve el etiquetado reputacional?
Análisis de impacto de opiniones
según ejes y variables
reputacionales estándar
Ejemplos de aplicaciones:
• Análisis de medios sociales
• Seguimiento de medios
• Análisis de la Voz del Cliente /
Empleado / Ciudadano / Paciente
Herramientas de Analítica de Texto
User Profiling API
Usa el perfil y el contenido generado por el usuario para inferir sus atributos
demográficos y psicográficos
20% of companies say process digitization
yields actionable #analytics
Is your IT team talking SMAC (#social,
#mobile, #analytics, & #cloud)?
Five Rules of Modern Icon Design
http://bit.ly/1y3B6i6
What Twitter Can Be.
http://wp.me/p2Gq8C-6E Just if they'd play
nice with the ecosystem ... #socialtv
#recommendation
What your name says about your age,
where you live, your politics & your job
http://wapo.st/1RkqDcA
Londoner, hooked on data science, NLP
and REST.
Social posts
Social profile
Atributo Valor
Persona/Organización Persona
Género Hombre
Edad 25-35
Ubicación Londres
Ocupación Ingeniero
Marcas IBM
Demográfico
Persona / Organización
Género
Edad
Ubicación
Ocupación
Psicográfico
Afinidades
Estilo de vida…
Herramientas de Analítica de Texto
¿Para qué sirve el perfilado de usuarios?
Perfilado demográfico y psicográfico de
usuarios
Ejemplos de aplicaciones:
• Comprensión y segmentación de audiencia/
mercado
• Análisis de comunidades en medios sociales
• Marketing basado en influenciadores
Herramientas de Analítica de Texto
¿ES TODO UNA CUESTIÓN DE
PRECISIÓN?
Herramientas de Analítica de Texto
¿Qué precisión tiene todo esto?
La precisión es “relativa”
Las personas no tenemos una precisión del 100%
• Tests con analistas humanos: acuerdo 85-95%
Además de precisión, cobertura (recall)
Alta precisión
Alta cobertura
Alta precisión
Baja cobertura
Baja precisión
Alta cobertura
Identificado por algoritmo
Herramientas de Analítica de Texto
Exactitud: precisión y cobertura
Precisión y cobertura están
inversamente relacionadas
• Buscar compromiso
Los requisitos dependen de la aplicación
• Monitorización de marca en medios sociales: alta precisión, baja cobertura
• Lucha antiterrorista: alta cobertura, baja precisión
Herramientas de Analítica de Texto
Opiniones
La frase “¡Tiene el tipo
de interés más alto del
mercado!” es…
Positiva, si habla de
depósitos
Negativa, si habla de
hipotecas
Recursos lingüísticos específicos mejoran exactitud
Menciones
Nombres de bancos y
entidades financieras, p.
ej.: Santander, BBVA
Nombres de productos,
p. ej.: Cuenta Naranja,
Libreta Estrella…
Temas
Ejemplo: análisis de las opiniones de clientes de un banco
Productos
Pasivo
Cuenta
Depósito
Activo
Crédito
Hipoteca
Canal
Oficina
Teléfono
Internet
Herramientas de Analítica de Texto
Herramientas de personalización de MeaningCloud
Herramientas de Analítica de Texto
Herramientas de personalización
Crea tus propios diccionarios, modelos de
clasificación y análisis de sentimiento
Interfaz gráfica de usuario - ¡sin programar!
Mejorar precisión y cobertura
Aprende más sobre personalización en este webinar
Herramientas de Analítica de Texto
Una vista hacia el futuro
Roadmap MeaningCloud
Extension para RapidMiner: combina la analítica de datos y texto
Nuevos idiomas: ruso, chino, árabe… y muchos más
Nuevas APIs: Summarization, Parts of Document
Vertical Packs: VoC (general y diversos sectores), VoE, Health
Insight Extractor: un categorizador y extractor de información granular basado
en reglas semánticas
Q1 2027 Q2 2017 Q3 2017 Q4 2017 Q1 2018
Extension para
RapidMiner Insight Extractor
Idiomas adicionales
Summarization API,
Parts of Document API Industry Packs
Herramientas de Analítica de Texto
En conclusión
Herramientas que convierten
el texto en insights Innumerables aplicaciones
Exactitud = personalización MeaningCloud: especialistas
en analítica de texto
Herramientas de Analítica de Texto
Turno de Preguntas
Herramientas de Analítica de Texto
Permaneced atentos a nuestros emails y blog
Pronto publicaremos la grabación del webinar y los
contenidos en forma de tutorial
Herramientas de Analítica de Texto
¡Gracias por vuestra atención!
Preguntas, sugerencias...
Antonio Matarranz
CMO
amatarranz@meaningcloud.com
http://www.meaningcloud.com
top related