detectar conversacion 'bot' en twitter
TRANSCRIPT
![Page 1: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/1.jpg)
¿Cómo detectarconversación ‘bot’?
COMUNIDAD TWITTER
![Page 2: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/2.jpg)
Jorge Peñalva, CEO en Séntisis y Emilio Ortiz, director de Data Science en Séntisis
Hola, trabajamos en Séntisis y somos:
![Page 3: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/3.jpg)
¿QUÉ ES SÉNTISIS? Inteligencia de Lenguaje Natural
![Page 4: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/4.jpg)
v
43%
57%
Comentarios Informativos
Comentarios Espontáneos
72%
1%
Comentarios Personas
Comentarios Tuitstars
27% Comentarios Empresas
1% Bots
![Page 5: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/5.jpg)
El Banco Santander ganó 5.966 millones de euros en 2015, lo que supone un aumento del 2,6% con respecto a 2014
CONVERSACIÓN
EL PAÍS @el_pais
CATEGORÍA Medio Informativo Informativa
RASGOS LINGÜÍSTICOS
Se identifica conversación en 3ª persona con rasgos claramente informativos
![Page 6: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/6.jpg)
Parece que hay problemas con el wifi y los datos móviles de los culés, no se lee a ninguno.
CONVERSACIÓN
Colmenero @Colmenero
CATEGORÍA Comentario de Tuitstars Irónica
RASGOS LINGÜÍSTICOS
Alto porcentaje de expresiones irónicas o de tuistars: “Parece que”, “yo + gerundio”, “cuando + te + verbo tercera persona”, ...
![Page 7: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/7.jpg)
¡¡Enhorabuena por una final épica!! #SeQuedaEnMadrid
CONVERSACIÓN
CATEGORÍA Comentario de Empresas Empresarial
Heineken España @Heineken_ES
Banco Santander @bancosantander
EJEMPLO SERVICIO/PRODUCTO INTANGIBLE
EJEMPLO PRODUCTO
RASGOS LINGÜÍSTICOS
Uso de hashtags y campañas
RASGOS LINGÜÍSTICOS
Uso de comunicación coorporativa positiva
#BancoSantander DIRSE se adhiere a la Red de Cátedras Santander de Responsabilidad Social
![Page 8: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/8.jpg)
La justicia española archiva definitivamente el caso Humberto Moreira. “no hay indicio para vincularlo a los Zetas”
CONVERSACIÓN
CATEGORÍA Persona u Espontáneo Personas
Carlos Quiónes @sabio28
EJEMPLO COMPARTIR OPINIÓN MEDIÁTICA
Que rica es la heineken, cuanto tiempo sin tomarme una !!
Dr. Saturno @Edderdallacosta
EJEMPLO CONVERSACION ESPONTANEA
Ladrones, corruptos, peligro para México La Justicia española archiva definitivamente el caso Moreira
Carlos E. Rodriguez @gruporeyna
EJEMPLO OPINIÓN SESGADA POR MEDIO
RASGOS LINGÜÍSTICOS
Segmentar por rasgos transversales: atención a cliente o experiencia de producto, opinión+informativo, sólo informativo
![Page 9: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/9.jpg)
Erdogan afirma que las mujeres que no tienen hijos son "mit... http://www.20minutos.es/noticia/2765122/0/erdogan-turquia-mujeres-madre/ … | https://twibble.io
CONVERSACIÓN
CATEGORÍA Bots Bots
Eloisa Cabrera @cabrelois
RASGOS LINGÜÍSTICOS
Semántica con estructuras repetidas. Otros rasgos: Info demográfica, histórico, similar a otros usuarios
Los alérgicos, ante su particular 'vía crucis': el polen de... http://www.20minutos.es/noticia/2763717/0/alergia-polen-graminea-olivo-parietaria/ … | https://twibble.io
![Page 10: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/10.jpg)
1. Un usuario que:
• No piensa en su contenido
• No genera contenido original
• En ocasiones su comportamiento es normal
¿Cómo definimos a un bot?
Entendemos por conversación bótica toda aquella
conversación que no es generada de manera natural
“
2. Su información:
• Puede ser relevante
• Debe analizarse por separado
![Page 11: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/11.jpg)
Categorización Semántica
Histórico Temporal
Extracción de Información
Métricas
Información Demográfica HERRAMIENTAS
![Page 12: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/12.jpg)
METODOLOGÍA
Grafo:
• Contenido original
• No retweets
• Filtrado por frecuencia
Marzo 2015
• 300k tweets analizados
• 110k usuarios
1% de Bots
![Page 13: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/13.jpg)
CASO 1. DE PERSONA A MEDIO
![Page 14: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/14.jpg)
![Page 15: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/15.jpg)
Intención/informa
0% 20% 40% 60% 80% 100%
Obama
Persona relacionada
Cita declaración
Intención/anuncia
Lugar relacionado
Cita acción
Atributo
Eventos
Tema/Orden público
Federico J. Rodríguez @tuitermann
#Tweets
259
Periodista. Redactor Jefe y Editor de programas informativos de Fuengirola Televisión y Radio (FTV) Antes: La Opinión de Málaga y Diario Málaga Costa del Sol
#Retweets
0#Tweets
259
~100% conversación es una noticia o similar
![Page 16: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/16.jpg)
CASO 2. CONTENIDO MONOTEMÁTICO
![Page 17: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/17.jpg)
![Page 18: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/18.jpg)
0% 20% 40% 60% 80% 100%
p.v./Librería-Papelería
?Juan Siseón Canet Gregori @canetgregori
#Tweets
992
Escritor-Ilustrador de mis libros-pintor y dibujante artístico.. Puedes verlo http://amzn.to/1QQ4qom
#Retweets
1#Tweets
993
![Page 19: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/19.jpg)
Texto Completo+ URL
Juan Siseón Canet Gregori @canetgregori
#Tweets
992
Escritor-Ilustrador de mis libros-pintor y dibujante artístico.. Puedes verlo http://amzn.to/1QQ4qom
#Retweets
1#Tweets
993
![Page 20: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/20.jpg)
?
??
?
CASO 3. PATRÓN SINTÁCTICO
![Page 21: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/21.jpg)
Clim Edis @ClimateEd
#Tweets
636Property in Spain
#Retweets
0#Tweets
636
“Venta Apartamento en” + LUGAR + por + COSTE
![Page 22: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/22.jpg)
CASO 4. DE PATRÓN SINTÁCTICO A PATRÓN TEMPORAL
![Page 23: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/23.jpg)
![Page 24: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/24.jpg)
Ines k @Inesk14
#Tweets
132Kr #1
#Retweets
179#Tweets
311
0
50
100
150
2016 - 03 - 03 01:00
2016 - 03 - 07 01:00
2016 - 03 - 11 01:00
2016 - 03 - 15 01:00
![Page 25: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/25.jpg)
?
??
?
CASO 5. EN OCASIONES VEO BOTS
![Page 26: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/26.jpg)
Comportamiento “Normal”
Karen Castañeda @SKarenMC
#Tweets
531Deja atrás el orgullo & déjate amar..! :3
#Retweets
6#Tweets
537
0
50
100
150
2016 - 03 - 07 01:00
2016 - 03 - 11 01:00
2016 - 03 - 15 01:00
2016 - 03 - 19 01:00
![Page 27: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/27.jpg)
Karen Castañeda @SKarenMC
#Tweets
531Deja atrás el orgullo & déjate amar..! :3
#Retweets
6#Tweets
537
0
50
100
150
2016 - 03 - 07 01:00
2016 - 03 - 11 01:00
2016 - 03 - 15 01:00
2016 - 03 - 19 01:00
Comportamiento “Bot”
![Page 28: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/28.jpg)
?
??
?
CASO 6. ATAQUE GRUPAL ¿TROLLS O BOTS?
?
![Page 29: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/29.jpg)
Bankia: retira los barrotes anti-indigentes de tus sucursales #losprincipiosdebankiahttp v\xeda @change_es
0
50
100
150
2016 - 03 - 15 01:00
2016 - 03 - 19 01:00
2016 - 03 - 23 01:00
2016 - 03 - 27 01:00
![Page 30: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/30.jpg)
?
??
?
CASO 7. PUBLICIDAD REPETIDA
![Page 31: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/31.jpg)
El Patotas @ElPatotasBlog
#Tweets
531
El Patotas te cargará de risa. / Humor ácido, Chistes, Imagenes, Burlas.
#Retweets
6#Tweets
537 Siempre referencia a su blog
0
50
100
150
2016 - 03 - 07 01:00
2016 - 03 - 11 01:00
2016 - 03 - 15 01:00
2016 - 03 - 19 01:00
![Page 32: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/32.jpg)
CASO 8. DE MISMAS FUENTES A CUENTAS REPETIDAS
![Page 33: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/33.jpg)
![Page 34: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/34.jpg)
0% 20% 40% 60% 80% 100%
vertele.com
formulatv.com
puromarketing.com
ift.tt
Mari Carmen Arranz @MamenArranz
#Tweets
71
Periodista. Redactora de tv. Buscando programa que me acoja :)
#Retweets
0#Tweets
71
Distribución de referencias a webs
![Page 35: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/35.jpg)
vertele.com
formulatv.com
puromarketing.com
ift.tt
0% 20% 40% 60% 80% 100%
Mamen @RedaccionTv
#Tweets
69
Periodista. Redactora de televisión.
#Retweets
0#Tweets
69
Distribución similar Detección de cuentas repetidas
![Page 36: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/36.jpg)
CASO 9. FAN BOTS
![Page 37: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/37.jpg)
![Page 38: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/38.jpg)
Natalia Orozco KR @nataliaorozcoro
#Tweets
69
Fans del mejor @KEVINROLDAN
#Retweets
0#Tweets
69
Al menos 10 cuentas de la
“misma persona”
NataliaOrozcokr @nataorozco10
Fans del mejor @kevinroldan
@nataliaorozcoro @Nataorozcoro01 @nataorozcoro02 @Nataorozcoro03 @nataorozcoro04
@nataorozcoro05 @nataorozcoro06 @nataorozcoro07 @nataorozcoro09 @nataorozcoro08
@nataorozcoro10 @Natalia39467430 @Natha_KR @NathysKR @krmaniaca
NataliaOrozcoKr @Nataorozcoro01
Amo la vida una mujer decidaMás de 10 cuentas adicionales con el mismo contenido
![Page 39: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/39.jpg)
?
??
?
CASO 10. NOMBRES Y DESCRIPCIONES “ESTÁNDAR”
![Page 40: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/40.jpg)
Eloisa Cabrera @cabreloisCuando más obscuro está, es porque ya no tarda en amanecer!!
● Patrones lingüísticos
● Referencia a medios
● Patrón temporal
Erdogan afirma que las mujeres que no tienen hijos son "mitad personas” http://www.20minutos.es/noticia/2765122/0/erdogan-turquia-mujeres-madre/ … | https://twibble.io
Los alérgicos, ante su particular 'vía crucis': el polen de gramíneas y olivos está en su etapa álgida http://www.20minutos.es/noticia/2763717/0/alergia-polen-graminea-olivo-parietaria/ … | https://twibble.io
Jorge Fernández ve tácticas de kale borroka "de cuando ETA asesinaba” en Gràcia http://www.20minutos.es/noticia/2765058/0/jorge-fernandez-alerta-que-gr-cia-hay-tacticas-kale-borroka-cuando-eta-asesinaba/ … | https://twibble.io
Nosotros proponemos el tema, tú mandas las fotos http://www.bbc.com/mundo/video_fotos/2016/06/160603_finde_galeria_lectores_viajes_men … | https://twibble.io
![Page 41: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/41.jpg)
Yorline Nava @yorlnavEl mundo necesita mucho más amor de lo que crees, vive en amor y con amor #TransformaTuVida
Paula Figueroa @gueropauMi mejor carta de presentación es mi sonrisa!!
Alejandra Torres @alandtorSonríe, vale la pena ser feliz!!!
Karen Sandoval @karsandlCree que lo puedes hacer y lo harás!!
Podemos propone prohibir Uber por atentar contra los taxistas http://www.20minutos.es/noticia/2762963/0/podemos-propone-prohibir-uber/
![Page 42: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/42.jpg)
¿Cómo detectar un bot?
● Patrones semánticos
● Patrones sintácticos
● Patrones temporales
● Mismos fuentes/links
● Trolls en grupo
● Fan Bots
● Nombres o descripciones “bóticos”
![Page 43: Detectar conversacion 'bot' en twitter](https://reader033.vdocuments.site/reader033/viewer/2022051707/58edfb5b1a28ab6a148b45b7/html5/thumbnails/43.jpg)
Y muchos más,descubiertos ypor descubrir...