periodismo de datos

Download Periodismo de datos

If you can't read please download the document

Upload: renato-ramirez

Post on 20-Aug-2015

323 views

Category:

Documents


0 download

TRANSCRIPT

  1. 1. Periodismo de datos. JPD14 Almera Introduccin al periodismo de datos. Renato L. Ramirez [email protected] @renatolrr www.osl.ugr.es
  2. 2. Introduccin. Qu es el periodismo de datos? Por qu debieran usar datos los periodistas Por qu es importante el periodismo de datos? La ley de crecimiento exponencial de Price. La ley de Zuckerberg
  3. 3. Obtener datos Una gua para trabajos de campo de 5 minutos Su Derecho a la Informacin El Wobbing* funciona. selo! Obtener datos de la red La red como fuente de datos Herramientas web
  4. 4. Entender los datos Aprenda a manejar datos con 3 pasos simples Consejos para trabajar con cifras en las noticias Pasos bsicos para trabajar con datos
  5. 5. Difundir datos Presentar datos al pblico Cmo crear una aplicacin de noticias El uso de visualizaciones para narrar historias Cuadros diferentes dicen cosas diferentes Seleccin de herramientas "Hgalo Ud. mismo" para hacer sus propias visualizaciones de datos.
  6. 6. Concepto de scraping Scarping Definicin segn Wikipedia: Web Scraping es una tcnica utilizada mediante programas de software para extraer informacin de sitios web
  7. 7. Buenas costumbres en scraping. Definir previamente lo que se busca. Planificar. Copiar web. Conocimientos previos de programacin. Conservar fuentes. Guardar los datos utilizando estndares.
  8. 8. Aspectos legales no estarn autorizadas la extraccin y/o reutilizacin repetidas o sistemticas de partes no sustanciales del contenido de una base de datos que supongan actos contrarios a una explotacin normal de dicha base o que causen un perjuicio injustificado a los intereses legtimos del fabricante. Artculo 133 del Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el Texto Refundido de la Ley de Propiedad Intele
  9. 9. Aspectos legales no estarn autorizadas la extraccin y/o reutilizacin repetidas o sistemticas de partes no sustanciales del contenido de una base de datos que supongan actos contrarios a una explotacin normal de dicha base o que causen un perjuicio injustificado a los intereses legtimos del fabricante. Artculo 133 del Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el Texto Refundido de la Ley de Propiedad Intele
  10. 10. Otros aspectos Agencia Espaola de Proteccin de Datos. Otra legislacin.
  11. 11. Planificar Open project Redmine Github Firebug HTML Regex Data Extractor Programacin en Perl Programacin avanzada en python Desarrollo de software colaborativo con Git
  12. 12. Copia web HTTrack Descarga:http://www.httrack.com/page/2/en/index.html Manual:http://www.httrack.com/html/fcguide.html httrack "http://lujoyglamour.net/" -O "/tmp/www.all.net" "+*.all.net/*" -v
  13. 13. Scrapy Scraping Web Pages with Scrapy - YouTube
  14. 14. Alternativas a Scrapy Mozenda Scraper Wiki DEiXTo Nokogiri http://search.cpan.org/~miyagawa/Web-Scraper-0.37/lib/Web/Scraper.pm http://teusje.wordpress.com/2010/05/02/web-scraping-with-perl/ http://blogs.perl.org/users/stas/2013/01/web-scraping-with- modern-perl-part-1.html
  15. 15. Libros Python for Data Analysis: Data Wrangling with Pandas, NumPy, and Ipython Head First Data Analysis: A Learner's Guide to Big Numbers, Statistics, and Good The Data Journalism Handbook
  16. 16. Datos Para que? Narrar Estudiar Aprender Zapatillas y la Mae. Ejemplo: The Baltimore Sun
  17. 17. Herramientas datos LibreOffice Google refine Tesseract Fusion tables R
  18. 18. Ejercicio prctico. Elecciones parlamento europeo, municipios de la provincia de Almera.
  19. 19. Pasos Mtodo cientfico. (la araa). Bsqueda Tratamiento. Presentacin.
  20. 20. To be continued... Todas las herramientas presentadas son software libre.