think php 10, parsing with php

36
Парсинг с помощью PHP Поляков Павел [email protected]

Upload: pavel-polyakov

Post on 02-Jul-2015

988 views

Category:

Internet


1 download

DESCRIPTION

Parsing with PHP

TRANSCRIPT

Page 1: Think php 10, parsing with PHP

Парсинг  с  помощью  PHP  

Поляков  Павел  [email protected]  

Page 2: Think php 10, parsing with PHP

Что  такое  парсинг?  определение  

Page 3: Think php 10, parsing with PHP

Хочу  ThinkPHP  новости  на  нашем  сайте.  

проблема  

Page 4: Think php 10, parsing with PHP

анализ  

Page 5: Think php 10, parsing with PHP

решение  

Page 6: Think php 10, parsing with PHP

EXPLODE  1.  

Page 7: Think php 10, parsing with PHP

…  

получаем  контент,  первоначально  делим  

Page 8: Think php 10, parsing with PHP

EXPLODE  

…  парсим  каждый  

заголовок    

Page 9: Think php 10, parsing with PHP

EXPLODE  2.  

+  

Page 10: Think php 10, parsing with PHP

EXPLODE  

…  

получаем  контент,  находим  заголовки  

Page 11: Think php 10, parsing with PHP

EXPLODE  …  

парсим  каждый  заголовок  

Page 12: Think php 10, parsing with PHP

EXPLODE  3.  

+  

Page 13: Think php 10, parsing with PHP

EXPLODE  

…  

получаем  контент  

Page 14: Think php 10, parsing with PHP

EXPLODE  …  

…  

 делаем  валидный  xml  с  помощью  Tidy  

Page 15: Think php 10, parsing with PHP

EXPLODE  

…  

…  

 ищем  заголовки  с  помощью  simplexml  

Page 16: Think php 10, parsing with PHP

EXPLODE  …  

парсим  заголовки  с  помощью  xml  

Page 17: Think php 10, parsing with PHP

EXPLODE  4.  

+  

Page 18: Think php 10, parsing with PHP

подключаем    phpQuery  с  помощью  composer  hfps://code.google.com/p/phpquery/  

Page 19: Think php 10, parsing with PHP

все  оформили  в  класс  

Page 20: Think php 10, parsing with PHP

EXPLODE  

получаем  контент,  чиним  html  

Page 21: Think php 10, parsing with PHP

EXPLODE  …  

используем  класс,  парсим  заголовки  

Page 22: Think php 10, parsing with PHP

EXPLODE  5.  

+  

(  koloobablo.com  )  

Page 23: Think php 10, parsing with PHP

Поиск  в  ЕГР  (единый  государственный  реестр  юрилических  лиц  

 и  физических  лиц-­‐предпринимателей)  

hfp://search.irc.gov.ua/  

Page 24: Think php 10, parsing with PHP

EXPLODE  

пример  поиска    

Page 25: Think php 10, parsing with PHP

EXPLODE  

пример  поиска    

Page 26: Think php 10, parsing with PHP

EXPLODE  

результат  поиска  

Page 27: Think php 10, parsing with PHP

…  

открываем  страницу,  подключаем  jQuery,  заполняем  форму  

Page 28: Think php 10, parsing with PHP

EXPLODE  

…  

…  ждем  пока  не  появится  капча  

Page 29: Think php 10, parsing with PHP

EXPLODE  …  

…  

находим  капчу  на  странице  

Page 30: Think php 10, parsing with PHP

EXPLODE  

…  

…  вырезаем  капчу  ,  

решаем  ее,  сабмитим  форму  

Page 31: Think php 10, parsing with PHP

EXPLODE  

…  

…  ждем  результат,  обрабатываем  

96  

119  

Page 32: Think php 10, parsing with PHP

EXPLODE  

…  парсим  результат,  выводим  json  

119  

143  

Page 33: Think php 10, parsing with PHP

EXPLODE  

используем  вместе  с  php  

Page 34: Think php 10, parsing with PHP

EXPLODE  

результат  

Page 35: Think php 10, parsing with PHP

EXPLODE  

bonus  track  

hfp://casperjs.org/  

PhantomJS,  как  он  

должен  быть  

Page 36: Think php 10, parsing with PHP

Спасибо!  hfps://github.com/PavelPolyakov/parsing-­‐with-­‐php  

Web:  hfp://pavelpolyakov.com  E-­‐mail:  [email protected]  

весь  код  тут    

Skype:  pavel.polyakov.x1