think php 10, parsing with php
DESCRIPTION
Parsing with PHPTRANSCRIPT
Парсинг с помощью PHP
Поляков Павел [email protected]
Что такое парсинг? определение
Хочу ThinkPHP новости на нашем сайте.
проблема
анализ
решение
EXPLODE 1.
…
получаем контент, первоначально делим
EXPLODE
… парсим каждый
заголовок
EXPLODE 2.
+
EXPLODE
…
получаем контент, находим заголовки
EXPLODE …
парсим каждый заголовок
EXPLODE 3.
+
EXPLODE
…
получаем контент
EXPLODE …
…
делаем валидный xml с помощью Tidy
EXPLODE
…
…
ищем заголовки с помощью simplexml
EXPLODE …
парсим заголовки с помощью xml
EXPLODE 4.
+
подключаем phpQuery с помощью composer hfps://code.google.com/p/phpquery/
все оформили в класс
EXPLODE
получаем контент, чиним html
EXPLODE …
используем класс, парсим заголовки
EXPLODE 5.
+
( koloobablo.com )
Поиск в ЕГР (единый государственный реестр юрилических лиц
и физических лиц-‐предпринимателей)
hfp://search.irc.gov.ua/
EXPLODE
пример поиска
EXPLODE
пример поиска
EXPLODE
результат поиска
…
открываем страницу, подключаем jQuery, заполняем форму
EXPLODE
…
… ждем пока не появится капча
EXPLODE …
…
находим капчу на странице
EXPLODE
…
… вырезаем капчу ,
решаем ее, сабмитим форму
EXPLODE
…
… ждем результат, обрабатываем
96
119
EXPLODE
… парсим результат, выводим json
119
143
EXPLODE
используем вместе с php
EXPLODE
результат
EXPLODE
bonus track
hfp://casperjs.org/
PhantomJS, как он
должен быть
Спасибо! hfps://github.com/PavelPolyakov/parsing-‐with-‐php
Web: hfp://pavelpolyakov.com E-‐mail: [email protected]
весь код тут
Skype: pavel.polyakov.x1