kuznecov search smartus

22
Сергей Кузнецов Кто потеснит полнотекстовый поиск? «Интернет и Бизнес», Москва, 2008

Upload: mikhail-lomonosov

Post on 16-Nov-2014

257 views

Category:

Documents


1 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Kuznecov Search Smartus

Сергей КузнецовКто потеснит полнотекстовый поиск?

«Интернет и Бизнес», Москва, 2008

Page 2: Kuznecov Search Smartus

С чего все начиналось?

17 октября 1996 года

Page 3: Kuznecov Search Smartus

Чем все кончилось?

Page 4: Kuznecov Search Smartus

Чем все кончилось?

Page 5: Kuznecov Search Smartus

Почему каталоги проиграли?

1. древовидная структура слишком сложна

Page 6: Kuznecov Search Smartus

Почему каталоги проиграли?

2. трудно поддерживать актуальность каталога

Page 7: Kuznecov Search Smartus

Почему полнотекстовый поиск не так уж хорош?

1. Технология полнотекстового поиска трудна для пользователя

визуалам трудно с линейной выдачей

трудно искать не текст, а картинку или результат из базы данных

новичкам трудно сформулировать верный запрос

Page 8: Kuznecov Search Smartus

Почему полнотекстовый поиск не так уж хорош?

2. Полнотекстовый поиск не обеспечивает нужной релевантности

В более чем 99% случаев поисковый механизм выдает больше результатов, чем пользователь способен оценить или хотя бы просмотреть

Не более 6% пользователей используют результаты выдачи после десятого (по данным AOL Search Data, выборка из >9000000 пользовательских запросов)

Насколько много среди этих десяти результатов дорвеев?

Page 9: Kuznecov Search Smartus

Почему полнотекстовый поиск не так уж хорош?

3. Качество источников сложно оценить

Достоверность источника определяется сочетанием двух факторов:

1. Источник правильно определяет истинность набора утверждений, про которые заведомо известно, истинны они или ложны.

2. Мнение источника об истинности или ложности некоторого набора утверждений, про которые нет однозначного ответа, истинны они или ложны, совпадает с мнением пользователя.

Мало того, что достоверность источника зависит от пользователя – но даже «объективную» достоверность поисковые машины не слишком хорошо умеют мерить.

Page 10: Kuznecov Search Smartus

Почему полнотекстовый поиск не так уж хорош?

Несколько примеров пользовательских сценариев

Page 11: Kuznecov Search Smartus

Где же выход?

кластеризация результатов поиска

«продвинутые» интерфейсы

метапоиск по базам данных и «глубокому вебу»

вертикальный поиск

поиск по ограниченной базе источников

Page 12: Kuznecov Search Smartus

Несколько примеров

Page 13: Kuznecov Search Smartus

Несколько примеров

Page 14: Kuznecov Search Smartus

Несколько примеров

Page 15: Kuznecov Search Smartus

Тематический поиск

новости

отели

билеты

рестораны

финансы

недвижимость

работа

автомобили

… и многое другое

Page 16: Kuznecov Search Smartus

Несколько примеров

Page 17: Kuznecov Search Smartus

Несколько примеров

Page 18: Kuznecov Search Smartus

Несколько примеров

Page 19: Kuznecov Search Smartus

Несколько примеров

Page 20: Kuznecov Search Smartus

Назад к каталогам?

использование тэгов

автоматическое обновление

Page 21: Kuznecov Search Smartus

Назад к каталогам?

Page 22: Kuznecov Search Smartus

Назад к каталогам?