Новые возможности поиска в sharepoint 2013
DESCRIPTION
TRANSCRIPT
SharePoint 2013новые возможности поиска
Виталий Жуков
Новый поискСравнение компонентов поиска до и после SharePoint 2013
Компоненты до SharePoint 2013
SharePoint 2003 SearchРасширенные SQL-запросы к полнотекстовому индексу SQL Server
SharePoint 2007 SearchПоявился обработчик запросов, что позволило управлять поиском
Search Server 2008Расширение для SharePoint 2007
SharePoint 2010 Search (Foundation, Server)Search Server 2010 (Express)FAST Search Server 2010
Компоненты SharePoint 2013
SharePoint 2013 Foundation SearchSharePoint 2013 Server Search
Standard EditionEnterprise Edition
Прощай FAST?
Прощай FAST?
От FAST 2010 осталисьIndex componentQuery EngineAnalytics Processing ComponentCrawl component
НовыеContent Processing ComponentQuery Processing Component
SharePoint ServerUI
Новая архитектураКомпоненты поиск SharePoint 2013 и их особенности
Логическая архитектура поиска
Crawl Component
Недокраулер. Отвечает только за получение контента,
подлежащего индексации
Set-SPEnterpriseSearchService -PerformanceLevel
Список контента, подлежащего скачиванию, определяет Admin
Component
Каждый компонент имеет доступ ко всем crawler-БД
Больше нельзя создавать правила распределения узлов, теперь
этим занимается SharePoint
Content Processing Component
Новые обработчики (Format Handler вместо iFilter)
На обработку передаются только свойства
индексируемого файла
Старый Content Enrichment заменен новым на основе WCF
Новый Content Enrichment может иметь условия на запуск
Analytics Processing Component
Состоит из двух частей:
Поисковая аналитика (проиндексированное содержимое, поисковые запросы,
использование результатов поиска)
Аналитика использования сайтов SharePoint (просмотр элементов, переход по
ссылкам, использование навигации)
Берет данные из многих источников (ресурсоемкий)
Некоторые данные реплицируются в индексе (через Content Processing
Component)
APC может использовать несколько экземпляров БД (Link DB, Analytics
Reporting DB)
Index Component
Content Processing пишет, Query читает
Реплики используются не только для
отказоустойчивости
При перестроении индекса ни его наполнение, ни
его чтение недоступны
Реплики синхронизируются по расписанию
Query Processing Component
Первичная обработка поискового запроса
синонимы
проверка правописания
стемминг
Пост-обработка результатов поиска
объединение результатов из нескольких компонентов индекса
удаление дубликатов из результатов поиска
Administration Component
Хранит информацию о:
Топологии
Правилах запросов и краулинга
Схеме поиска (Crawled, Managed properties)
Источники контента
Расписания обхода контента
Отслеживает состояние компонентов поиска
ACL перенесены в индекс
Может быть развернут на нескольких серверах
Процессы поиска
MSSearch.exe
Crawl Component
NodeRunner.exe
Search Admin
Analytic Processing
Index
Content Processing
Query Processing
На каждый компонент поиска (кроме
Crawl) на сервере запускается процесс
noderunner.exe
MSSearch - Windows-служба
Search Host Controller – Windows-служба,
отслеживающая работу компонентов
поиска (процессы noderunner.exe)
Primary Host Controller
Master Data Repository
Secondary Host Controller(s)
Новые возможностиОбзор возможностей поиска в SharePoint 2013 OTB
Подсказки поиска
Персонализированный поиск
HTML/JS rich rendering
Социальный поиск
Callouts, preview
Thesaurus
Не более 100.000 синонимов, иначе словарь будет игнорироваться
Начиная с CU August 2013 синонимы могут быть на разных языках
Spell checking
Слово считается написанным правильно, если его написание встречается
более чем в 1000 (по умолчанию, можно менять) разных документах.
ExtensibilityМеханизмы расширения поиска в SharePoint 2013
REST API
Взамен существующей службы search.asmx
Доступна по адресу http://server/_api/search (алиас для
http://server/_vti_bin/client.svc/search)
Ranking model
Использование линейных моделей и основанных на
нейронных сетях
Комбинирование разных типов моделей
Query rules
Три уровня иерархии
Приложение поиска
Коллекция сайтов
Сайт
Определяется тремя показателями:
Condition – когда применять правило?
Action – что необходимо сделать?
Publishing – когда применяется правило?
Display templates, Result Types
Использование HTML-шаблонов и .js файлов для рендеринга
Control templates – определяет шаблон результатов поиска (список,
пейджинг, слайды)
Item template – определяет шаблон элемента
Определение типов результатов
Создание правил определения типа на основе свойств элемента
Указание шаблона отображения, используемого для отображения
типа в результатах поиска
Спасибо за вниманиеSkype: zhukovvitalyEmail: [email protected]: http://blog.vitalyzhukov.ru