einführung in suchmaschinen und solr
DESCRIPTION
Eine kurze Einführung in die grundlegende Funktionsweise von Suchmaschinen, invertierten Dateien und die Architektur von Solr.TRANSCRIPT
Einführung in Solrideenplanet GmbH
2Was ist eine Suchmaschine?
Dokumente
Abfragen
Suchmaschinen-index
3Was ist ein Index?
T1was ist los
T2was ist das
T3das ist ein
fisch
Indexierung
das {(2, 3), (3, 1)}
ein {(3, 3)}
fisch {(3, 4)}
ist {(1, 2), (2, 2), (3, 2)}
was {(1, 1), (2, 1)}
4Ein Beispielabfrage
ANDwas ist
{1, 2} ∩ {1, 2, 3}
{1, 2}
5Solr Architektur
Admin Interfa
ce
Request Servlet
Request Handler
Response Writer
standard
edismax
json xml
Update Servlet
Solr CoreConfig – Schema – Analysis – Caching etc.
Lucene
6Solr Core
Core
solrconfig.xml
schema.xml
typesclass
analyzer
fields
name
type
indexed
stored
required
multivalued
7Schema: Felder
<field name="content“ type="wildcardField" indexed="true" stored="true“required="true" multiValued="false" />
<field name="weight" type="tint" indexed="true" stored="true" required="true" multiValued="false" />
8Schema: Typen
<fieldType name="wildcardField" class="solr.TextField" positionIncrementGap="100">
<analyzer> <tokenizer
class="solr.KeywordTokenizerFactory"/> <filter class="solr.LowerCaseFilterFactory" /> <filter
class="solr.GermanNormalization FilterFactory" />
</analyzer></fieldType>
Vielen [email protected]