Download - Learning Content Models for Semantic Search
Learning Content Models for
Semantic Search Eran Peer
Hila Shalom
ContentsProblem DomainCurrent SituationProposed SolutionA Visual ExampleSystem architectureMain Functional RequirementsMain Non-Functional RequirementsMajor Use-CasesRival Technology
Problem DomainUsers who do not know exactly what they are looking for in a repository, so they find it difficult to describe the topic that interests them. The program will allow such people to effectively and conveniently navigate the database, through an interactive process combining search and browse.
Current SituationExisting search engines provide powerful features to identify known documents by using a short description of their content (keywords, name of document).But what happens when the user does not know the name of the term he is looking for, or when the term the user enters has several meanings.
Proposed SolutionThe user can enter text (as long as he wants)
as query.Each result of the query will be labeled with
its topic.A hierarchy of the relevant topics tree will be
displayed as addition to the result.
לחיפוש טקסט הקש
חפש
A Visual Example
לחיפוש טקסט הקש , וחולשה צמרמורות לי יש הראש לי כואב
חפש
A Visual Example
A Visual Example-The Current Result
:" , וחולשה " צמרמורות לי יש הראש לי כואב החיפוש עבור תוצאותבירור שמצריך ומתמשך חזק ראש כאב : בת אני על לדעת שרציתם מה , 29כל ניתוחים, למעט כלל בדרך בריאה
. אצלי להופיע התחילו האחרון בחודש שבר בעקבות ביד שעברתי אורתופדייםראש .כאבי חזקה מאוד בעוצמה
כרוניים נושא: ראש בגפיים , כאבי אורתופדיים ניתוחיםבילדים ראש כאבי
בגיל כבר להופיע עלולה והיא ילדים אצל שכיחה ראש כאבי על התלונה . מתמשך, ראש כאב אחרת נלווית מחלה או חום הופעת עם קשר ללא שנתיים
... ילדים אצלילדים נושא: אצל שונים לילדים , כאבים תרופות של לוואי כאבי , תופעותכרוניים :ראש נושאים עץ
ילדים • רפואתילדים • אצל שונים כאביםילדים • בקרב נגיפיות מחלותילדים • אצל חום
כרוניים • כאביםכרוניים • ראש כאביחוזרים • בטן כאבי
A Visual Example-Our Ambition
System architecture
Main Functional RequirementsEnd users: the user enters a query in natural
language. The user gets an answer that helps him navigate and understand the structure of the corpus.
Content manager: gets new documents and add them to a repository.
Administrator: gets statistics from the use of the system, learn from them and update the hierarchical division to topics accordingly.
Main Non-Functional RequirementsThe system works interactively with the users.The inputs come from the users.At our simulation, we will use beta-users that
will use the system and will help us make it more user-friendly.
The user should understand how to use the system in 10 minutes.
The user can prepare the input in 10 seconds.The user can interpret the output in 2.5
minutes.
End User
ContextManager
SystemManager
Navigating
the system
Entering text as query
Entering a new text to
the repository
<<include>><<include>>
Delete texts in
the repository
Production
statistics UpdatingThe topic
modelRearrange the
hierarchy
Major Use-Cases
Rival Technology