cautaera multilingva
TRANSCRIPT
![Page 1: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/1.jpg)
UNIVERSITATEA “ALEXANDRU IOAN CUZA”, IAŞI
FACULTATEA DE INFORMATICĂ
CĂUTARE DOCUMENTARĂ ÎNTR-
UN CONTEXT MULTILINGV
Sesiunea: IULIE, 2010
propusă de
Alina- Elena Mihăilă
Coordonator ştiinţific
Asistent, Dr. Adrian Iftene
![Page 2: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/2.jpg)
CUPRINS
2
Cuvinte Cheie
Prezentarea Problemei şi Formularea Soluţiei
Tehnologii
• Prezentare
• Configurare
Internet Surveillance
Aplicaţie- Structură
Studiu de caz
Concluzii
Direcţii Viitoare
2
![Page 3: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/3.jpg)
CUVINTE CHEIE
Multilingual
Căutare
Lucene
Index
Nutch
Google Translated API
Google Search API
Internet Surveillance
J2EE
JSF, JSP, MVC
Internaţionalizare
3
3
![Page 4: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/4.jpg)
PREZENTAREA PROBLEMEI ŞI
FORMULAREA SOLUŢIEI
Problemă
Utilizatori ocupaţi
Informaţii multe şi dispersate
Nu există un motor de căutare multilingv
Identificarea greoaie a opiniilor
Soluţie
Punerea în comun a informaţiilor în mai multe limbi
Identificarea uşoară a opiniilor
Păstrarea locală a informaţiilor
Internaţionalizarea aplicaţiei
4
4
![Page 5: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/5.jpg)
TEHNOLOGII- PREZENTARE
Apache LUCENE
bibliotecă de funcţii gratuită folosită în căutarea documentară
documentul, câmpul şi termenul
index
Apache NUTCH
framework pentru punerea în aplicare a motoarelor
de căutare
crawling
conceput pentru a procesa seturi de documente Web
5
5
![Page 6: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/6.jpg)
TEHNOLOGII- PREZENTARE
Google Translate API
proiect open source
translator automat
Google Search API
integrarea motorului de căutare Google în cadrul unei pagini
Web
J2EE
platformă Java proiectată pentru a prelucra date
pentru organizaţii mari
model distribuit multitier de realizare a aplicaţiilor
JAVASERVER FACES
standard pentru construirea interfeţelor cu
utilizatorul pe partea de server 6
6
![Page 7: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/7.jpg)
TEHNOLOGII- CONFIGURARE
NUTCH
Crearea directoarelor
Configurarea fişierelor
Indexare
Cygwin
Parsare fişier
Compunerea comenzii
Directoare de crawl
7
bin/nutch crawl urls -dir crawl -depth 3 -
topN 5
![Page 8: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/8.jpg)
TEHNOLOGII- CONFIGURARE
J2EE/JSF
web.xml
faces-config.xml
8
<servlet>
<servlet-name>
Faces Servlet</servletname>
<servlet-class>
javax.faces.webapp.FacesServlet
</servlet-class>
<load-on-startup>1</load-on-
startup>
</servlet>
<servlet-mapping>
<servlet-name>Faces Servlet
</servlet-name>
<url-pattern>/faces/*</url-pattern>
</servlet-mapping>
<navigation-rule>
<from-view-id>/index.jsp</from-view-id>
<navigation-case>
<fromoutcome>
searchConfiguration
</from-outcome>
<to-view-id>/search.jsp</to-viewid>
</navigation-case>
</navigation-rule>
![Page 9: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/9.jpg)
TEHNOLOGII- CONFIGURARE
JSF-MVC (Model- View- Controller)
9
![Page 10: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/10.jpg)
INTERNET SURVEILLANCE
„ Societatea noastră nu este una de spectacol, ci de
supraveghere (...) individul este atent fabricat în ea, în
conformitate cu o întreagă tehnică de forţe şi corpuri”
(Foucault 1977:217)
un concept care ne permite interogarea absolută a
colecţiilor de informaţii
„ Acumularea de informaţii definite simbolic materiale
care pot fi stocate de o agenţie sau o colectivitate,
precum şi supravegherea activităţilor subordonaţilor
de către superiorii lor ” (Giddens 1981:169)
10
![Page 11: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/11.jpg)
APLICAŢIE- STRUCTURĂ
Componente JavaBeans
Aplicaţia este structurată în trei pachete:
Bean- conţine clasa QueryResults
Internationalization- conţine clasa Language
Search- este format din clasele EnteredQuery,
GoogleQuery, Search şi TranslatedQuery
11
EnteredQuery.receivedQuery() TranslatedQuery.translateQuery()
GoogleQuery.makeQuery() Search.getConfiguration()
Search.createHit() QueryResults.QueryResults()
![Page 12: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/12.jpg)
APLICAŢIE- STRUCTURĂ
Pagini JSP
prezentarea rezultatelor către utilizator
Biblioteci de tag-uri
includerea elementelor de interfaţă în cadrul paginilor jsp şi
obiectele ataşate acestora pe partea de server
Fişiere de configurare
web.xml
faces-config.xml
12
![Page 13: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/13.jpg)
STUDIU DE CAZ
Pentru a ilustra funcţionalitatea şi utilitatea
aplicaţiei MLS (Multilingual Searcher) descriem
în cele ce urmează un studiu de caz referitor la
căutarea produsului iPhone.
Cu ajutorul acestui sistem utilizatorii vor avea
toate informaţiile necesare centralizate şi în
plus ele vor fi clasificate în comentarii pozitive şi
negative
13
![Page 14: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/14.jpg)
CONCLUZII
Utilizatori mulţumiţi- obţin rezultatele dorite
multilingv
Alternativă la căutarea clasică pe Internet
Combinarea rezultatelor obţinute
Afişarea opiniilor pozitive şi negative
Eficienţă - păstrarea locală a indecşilor
Componente principale
Separarea logicii de partea de prezentare
14
![Page 15: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/15.jpg)
DIRECŢII VIITOARE
Combinarea rezultatelor obţinute cu
rezultatele de pe reţelele de socializare
Extinderea numărului de limbi utilizate
Creşterea eficientei
Sortarea rezultatelor obţinute
Detecţia opiniilor
15
![Page 16: Cautaera multilingva](https://reader033.vdocuments.site/reader033/viewer/2022052905/55879b60d8b42a00758b45a6/html5/thumbnails/16.jpg)
UNIVERSITATEA “ALEXANDRU IOAN CUZA”, IAŞI
FACULTATEA DE INFORMATICĂ
Vă Mulţumesc !
16