LLUÍS CODINAUPF
SEMINARIO DIGIDOC, ABRIL 2007
Scirus, Live y Scholar: Motores de Búsqueda para
usos Académicos
El Estudio de los Motores Académicos
Motivaciones: Docente:
Establecer un punto diferencial con otras disciplinas en relación con las Ciencias de la Web
De investigación Nuevas oportunidades de investigación
Abril 2007L. Codina. UPF. Seminario DigiDoc
Interpretaciones del campo
Motores de búsqueda convencionales (“comerciales”), pero usados de otra forma: Parcialmente invalidada por el paradigma Google:
Localización > El recurso más cercano Popularidad (PageRank) > Test dolly, rem, etc.
Una oferta nueva y específica de los motores de búsqueda: La oferta real
Abril 2007L. Codina. UPF. Seminario DigiDoc
Aportaciones del entorno documental
Dos antecedentes “ilustres”: Arquitectura de la Información Análisis de citas (PageRank)
El caso actual: La idea del control y el filtro de calidad: Repositorios,
Bases de Datos y Publicaciones científicas Tecnología CrossRef + DOI
Abril 2007L. Codina. UPF. Seminario DigiDoc
Los tres “grandes” + ¿uno?
ScirusLiveScholar
+¿A9/Amazon?
Abril 2007L. Codina. UPF. Seminario DigiDoc
Tipología de documentos
T1: Páginas web y documentos de toda clase (word, ppt, etc.) publicados en sitios de instituciones académicas o científicas (p.e., sitios del tipo .edu).
T2: Artículos de publicaciones científicas tipo peer review, ya se trate de publicaciones open acces o de publicaciones de pago.
T3: Trabajos académicos tales como tesis doctorales o tesis de licenciatura.
T4: Documentos depositados en repositorios científicos (e-prints) ya sean pre-prints, post-prints, materiales didácticos, etc.
T5: PatentesT6: Libros, es decir, monografías por acuerdos con editoriales
comerciales o bien a través de acuerdos con bibliotecas
Abril 2007L. Codina. UPF. Seminario DigiDoc
Quién tiene qué
Motor T1 T2 T3 T4 T5 T6
Scirus ● ● ● ● ●
Live ● ● ● ●
Scholar ● ● ● ● ●
Abril 2007L. Codina. UPF. Seminario DigiDoc
Sciruswww.scirus.com
Contexto Editorial Elsevier, parte de Reed-Elsevier ScienceDirect Scopus Creado en el 2001 300 millones de documentos a fines del 2006
Funciones Búsqueda avanzada Reformulación de la consulta Clasificación de resultados Exportación de resultados
Abril 2007L. Codina. UPF. Seminario DigiDoc
Academic Liveacademic.live.com
Contexto Parte del conglomerado de servicios Live de Microsoft. Acuerdos con editoriales: Participating Publishers
(lista disponible en la propia web). No informa del número de documentos. Tipología:
“journal articles, conference proceedings, dissertations and academic books”. De forma muy incipiente los tres últimos (señalados en cursiva).
Funciones Ordenación de resultados Ventana de visualización de resúmenes Exportación de formatos
Abril 2007L. Codina. UPF. Seminario DigiDoc
Google Scholarscholar.google.com
Contexto Google Mayor tipología de documentos Mayor número de documentos, pero sin información precisa Completamente localizado Acceso a libros completos (acuerdos con bibliotecas)
Funciones Búsqueda avanzada Navegación (libros) Análisis de citaciones Búsquedas relacionadas Búsquedas en catálogos de bibliotecas Adquisición de libros
Abril 2007L. Codina. UPF. Seminario DigiDoc
A9/Amazon
Contexto La mayor tienda de libros del mundo: Amazon Libros impresos Libros electrónicos
Funciones Navegación Minería de datos: Concordance, Text Stats, SIPs, CAPs Resumen Búsquedas relacionadas
Abril 2007L. Codina. UPF. Seminario DigiDoc
Conclusiones
Una nueva forma de utilizar la WebUn nuevo modelo de negociosUn nuevo campo de análisis y estudios y por
tanto, tal vez una nueva disciplina (¿la teledocumentación del Siglo XXI?)
¿La Web Semántica realmente existente?
Abril 2007L. Codina. UPF. Seminario DigiDoc