presentación pfc

44
Facultad de Comunicación y Documentación Batalla entre los majors: análisis de la lucha por la primacía en la Web Alumno aspirante al grado de Licenciado en Documentación: Pedro Miguel Álvarez Guillermo PROYECTO FIN DE CARRERA (P.F.C.)

Upload: pedro-miguel-alvarez-guillermo

Post on 15-Apr-2017

36 views

Category:

Internet


0 download

TRANSCRIPT

Facultad de Comunicación y Documentación

Batalla entre los majors:análisis de la lucha porla primacía en la Web

Alumno aspirante al grado de Licenciado en Documentación:Pedro Miguel Álvarez Guillermo

PROYECTO FIN DE CARRERA(P.F.C.)

2

ESQUEMA DE MI DEFENSA

1. Introducción2. Justificación de la investigación3. Objetivos4. Metodología5. Desarrollo

5.1 Servicios de valor añadido5.2 Características de búsqueda y rastreo5.3 Comparativa de servicios de valor añadido5.4 Comparativa de características de búsqueda

6. Conclusiones7. Referencias.

3

1. INTRODUCCIÓN (I)

Situación histórica: época de los gigantes mediáticos.

Necesidad e interés cada vez más despierto por recuperar lainformación con eficacia en la Red de Redes, además de lanecesidad de informarse, el posicionamiento dentro de losbuscadores y el ver quién ofrece los mejores productos y servicios.

• Tras la crisis de los portales y empresas puntocom allá por el año2000 y 2001, cuando se produjo el estallido de la llamadaburbuja tecnológica pero los más grandes sobrevivieronmediante estrategias de marketing, contenidos y de inversión.Estrategia de Yahoo! actualmente está siendo agresiva y cuentacon la experiencia de un portal clásico y con solera.Microsoft (y por ende, MSN) se basa en su monopolio en elmercado del software, debido a su veteranía (existe desde 1975).

4

1. INTRODUCCIÓN (II)

Pero la excepción que confirma la regla es Google (esinevitable mencionarlo), que se empezó a popularizar entre lacomunidad internauta a partir del año 2000. Y desdeentonces no ha habido tregua por hacerse un hueco en lalucha de los buscadores y de los servicios/productos de valorañadido; cada vez ha sido una lidia o pugna más intensa.

Yahoo! y MSN, están respaldados por su experiencia enproductos o servicios, por su inversión más o menos racional,marketing y prestigio.

Yahoo!, al abarcar menos terreno que MSN, está más encondiciones éste último de "apretar", pero también decompetir fuertemente contra Google.

5

1. INTRODUCCIÓN (III)

Google: líder de audiencia gracias a la popularidad de sumotor de búsqueda (su filosofía radica en tener voluntad parainnovar y organizar la información mundial, aunque tienen 10principios muy claros existentes en su web). Luego está claroque son proyectos distintos, con visiones de negocio muydiferentes.

Google se está ahora portalizando. Desde un principioconocemos la filosofía de esta empresa y sabemos que susprincipios es la apuesta constante por la calidad de susservicios y productos. Y al no ser búsquedas en bases dedatos factuales sino deterministas, la búsqueda a textocompleto es más compleja.

6

1. INTRODUCCIÓN (IV) Pero tampoco MSN ha estado de brazos cruzados ya que a

Microsoft, tras su fracaso allá por el año ’94 con la red MicrosoftNetwork, no está dispuesta a perder el trono en el ámbitocibernético, por la cuenta que le trae, ya que no se puede descuidarni un momento y por eso no está conforme con la hegemonía de sunavegador (que fue gracias al monopolio de Windows y laintegración del navegador en dicho sistema operativo); eso pilló desorpresa a Microsoft, pero que fue un éxito del que supo sacar jugo,si bien el tema de los navegadores ya es otra historia de lidiadistinta.

El caso es que Microsoft se ha desecho de los algoritmos de suantiguo motor Inktomi y Overture para poner en marcha su propiatecnología valiéndose del perfeccionamiento de su robot-trasteadorde la web, MSNBot, por haber adquirido recientemente la empresaLookout.

7

2. JUSTIFICACIÓN DE LA INVESTIGACIÓN (I) De entre los temas propuestos, elegí éste por ser en el que más

experiencia tengo y más me atrae de acuerdo a mi trayectoriaacadémica y formativa autodidacta.

He considerado interesante -creo que era el momento idóneo eideal- elaborar una instantánea sobre cómo está la situación afecha de julio de 2005 en cuanto a lidia entre los buscadores másimportantes: Google, Yahoo! y MSN; todo ello intentando tener elmayor rigor posible y algo de crítica.

En este sentido, he procurado esmerarme tanto en ladocumentación como en la fiabilidad de lo que leía (si se lee eldocumento original se podrá percibir algo). También en el anexo,con elementos de valor añadido que explico en la metodología y enel cuerpo del trabajo, teniendo en cuenta anécdotas dedeclaraciones de directivos de estos gigantes y proyectosabandonados por Google por abarcar tanto y alternativas demétodos de búsqueda o parámetros interesantes, que es algo conlo que disfruto al descubrirlo.

8

2. JUSTIFICACIÓN DE LA INVESTIGACIÓN (II) No es fácil en esta fecha encontrar una recopilación como la que he

pretendido en este trabajo.

Seguramente hay trabajos similares aunque yo los desconozca y habríaque ver su metodología si ha sido la misma y si son igual de exhaustivoscomo aquí se pretendía, con tal de acaparar más

De ahí, el tiempo que ha llevado, requiriendo una puesta al día continuadadurante cuatro meses. Pero también he procurado sintetizar descripcionesde servicios por motivos de espacio cuando lo requería.

Al menos, éste ha sido mi criterio que expongo, ni mejor ni peor quecualquier otro, sino más a mi manera, y concertado con mi director,pretendiendo hacer un tratamiento integral pero tambiénpormenorizadamente cuando era estrictamente necesario, para noarriesgarse a imprecisiones.

Creo que ha merecido la pena el esfuerzo, lástima que sea algo efímeropor la obsolescencia y caduque tan pronto algunos enlaces, por su cortalongevidad, y no sabemos en el futuro cómo se llamarán o si existiránestos servicios visto con el mismo concepto.

9

3. OBJETIVOSA. Dar cuenta de los proyectos que están floreciendo en torno a la propia

función de búsqueda, debido al estado de apogeo del sector de lasbúsquedas en materia de características de búsqueda por la inserción denuevas tecnologías, y todo ello para intentar que se tenga una visiónpormenorizada pero a la vez sintética e integradora de lo que se estáhaciendo en ese sentido.

B. Analizar los principales servicios que ofrecen estas empresas para competiren dicho sector y de paso, en el de los portales de Internet, que es lo quese está ahora desarrollando más y a lo que se tiende de nuevo ahora queno caen del todo en el generalismo de un portal horizontal.

C. Veremos finalmente cómo los buscadores intentan con sus característicasde búsqueda facilitarnos en gran medida nuestras consultas informativaspara tratar de mitigar el problema de la recuperación mediante texto libre(que algún día se convertirá en recuperación lenguaje natural, cuando la"web semántica" funcione y las páginas estén preparadas para ello (losnavegadores ya lo están con el código estándar XML).

10

4. METODOLOGÍA 1ª fase del trabajo: se hizo la descripción de los servicios de valor añadido

(SVA) de cada empresa o buscador -aunque no demasiada pormenorizada-.

2ª fase del trabajo: se analizaron las características fundamentales debúsqueda (capacidades y herramientas de búsqueda) y a modo de valorañadido coloqué información tanto personal como extraida de la ayuda delos motores de búsqueda sobre el rastreo y los criterios de posicionamientoque lleva a cabo el buscador en cuestión. En una tercera y última faseintegradora, más completa pero sintética, se construyó la tabla comparativade evaluación de los aspectos tratados en cada una de las dos fasesanteriores.

− Anexo: para dotar de algo de "frescura" al trabajo, he consideradoconveniente indicar algunas curiosidades y agregar una selección denoticias de la prensa de Internet sobre todo, respecto a lo que se avecina adía de hoy en este ámbito tan competitivo.

Nota: la sintaxis del lenguaje de búsqueda a la hora de establecer losparámetros aparece en el documento original de la Tesis.

11

• GOOGLE XHTML (WAP 2.0)• GOOGLE LOCAL• ORKUT• GOOGLE EARTH• GOOGLE PERSONALIZED SEARCH• GOOGLE HOME PERSONALIZED• GOOGLE VIDEO VIEWER• GOOGLE VIDEO SEARCH• GOOGLE DESKTOP SEARCH• GOOGLE GROUPS (v. 2)• GOOGLE ACCOUNTS• GOOGLE SUGGEST (beta)• GOOGLE ALERTS (beta)

5. DESARROLLO.5.1. SERVICIOS DE VALOR AÑADIDO

• GOOGLE DESKBAR• GOOGLE NEWS• PICASA• GOOGLE SITEMAPS• BLOGGER• GMAIL• GOOGLE SEARCH APPLIANCE (+ mini)• GOOGLE BROWSER BUTTONS• GOOGLE ACCOUNTS• BÚSQUEDAS TEMÁTICAS ESPECIALES• GOOGLE PRINT

12

• GOOGLE TOOLBAR• FROOGLE (y sus variantes)• GOOGLE COMPUTE• GOOGLE WEB APIs• GOOGLE CATALOGUE SEARCH• GOOGLE ANSWERS• GOOGLE DOWNLOADS

5. DESARROLLO.5.1. SERVICIOS DE VALOR AÑADIDO

OTROS SVA (DESCRITOS SOMERAMENTE):

• Site-Flavored Google Search (beta)• Versión WAP de Google• Google-Friends Newsletter• Google Store• Google Web Accelerator• Google Sets• Google Scholar

- Más en la web del Laboratorio de Google -

13

5. DESARROLLO.5.1. SERVICIOS DE VALOR AÑADIDO

• YAHOO! NEWS• YAHOO! 360º (beta, integrado)• FLICKR• YAHOO! MAIL• MY YAHOO!• YAHOO! DEVELOPER• MYWEB• MY WEB 2.0 (no es de lo mismo)• YAHOO! MAPS• SHOPPING YAHOO!• YAHOO! SMALL BUSINESS• YAHOO! TOOLBAR 6.0• YAHOO! DESKTOP SEARCH

• MY YAHOO! SEARCH• YAHOO! LOCAL• YAHOO! MOBILE• YAHOO! MESSENGER• ASK YAHOO!

OTROS SVA (DESCRITOS SOMERAMENTE):

• YAHOO! MÚSICA• YAHOO! MUSIC ENGINE• YAHOO! CINE• YAHOO! SEARCH SUBSCRIPTIONS• YAHOO! BUZZ GAME• YAHOO! FARECHASE

14

5. DESARROLLO.5.1. SERVICIOS DE VALOR AÑADIDO

OTROS SVA SECUNDARIOS (continuación):

• YAHOO! MÚSICA• YAHOO! MUSIC ENGINE• YAHOO! CINE• YAHOO! SEARCH SUBSCRIPTIONS• YAHOO! BUZZ GAME• YAHOO! FARECHASE• YAHOO! MINDSET (beta)• MY YAHOO! TICKER (beta)• YAHOO! ANTI-SPAM RESOURCE CENTER-

DOMAINKEYS• SERVICIO ‘FOTOCORREO’• YAHOO! MESSAGE BOARDS

- Más en la web del Laboratorio de Yahoo! -

15

5. DESARROLLO.5.1. SERVICIOS DE VALOR AÑADIDO

• MSN HOTMAIL• MY MSN• MSN MAPAS Y DIRECCIONES

(comienzo de gestación del proyecto MSN VIRTUAL EARTH, hoy BING MAPS).• START.COM• MSN GRUPOS• MSN NEWSBOT• MSN SPACES• MSR NETSCAN - USENET SOCIAL ACCOUNTING SEARCH ENGINE• MSN Toolbar• MSN Mobile• MSN Messenger

- Más en la web del Laboratorio de MSN -

16

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

INTRODUCCIÓN

¿Qué considero “características de búsqueda?

Resultados de búsquedas numerados con plugin para el navegador Mozilla Firefox en el caso de Google.

Código de hipervínculo con los enlaces patrocinados.

Servidores con versiones del portal no sincronizadas tanto en Herramientas de idioma como con el filtro Google Safe.

Búsqueda Avanzada.

Cada buscador tiene sus recomendaciones en su ayuda para fomentar el posicionamiento en la indexación de cara al rastreo.

17

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Búsqueda de sinónimos• Búsquedas de libros• Información meteorológica• Q&A• Información bursátil (stock quotes)• Results Prefetching• Mapas de calles• Titulares de noticias• Conversor de divisas• Calculadora• Traducción de páginas web• Búsqueda de archivos en diferentes

formatos• Vínculos en caché• Páginas similares

• Trackback (o vínculos recibidos)• Restricción de dominio• Voy a tener suerte (búsqueda "con

confianza" o de lanzamiento automático)

• Exclusión de palabras• Búsqueda de frases literales• Consultas automáticas que incluyen

"and"• Términos de búsqueda en contexto• Definiciones (Google Glossary)• Corrector ortográfico• Búsquedas múltiples• Búsqueda por rangos numéricos• Uso de comodines• Directorio: búsqueda por categorías

CARACTERÍSTICAS DE BÚSQUEDA

18

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Operadores especiales:

allinanchor:allintext:allintitle:allinurl:author: (sólo funciona en Google Groups)bphonebook:cache:datarange:define:filetype: (= ext)group: (sólo funciona en Google Groups.

funciona también como groups)inanchor:info:id:insubject: (sólo funciona en Google Groups)intext:intitle:

inurl:link:location: (sólo funciona en Google News)msgid: (sólo funciona en Google Groups)movie: phonebook:related:rphonebook:site:source: (sólo funciona en Google News)stocks: store: (sólo funciona en Froogle)

Nota:Google no distingue mayúsculas

de minúsculas, ni las tildes, ni realiza búsquedas con

operadores de truncamiento (parciales).

19

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

GoogleBot

• Es el robot principal que utiliza Google para 'rastrear' los sitiosde Internet. No solamente indexa páginas web (HTML), sinoque también extrae información de ficheros PDF, PS, XLS,DOC y algunos otros más.

• Su capacidad de rastreo influye mucho. Basado en servidoresLinux y con una arquitectura tecnológica de Intel y altascantidades de memoria RAM, además de hacer uso de cachéen la mayor parte del índice para evitar escrituras innecesariasen discos duros, es capaz de admitir tantas búsquedassimultáneas a nivel mundial.

RASTREO

20

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

GoogleBot• Sus algoritmos están implementados por multitud de criterios o factores

(Google tiene unos 100 y es un secreto que mantienen bastante bienguardado pues no les interesa dar pistas a los spammers).

• De cualquier manera, podemos intuir que pueden ser factores oindicadores de relevancia: la frecuencia de actualización, webs que nocontengan residuos para tratar de engañar a un buscador, el peso de lapágina, los metadatos o metaetiquetas (cuantos más se tengan, mejorindexada estará la página en su directorio u otro en teoría, al estar máscompleta la descripción y detallada, sobre todo si ellos la dan por válida) yel PageRank que se mide por el número de enlaces que se reciben deotras páginas, o lo que es lo mismo, la que apuntan a una determinadaweb, para que suba más alto en la escala de cara al posicionamiento.

21

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Feeds para las noticias, pero sin el icono como en MSN.• Búsqueda contextual o relacionada (Y!Q Search Beta), de lo que no dispone

aún Google ni MSN.• Directorio Yahoo!: un clásico renovado, con dos modalidades: una gratuita que

no garantiza la inclusión, y otra que sí lo hace a cambio de 299 dólares).• Página de resultados de búsqueda• Incluir palabras/Excluir palabras• Cualquiera/OR:

Si una persona está interesada por igual en dos o más alternativas, debe usarel operador booleano OR. Por ejemplo, podemos querer buscar "rockalternativo OR progresivo".

Orden de las palabras• Para buscar una frase exacta, sólo hay que poner entre comillas dos o más

palabras. Por ejemplo, "No por mucho madrugar" (escribiendo las comillas en elcajetín de búsqueda).

CARACTERÍSTICAS DE BÚSQUEDA

22

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Búsquedas relacionadasA veces también se reciben sugerencias. Si otros usuarios de Yahoo! han buscadoalgo parecido, los enlaces a estas búsquedas relacionadas aparecerán bajo elcajetín en la parte superior de la página de resultados.

• Atajos Yahoo!Los atajos de Yahoo! ayudan a encontrar lo que se busca instantáneamente. Cuandose usan, la información buscada aparece de inmediato en la página de resultados.Para el conversor de divisas, la palabra clave es cambio de divisas.Para móviles, la palabra clave es melodías (seguida del nombre de un artista).Para noticias, la palabra es noticias (seguida de un tema).Para noticias deportivas, debes introducir el 'nombre de un equipo de fútbol'.

• Categorías relacionadas/Categorías del DirectorioLas Categorías son conjuntos de sitios que nuestros editores han revisado yorganizado por temas en el Directorio Yahoo! Te pueden ser útiles a la hora dedefinir una búsqueda o de encontrar algo en lo que no se había pensadopreviamente.

23

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Todo InternetEstos resultados son una combinación de páginas y sitios webs relevantesprovistos por Yahoo!, no controlan su contenido lógicamente.

• Preferencias de Búsqueda: Nueva Ventana, Filtro de Búsqueda Segura eIdioma.

• Yahoo! Búsqueda Segura

• Búsqueda avanzada:La Búsqueda Avanzada nos ayuda a encontrar sitios que responden acriterios muy específicos. Las opciones que elijas se aplicarán sólo a labúsqueda que realices en ese momento.

· Estricto

· Moderado (predeteminado)

· Desactivado

24

• Fecha

• Dominio

• País

• Idioma

• Número de resultados

• Buscar por URL

• Buscar por Formato

Podemos restringir la búsqueda segúnel tipo de documento que necesitas.

Los formatos que que aceptan estefiltro son:

• .htm, .html - HTML estándar•. pdf - Adobe PDF•. xls - Microsoft Excel•. ppt - Microsoft PowerPoint• .doc - Microsoft Word• .xml, .rdf, .rss - Feeds de RSS o XML• .txt - Formato de texto

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

25

• Búsqueda de Imágenes

La Búsqueda de Imágenes de Yahoo! funciona con un motor de búsquedaexterno que nos permite buscar entre millones de imágenes en la Web.

Búsqueda Avanzada de Imágenes:

• Tamaño• Tipo de archivo• Color• Dominio• Contenido adulto

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

26

• Yahoo! Search Vídeo (http://video.search.yahoo.com)

Yahoo! Search Vídeo permite buscar entre millones de archivos de vídeoen toda la Web.Para comenzar a usar Yahoo! Search Vídeo, se acude a la URL de arribapara después introducir la descripción de lo que quieres encontrar en elcajetín de búsquedas. Por ejemplo, si se necesitan vídeos de gatos, teclea"gatos" en el cajetín y pulsa el botón de "Búsquedas".

Para limitar la búsqueda a vídeos de un determinado tamaño o formato,usa la Búsqueda Avanzada de Vídeo.

Las páginas de resultados mostrarán 20 miniaturas (imágenes reducidas)por página.

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

27

• Yahoo! Search Vídeo (http://video.search.yahoo.com)

Búsqueda Avanzada de Vídeo:Las opciones elegidas sólo se aplicarán a la búsqueda que se realizan enese momento. Describo el primer campo y enumero los demás:

Buscar Para obtener resultados más precisos, este cajetín de textopermite darle a Yahoo! Search Vídeo instrucciones precisas sobre lostérminos que introduces.

Podemos usar símbolos como +, - y " " (comillas) para definir mejor nuestrabúsqueda.Por ejemplo: Quieres ver vídeos de Jennifer Aniston sin Brad Pitt. Escribe+"Jennifer Aniston" -"Brad Pitt" en el cajetín "Buscar".

El resto de campos son:

Formato Tamaño Duración Sitio/DominioFiltro de Búsqueda Segura

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

28

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Yahoo! dispone desde no hace muchos meses de un nuevo rastreador,llamado Slurp, que literalmente significa 'absorber ruidosamente'. Aligual que Google tiene un PageRank, Yahoo! tiene un webrank.

• Los webmasters pueden activar el 'If-Modified-Since' en las opcionesde su servidor web. De esta manera, le podrán decir a los robots de losbuscadores y a los navegadores si su contenido se ha modificadodesde la última vez que visitaron una determinada página. Si no es así,estas aplicaciones utilizarán su caché y no gastarán ancho de bandadel servidor Web.

• Por último, Yahoo! también recomienda utilizar la directiva 'crawl-delay'dentro del fichero 'robots.txt' del servidor web. Esta directiva solo estásoportada por los buscadores de Yahoo! y de MSN, y recuerda al robotque debe volver a visitar un determinado sitio web al cabo de un ciertonúmero de segundos como mínimo.

RASTREO

29

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Consultas enciclopédicas dadas por su producto Encarta. Cuando esto ocurre, aparece el icono “ ”. lo puedo saber, luego por eso lo indico) para consultarla, que por cierto han incluido un enlace dentro de su interfaz.

• Otra novedad (y que no tiene ni Google ni Yahoo!) es el operador contains: lo que hace es buscar sitios Web que contengan vínculos a la extensión del nombre del archivo que se ha especificado.

• MSN Search Local, en fase beta.

• Búsquedas agrupadas (o Search Result Clustering): es unproyecto del laboratorio de investigación de Asia, según indica labarra de título de la dirección http://rwsm.directtaps.net, que enrealidad también funciona con una barra de herramientas). Se tratacomo es lógico de un proyecto en fase beta o preliminar.

CARACTERÍSTICAS DE BÚSQUEDA

30

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• La sindicación RSS es otra aportación que ofrece esterenovado buscador, con el popular icono “ ”, a diferenciade Yahoo!, que requeriría el uso de un script para suvisualización.

• Otra novedad es un 'busca-imágenes', localizable enwww.picsearch.com, gracias a la adquisición de esaempresa. Se verá con el tiempo cómo lo integran.

• Interfaz agradable y para refinar resultados contiene un menúdesplegable que hay en el botón "Generador de búsqueda"(que equivale a la búsqueda avanzada).

• Lo superficial está cubierto con un diseño mediocre pero bienaccesible y usable; las novedades superaron las expectativasque se tenían puestas.

31

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

* INTEGRACIÓN:

– Las novedades que trae en su interfaz y en los resultados, los pierde en supunto fuerte: La "integración" con las "propiedades" de Microsoft. Digo, integralos resultados con el "Desktop" pero para eso hay que instalar la MSNToolbar; integra resultados en el MSN Messenger, pero para eso hay queconfigurarlo, etc.

– Pero lo realmente interesante es que por ejemplo, se busca, What isMichelangelos known for? y sí, algunas cosas hay que probarlas en ingles y laprimer respuesta es: Por pintar la capilla sixtina.

– MSN Search lleva a cabo la ideología EEE (embrace, extend and extinguish),tan característica de ellos y llevada a su máxima expresión.

– Al menos la conversión a CSS y XHTML de MSN sirve como un argumentosólido para intentar fomentar los estándares, pues todavía hay mucharesistencia entre los usuarios.

32

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• En la web del portal MSN existe una ayuda bastante interesante a tener encuenta de cara al posicionamiento, y en la que se invita a aplicar unassugerencias que podrán ayudar a MSNBot (que es lógicamente como se llamael rastreador de Microsoft) y a otros rastreadores Web para indizar y clasificartu sitio eficazmente. Además, proporcionan una lista de elementos y técnicasrecomendados por MSN Search, como hace también Yahoo! y Google.

• No hay mucha información sobre cada cuánto tiempo rastrea MSN la Web, haymucha contradicción al respecto, pero todo parece indicar que lo estánhaciendo últimamente con bastante cierta frecuencia.

• De todas formas, según hemos podido ver en las prácticas de la asignaturatroncal "Técnicas y métodos avanzados en recuperación de información", MSNsale mal parado tanto en valor medio aproximado de la efectividad de larecuperación de información (medida de Borko, aplicando I0=E + P) como en lasimilitud, con un 74% de resultados iguales aplicando en el mismo motor unabúsqueda con 'intersección' y otra con 'intersección+frase literal'.

RASTREO

33

5. DESARROLLO5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Según indica su ayuda, "no existe la posibilidad de pagar paraaumentar la relevancia de tu sitio en la clasificación", sino que serealiza de forma totalmente automatizada.

• El algoritmo de clasificación de MSN Search analiza factorescomo el contenido de las páginas, la cantidad y calidad de lossitios que tienen vínculos con nuestras páginas y la relevanciadel contenido de tu sitio con respecto a palabras clave. Se tratade un algoritmo complejo y sin intervención humana.

• Para más información sobre posicionamiento visitar su sitio deayuda en español en http://search.msn.es/docs/default.aspx?FORM=HLHP.

34

5. DESARROLLO5.3. COMPARATIVA DE S.V.A.

LEYENDA:E-mail (1), barra de herramientas (2), directorio de catálogos de pedidos (3), servicio de alertasde páginas afines a un criterio de búsqueda (4), noticias de actualidad en tiempo real (5),gestor de grupos -o listas de correo- (6), traductor multilingüe (7), servicio de bitácoras (8),gestor de historiales de búsquedas (9), servicio de expertos -consultoría de recursosdigitales- (10), códigos abiertos API (11), sistema (programa) de mensajería instantánea (12),barra en escritorio de búsqueda de contenido (13), representación de callejeros y mapas (14),búsqueda local (15), búsqueda en libros (16), acelerador web (17), servicios online desdemóvil, PDA o PocketPC (18), buscador de productos comerciales con comparación de preciospara cada tienda virtual (19), personalización del portal (20), búsqueda personalizada segúnperfiles de interés (21), generador de términos de búsqueda taxonómicos (22) y sugerenciasde búsqueda en tiempo real (23).

Nota: Datos a fecha de julio de 2005.

35

LEYENDA:Búsqueda agrupada -clustering- (1), búsqueda por frase literal (2), páginas caché (3),búsqueda de imágenes (4), búsqueda de vídeos (5), búsqueda por formato (6), búsqueda portruncamiento -o de exactitud- (7), búsquedas por operadores posicionales y/o por campos (8),influencia o sensibilidad en los resultados a las tildes (9), directorio Web (10), soporte parcialde indexación SWF o tecnología multimedia Flash (11), calculadora (12), búsqueda contextual(13), sugerencias de búsquedas alternativas o relacionadas (14), búsqueda estilo glosario, dediccionario o enciclopedia (15), búsqueda por códigos especiales de patentes (16), páginassimilares (17), refinamiento -búsqueda sobre resultados- (18), esquema jerárquico (19),búsquedas numeradas (20), búsqueda por expresiones regulares (o por patrones) (21),corrector ortográfico (22), soporte o implementación de RSS (23), filtro de búsqueda segura(24), clasificación de resultados por diferentes criterios combinados (25), búsquedas desinónimos (26) y URL's adicionales de un dominio (27).

Nota: Datos a fecha de julio de 2005.

5. DESARROLLO5.4. COMPARATIVA DE CARACTERÍSTICAS DE BÚSQUEDA

36

Las empresas de Internet se encuentran en un mundo muy dinámico y un mercadomuy cambiante, con la imparable adquisición de nuevas empresas y más con lasalida a Bolsa del gigante Google, que es de las que más cotizan. Ya se sabe, si nose puede con el enemigo, lo mejor es unirse a él (si se deja).

Trayectora de crecimiento de la empresa determina muchas veces que se veamermada la calidad de muchos productos/servicios.

La competencia beneficia al usuario final, salvo cuando no se establecen los límites yse descontrola la adquisición de empresas. Todo tiene un límite.

Tendencia a la integración de servicios en un solo portal; plataformas engloban aotras.

Pese a la competencia, aunque admitan sugerencias de los usuarios, lasestadísticas “ciegan”: no dejan ver la realidad de las cosas, se centran más en elmercado que en los propios usuarios.

Tecnología incierta, pendiente de madurar.

En indexación queda aún mucho camino por recorrer, debido a la amplia variedad deformatos existentes y tecnologías con protección, que es el caballo de la batalla y elquid de la cuestión.

6. CONCLUSIONES (I)

37

Los buscadores deben prepararse para la Web semántica -como de hecho ya loestán haciendo, aunque sin prisa, por haber tecnologías que primero deben madurar,como ya señalaba-, el futuro de la actual Web, pero aún queda mucho camino porrecorrer.

Portalización de los buscadores, gran transformación experimentada en los últimosaños. Necesidad de poner orden y concierto a las APIs creadas.

Cada empresa improvisa su prioridad lanzando o respondiendo enfoques de ideas,aunque no sean originales y tardías por centrarse en otras parcelas.

Juegan con la ley de la ventaja e intentan cubrirse huecos y complementarse paraintentar ganar terreno a corto plazo constituyendo para el usuario un valor añadido.

Preferencia del internauta del “buscador” frente al ‘directorio’.

Proliferación en cadena de los laboratorios de investigación de estas empresas adisposición del usuario para productos/servicios en fase beta.

6. CONCLUSIONES (II)

38

Exceso de lanzamientos de nuevos servicios en versiones beta. Lanzamientosapresurados con tal de no quedarse atrás y ser el pionero en Nuevas Tecnologías.Yahoo subcontrata para no llamar beta a sus productos pero Google no aplica tantoel “outsourcing” y echa manos de recursos propios; de ahí, su tardanza muchasveces. Aunque Google cuenta con un gran equipo.

Necesidad de dotación de mayor infraestructura y personal debido al aumento denúmero de internautas y poder satisfacer demandas de los usuarios a través decanales de comunicación.

Blogs para divulgar sus avances de laboratorio y lanzamientos experimentales o no.

Yahoo y Microsoft se lo piensan más a la hora de ofertar nuevos servicios y lanzanversiones de nuevas funcionalidades en varios idiomas. El idioma influye en el gradode desarrollo respecto a la prestación de servicios y en la actualización decontenidos, que es discontinua por no sincronizarse las versiones de distintosidiomas de un mismo portal. Y no olvidemos el tema de la censura en China.

Se van acortando distancias entre los tres gigantes. Supremacía clara de Googlecada vez menos evidente, aunque siendo el rey indiscutible.

6. CONCLUSIONES (III)

39

Surgen motores de búsqueda revolucionarios, alternativos a Google con algoritmosinnovadores, con criterios de valoración diferentes al Page Rank. Veremos lo queduran estas páginas como Ask Jeeves y Clusty, por citar sólo unos ejemplos.

Resultados de búsqueda procedentes de diferentes bases de datos en algunoscasos, como Altavista, debido a la compra de empresas, patentes y tecnologías.

La Web 2.0 va a ocasionar un terrible duelo entre estos tres titanes. Y esto sóloacaba de empezar, ¿quién sabe cómo acabará, si las tecnologías se interconectaráno no, o simplemente cambiará de nombre y filosofía? Por ejemplo Flickr de Yahoo!está ganando terreno claramente en número de registros a Orkut de Google.

El espionaje e intereses ocultos son posibles, pese a muchas cláusulas que leamos ydemás letra pequeña. Somos marionetas frente a esas empresas.

Se percibe claramente las intenciones de hacerse con el control de la Web(anárquica hasta ahora y esperemos que dure), cuando la Web no pertenece anadie, al mismo tiempo que no debe ser censurada. Finalmente, se observa que todosea hace por número de registros, visitas y por su propio beneficio; de ahí que afilensus armas y cada vez hayan menos diferencias en las características de búsqueda.

6. CONCLUSIONES (IV)

40

Unas cuantas citas (las tres últimas personales) para finalizar:1. En la Internet empresarial quien golpea primero, por lo general, golpea dos veces.2. Si el príncipe esclarecido y el general competente derrotan al enemigo cada vez

que pasan a la acción, si sus hazañas se salen fuera de lo común es gracias a la información previa. Sun Tzu. ‘El arte de la Guerra’, s. VI a.C.

3. Como regla general la persona más exitosa en la vida es aquella que tiene la mejorinformación. Benjamín Disraeli.

4. La mejor fuente de información son las personas que juran no contarlo a nadie.Anónimo.

5. En un futuro la sociedad se dividirá en dos partes: las que están informatizadas ylas que no.

6. Internet es la Tercera Revolución Industrial y tan sólo depende de ti formar parte de la historia.

(fin del mensaje).

6. CONCLUSIONES (V)En fin, de momento, que no se tambalee Google (que su aparición ya de por sí ha supuestouna auténtica revolución en la Red y para nuestras vidas), porque nos tambalearemostodos, pero que tampoco se lo crean, que no es bueno para que prospere la calidad de suíndice, que todavía puede mejorar y mucho. Eso sí, temblemos porque Google amenazacon seguir acaparándolo todo, y sobre todo las editoriales y sociedades de autores.En definitiva, que si es bueno, perdure, ya habrá tiempo de ver lo que nos depara el futuro.

41

Nota: Las referencias se han realizado siguiendo la norma internacional ISO 690-2para publicaciones electrónicas, que constituyen el tipo de fuentes de informaciónempleadas en este trabajo. He hecho una selección de las fuentes más consultadas,aunque no sea del todo exhaustiva.

Google [en línea]. EEUU. <http://www.google.com/options/> [Consulta: 14 abril 2005].

Labs Google [en línea]. EEUU. <http://labs.google.com> [Consulta: 5 mayo 2005].

Yahoo! [en línea]. EEUU. <http://www.yahoo.com> [Consulta: 14 abril 2005].

MSN Sandbox [en línea]. EEUU. <http://sandbox.msn.com> [Consulta: 11 junio 2005].

Google Blog [en línea]. EEUU. <http://googleblog.blogspot.com> [Consulta: 8 mayo 2005].

Yahoo! Search blog [en línea]. EEUU. <http://www.ysearchblog.com> [Consulta: 8 mayo 2005].

msnsearch's WebLog [en línea]. EEUU. <http://blogs.msdn.com/msnsearch/> [Consulta: 8 mayo 2005].

7. REFERENCIAS (I)

42

Search Engine Watch: Tips About Internet Search Engines & Search Engine Submission [en línea]. EEUU. <http://searchenginewatch.com> [Consulta: 14 abril 2005].

Search Engine Optimization (SEO) Resources in the Yahoo! Directory [en línea]. EEUU. <http://dir.yahoo.com/Computers_and_Internet/Internet/World_Wide_Web/Site_Announcement_and_Promotion/Search_Engine_Optimization__SEO_> [Consulta: 4 febrero 2005].

Googledirson [en línea]. España. <http://google.dirson.com> [Consulta: 5 marzo 2005].

Tramullas.com [en línea]. España. <http://www.tramullas.com> [Consulta: 2 julio 2005].

Posicionamiento en buscadores: guía básica [en línea]. EEUU. <http://www.guia-buscadores.com/posicionamiento/> [Consulta: 12 mayo 2005].

Recuperación de Información en la Web [en línea]. España. <http://irsweb.blogspot.com> [Consulta: 30 mayo 2005].

Google Blogoscoped [en línea]. EEUU. <http://blog.outer-court.com> [Consulta: 12 mayo 2005].

7. REFERENCIAS (II)

43

Barrapunto: La información que te interesa [en línea]. España. <http://www.barrapunto.com> [Consulta: 10 mayo 2005].

El Blog de Enrique Dans [en línea]. España. <http://www.enriquedans.com> [Consulta: 12 junio 2005].

Google Community [en línea]. EEUU. <http://www.googlecommunity.com> [Consulta: 17 mayo 2005].

Deakialli DocuMental [en línea]. España. <http://deakialli.bitacoras.com> [Consulta: 30 mayo 2005].

Métodos de busca: Cómo buscar información en Internet [en línea]. España. <http://www.metodosdebusca.com> [Consulta: 1 junio 2005].

Error500 [en línea]. España. <http://www.error500.net> [Consulta: 3 abril 2005]. Trucos de Google - buscadores y gestión documental [en línea]. España.

<http://trucosdegoogle.blogspot.com> [Consulta: 17 mayo 2005]. Denken Über [en línea]. España. <http://www.uberbin.net> [Consulta: 4 marzo

2005].

7. REFERENCIAS (III)

«Batalla entre los majors:análisis de la lucha por la primacía en la Web»

Universidad de Murcia, 2005Departamento de Información y Documentación

Facultad de Comunicación y Documentación

Proyecto Fin de Carrera dirigido por el Dr. D. Francisco Javier Martínez Méndez

Muchas Gracias a todos