bucear y encontrar en internet
DESCRIPTION
tutorial sobre conceptos basicos de internetTRANSCRIPT
tuto
rial
es
de
la b
ibli
ote
ca
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
ldquoir a lo digital caracteriza nuestro fin de siglordquo
Nicholas Negroponte
nunca antes tanta informacioacuten ha sido accesible desde muacuteltiples plataformas
ldquohellipsi nos remontamos a un antildeo tan reciente como 1985 apenas nadie en el mundo habriacutea predicho el alcance mundial de Internet ni habriacutea sido tan audaz para pensar que se convertiriacutea en el motor principal de
desarrollo econoacutemicordquo
Rodney A Brooks Director del Laboratorio de Inteligencia Artificial del MIT
ldquonuevas tecnologiacuteas alteradoras sobreviven con celeridad creciente y cambian fundamentalmente las reglas de los juegos sociales con los que operamos No sienten respeto por tradiciones y praacutecticas y se introducen en nuestras vidas cada vez con mayor insistenciahelliprdquo
nuevos conceptoshellipque nos suenan a todos
bullinfosociedad
bullinfoestructura
bullsociedad informacional
bullsociedad red
bullinterconectividad
bulltecnocultura
bullciberespacio
bullnetcultura
pero tambieacuten hablamos de
exclusioacuten digital
brecha digital
informaacutetica de la dominacioacuten
alfabetizacioacuten informacional
bullAlfabetizacioacuten en herramientas conocimiento y uso de
las herramientas de TI
bullAlfabetizacioacuten en recursos conocimiento de las formas
y meacutetodos de acceso a los recursos informacionales
bullAlfabetizacioacuten socio-estructural comprensioacuten de la
situacioacuten social y de produccioacuten de la informacioacuten
bullAlfabetizacioacuten investigadora uso de TI para la
investigacioacuten y el trabajo acadeacutemico
bullAlfabetizacioacuten en las tecnologiacuteas incipientes
capacidad para comprender las innovaciones en TI y para
tomar decisiones inteligentes
bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma
criacutetica los beneficios y costes de las TI
Shapiro y Hughes
la biblioteca de la Universidad de Jaeacuten
estaacute comprometida con el
concepto de alfabetizacioacuten digital
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
ldquoir a lo digital caracteriza nuestro fin de siglordquo
Nicholas Negroponte
nunca antes tanta informacioacuten ha sido accesible desde muacuteltiples plataformas
ldquohellipsi nos remontamos a un antildeo tan reciente como 1985 apenas nadie en el mundo habriacutea predicho el alcance mundial de Internet ni habriacutea sido tan audaz para pensar que se convertiriacutea en el motor principal de
desarrollo econoacutemicordquo
Rodney A Brooks Director del Laboratorio de Inteligencia Artificial del MIT
ldquonuevas tecnologiacuteas alteradoras sobreviven con celeridad creciente y cambian fundamentalmente las reglas de los juegos sociales con los que operamos No sienten respeto por tradiciones y praacutecticas y se introducen en nuestras vidas cada vez con mayor insistenciahelliprdquo
nuevos conceptoshellipque nos suenan a todos
bullinfosociedad
bullinfoestructura
bullsociedad informacional
bullsociedad red
bullinterconectividad
bulltecnocultura
bullciberespacio
bullnetcultura
pero tambieacuten hablamos de
exclusioacuten digital
brecha digital
informaacutetica de la dominacioacuten
alfabetizacioacuten informacional
bullAlfabetizacioacuten en herramientas conocimiento y uso de
las herramientas de TI
bullAlfabetizacioacuten en recursos conocimiento de las formas
y meacutetodos de acceso a los recursos informacionales
bullAlfabetizacioacuten socio-estructural comprensioacuten de la
situacioacuten social y de produccioacuten de la informacioacuten
bullAlfabetizacioacuten investigadora uso de TI para la
investigacioacuten y el trabajo acadeacutemico
bullAlfabetizacioacuten en las tecnologiacuteas incipientes
capacidad para comprender las innovaciones en TI y para
tomar decisiones inteligentes
bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma
criacutetica los beneficios y costes de las TI
Shapiro y Hughes
la biblioteca de la Universidad de Jaeacuten
estaacute comprometida con el
concepto de alfabetizacioacuten digital
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
ldquohellipsi nos remontamos a un antildeo tan reciente como 1985 apenas nadie en el mundo habriacutea predicho el alcance mundial de Internet ni habriacutea sido tan audaz para pensar que se convertiriacutea en el motor principal de
desarrollo econoacutemicordquo
Rodney A Brooks Director del Laboratorio de Inteligencia Artificial del MIT
ldquonuevas tecnologiacuteas alteradoras sobreviven con celeridad creciente y cambian fundamentalmente las reglas de los juegos sociales con los que operamos No sienten respeto por tradiciones y praacutecticas y se introducen en nuestras vidas cada vez con mayor insistenciahelliprdquo
nuevos conceptoshellipque nos suenan a todos
bullinfosociedad
bullinfoestructura
bullsociedad informacional
bullsociedad red
bullinterconectividad
bulltecnocultura
bullciberespacio
bullnetcultura
pero tambieacuten hablamos de
exclusioacuten digital
brecha digital
informaacutetica de la dominacioacuten
alfabetizacioacuten informacional
bullAlfabetizacioacuten en herramientas conocimiento y uso de
las herramientas de TI
bullAlfabetizacioacuten en recursos conocimiento de las formas
y meacutetodos de acceso a los recursos informacionales
bullAlfabetizacioacuten socio-estructural comprensioacuten de la
situacioacuten social y de produccioacuten de la informacioacuten
bullAlfabetizacioacuten investigadora uso de TI para la
investigacioacuten y el trabajo acadeacutemico
bullAlfabetizacioacuten en las tecnologiacuteas incipientes
capacidad para comprender las innovaciones en TI y para
tomar decisiones inteligentes
bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma
criacutetica los beneficios y costes de las TI
Shapiro y Hughes
la biblioteca de la Universidad de Jaeacuten
estaacute comprometida con el
concepto de alfabetizacioacuten digital
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
nuevos conceptoshellipque nos suenan a todos
bullinfosociedad
bullinfoestructura
bullsociedad informacional
bullsociedad red
bullinterconectividad
bulltecnocultura
bullciberespacio
bullnetcultura
pero tambieacuten hablamos de
exclusioacuten digital
brecha digital
informaacutetica de la dominacioacuten
alfabetizacioacuten informacional
bullAlfabetizacioacuten en herramientas conocimiento y uso de
las herramientas de TI
bullAlfabetizacioacuten en recursos conocimiento de las formas
y meacutetodos de acceso a los recursos informacionales
bullAlfabetizacioacuten socio-estructural comprensioacuten de la
situacioacuten social y de produccioacuten de la informacioacuten
bullAlfabetizacioacuten investigadora uso de TI para la
investigacioacuten y el trabajo acadeacutemico
bullAlfabetizacioacuten en las tecnologiacuteas incipientes
capacidad para comprender las innovaciones en TI y para
tomar decisiones inteligentes
bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma
criacutetica los beneficios y costes de las TI
Shapiro y Hughes
la biblioteca de la Universidad de Jaeacuten
estaacute comprometida con el
concepto de alfabetizacioacuten digital
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
pero tambieacuten hablamos de
exclusioacuten digital
brecha digital
informaacutetica de la dominacioacuten
alfabetizacioacuten informacional
bullAlfabetizacioacuten en herramientas conocimiento y uso de
las herramientas de TI
bullAlfabetizacioacuten en recursos conocimiento de las formas
y meacutetodos de acceso a los recursos informacionales
bullAlfabetizacioacuten socio-estructural comprensioacuten de la
situacioacuten social y de produccioacuten de la informacioacuten
bullAlfabetizacioacuten investigadora uso de TI para la
investigacioacuten y el trabajo acadeacutemico
bullAlfabetizacioacuten en las tecnologiacuteas incipientes
capacidad para comprender las innovaciones en TI y para
tomar decisiones inteligentes
bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma
criacutetica los beneficios y costes de las TI
Shapiro y Hughes
la biblioteca de la Universidad de Jaeacuten
estaacute comprometida con el
concepto de alfabetizacioacuten digital
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
alfabetizacioacuten informacional
bullAlfabetizacioacuten en herramientas conocimiento y uso de
las herramientas de TI
bullAlfabetizacioacuten en recursos conocimiento de las formas
y meacutetodos de acceso a los recursos informacionales
bullAlfabetizacioacuten socio-estructural comprensioacuten de la
situacioacuten social y de produccioacuten de la informacioacuten
bullAlfabetizacioacuten investigadora uso de TI para la
investigacioacuten y el trabajo acadeacutemico
bullAlfabetizacioacuten en las tecnologiacuteas incipientes
capacidad para comprender las innovaciones en TI y para
tomar decisiones inteligentes
bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma
criacutetica los beneficios y costes de las TI
Shapiro y Hughes
la biblioteca de la Universidad de Jaeacuten
estaacute comprometida con el
concepto de alfabetizacioacuten digital
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
bullAlfabetizacioacuten en herramientas conocimiento y uso de
las herramientas de TI
bullAlfabetizacioacuten en recursos conocimiento de las formas
y meacutetodos de acceso a los recursos informacionales
bullAlfabetizacioacuten socio-estructural comprensioacuten de la
situacioacuten social y de produccioacuten de la informacioacuten
bullAlfabetizacioacuten investigadora uso de TI para la
investigacioacuten y el trabajo acadeacutemico
bullAlfabetizacioacuten en las tecnologiacuteas incipientes
capacidad para comprender las innovaciones en TI y para
tomar decisiones inteligentes
bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma
criacutetica los beneficios y costes de las TI
Shapiro y Hughes
la biblioteca de la Universidad de Jaeacuten
estaacute comprometida con el
concepto de alfabetizacioacuten digital
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
la biblioteca de la Universidad de Jaeacuten
estaacute comprometida con el
concepto de alfabetizacioacuten digital
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
imprescindible algunos conceptos claveshellip
incluida un poco de
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
queacute es Internet
bull Un inmenso conjunto de redes de
ordenadores que se encuentran
interconectadas entre siacute dando lugar a la
mayor red de redes de aacutembito mundial
bull Un fenoacutemeno sociocultural de importancia
creciente una nueva forma de entender
las comunicaciones que estaacute transformando el mundo
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
4 adjetivos
bull grande la mayor red de redes de ordenadores del
mundo (y la que maacutes deprisa crece)
bull cambiante en continua adaptacioacuten a las nuevas
necesidades y circunstancias
bull diversa da cabida a todos los equipos fabricantes
redes tecnologiacuteas y medios fiacutesicos de transmisioacuten
usuarios etc
bull descentralizada no existe una autoridad central es
una ldquounioacuten cooperativardquo en la que cada una de las
miles de redes conectadas conserva su independencia
aunque hay unas normas y procedimientos comunes
que garantizan la intercomunicacioacuten
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo
hay maacutes cosas ahiacute dentro
las cosas permanentemente cambianhellip
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Internet la tribu planetaria
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
coacutemo y cuaacutendo
Internet que se originoacute en el aacutembito militar durante
la guerra friacutea se habiacutea desarrollado maacutes allaacute de
los propoacutesitos originales como resultado de su uso
por parte la comunidad cientiacutefica internacional
que necesitaba nuevos sistemas de distribucioacuten
de la informacioacuten
en el principio fue un desarrollo del Departamento de
Defensa USAhellipy estamos en los
antildeos 60
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
A finales de la deacutecada de los ochenta la
interconexioacuten de miles de redes de aacuterea
local habiacutea convertido Internet en el mayor
almaceacuten de datos que jamaacutes hubiese
existido pero tambieacuten en el maacutes caoacutetico
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Raacutepido barato y sin control
el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip
el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip
convertido en el lema de habituales de Internet y que explica el
crecimiento explosivo de la red
FAST CHEAP AND OUT OF CONTROL
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
coacutemo funciona
La caracteriacutestica primordial de Internet es la de ser
un sistema universal de comunicaciones capaz de
acomodar la maacutes absoluta diversidad
El aglutinante es el conjunto de normas y
lenguajes comunes de comunicacioacuten entre
sistemas conocido como familia de protocolos
TCPIP que permiten la transmisioacuten de datos
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Este nombre geneacuterico engloba maacutes de 100
normas o protocolos abiertos que se han
convertido en estaacutendar ldquode factordquo Cada uno da
solucioacuten a un aspecto especiacutefico
Su nombre hace referencia a los dos protocolos
maacutes importantes
-IP (Internet Protocol) transmite los datos de un
lugar a otro de forma fragmentada (en
paquetes)
-TCP (Transmission Control Protocol) asegura
una comunicacioacuten segura y fiable
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Entre estos 100 muchos nos son familiares
bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web
bullFTP (File Transfer Protocol) para transferencia de archivos
bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico
bullTELNET para acceder a equipos remotos
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
la arquitectura de la red
Sigue el modelo cliente-servidor un
paradigma de divisioacuten del trabajo
informaacutetico en el que las tareas se reparten
entre un nuacutemero de clientes que efectuacutean
peticiones de servicios de acuerdo con un
protocolo y un nuacutemero de servidores que
las atienden
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
explorando Internet
Se ha buscado formas de estructurar el inmenso volumen de
informacioacuten distribuido en miles de nodos de la red
bullGopher servicio de informacioacuten sobre los recursos de
Internet organizado en miles de servidores interconectados
La informacioacuten se presenta clasificada por tipos y accesible
mediante menuacutes jeraacuterquicos
bullWAIS realiza buacutesquedas por contenidos en grandes
documentos textuales o bases de datos
bullWWW (World Wide Web) integra todo lo anterior
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
novedades conceptuales hipertexto hipermedia
bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para
referirse a un cuerpo de material escrito o graacutefico
interconectado de un modo complejo que no se puede
representar convenientemente sobre el papel puede
contener anotaciones adiciones y notas de los estudiosos
que lo examinanrdquo Era el tiempo del proyecto Xanaduacute
bullLa idea es que el lector examina los nodos de una red y
pasa de unos a otros siguiendo las conexiones (links en
ingleacutes) El hecho de que los nodos pueden contener texto
pero tambieacuten pueden integrar otros medios imagen
sonido etc es lo que se quiere remarcar con otro teacutermino
complementario `hipermedia
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
El proyecto Xanaduacute de Ted Nelson
cambiariacutea el modo de almacenar
clasificar y pagar la informacioacuten
Habriacutea que esperarhellipXanaduacute no
llegoacute a aplicaciones praacutecticas
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Estas nuevas tecnologiacuteas permitiraacuten la idea de
una red de elementos de informacioacuten
libremente accesible alrededor del mundo y
seraacute posible en la World-Wide-Web
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Internet como telarantildea
el World-Wide-Web
El proyecto World-Wide-Web del CERN dirigido
por Tim Berners-Lee supone otra vuelta de
tuerca en el intento de poner efectivamente al
alcance de los usuarios el espacio virtual de
conocimiento que es Internet un interface
unificado para el acceso a informacioacuten
distribuida
CERN Organizacioacuten Europea para la Investigacioacuten Nuclear
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
World-Wide-Web (abreviado `Web escrito
tambieacuten `WWW o incluso `W3) significa algo
asiacute como `red (o telarantildea) global La
propaganda oficial del CERN lo define como
un sistema hipermedia distribuido En
principioacute se pensoacute como un medio para la
distribucioacuten de la informacioacuten entre equipos
de investigadores geograacuteficamente
dispersos concretamente se dirigiacutea a la
comunidad de fiacutesicos de altas energiacuteas
vinculados al CERN
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Se pretendiacutea que los recursos disponibles
en formato electroacutenico que residen en
ordenadores distintos conectados a la red
fuesen accesibles para cada investigador
desde su terminal de forma transparente
y exento de dificultades sin necesidad de
aprender a utilizar varios programas
distintos Ademaacutes deberiacutea posibilitarse el
salto entre elementos de informacioacuten
conexos Los recursos existentes
deberiacutean integrarse en una red
hipertextual distribuida gestionada por
ordenadores
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Gracias a una diseminacioacuten
relampagueante de tecnologiacuteas y
protocolos el mundo gozoacute de
repente de acceso instantaacuteneo a
cualquier tipo de informacioacuten
Todo esto hace que cambie el
grado de mediacioacuten humana para
obtener acceso a la informacioacuten
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
la explosioacuten Web
Las primeras instalaciones del WWW para
uso interno del CERN estuvieron listas en
1991 Ese mismo antildeo el sistema se abrioacute ya
a Internet
El eacutexito del WWW el crecimiento de la
telarantildea ha sido espectacular
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar
saltos hipertextuales Este protocolo se denomina HTTP (HyperText
Transfer Protocol) y es el lenguaje que hablan los servidores del
WWW
Inventar una lengua para representar hipertextos que incluyera
informacioacuten sobre la estructura y el formato de representacioacuten y
especialmente indicar origen y destino de saltos hipertextuales Este
lenguaje es el HTML o (HyperTextex Markup Language)
Desarrollar aplicaciones cliente (navegadores) para todo tipo de
plataforma y resolver el problema de coacutemo acceder a informacioacuten
que estaacute almacenada y es accesible a traveacutes de protocolos diversos
(FTP HTTPTELNET etc) y representar informacioacuten multiformato
(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer
Mozilla
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
quieacuten no conoce estos logos
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
pero no son los uacutenicoshellipcomo por ejemplo
Opera browser noruegohellip
Estaacute disponible para Windows Mac OS X GNULinux OS2
Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera
Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de
pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por
uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y
Wii Se ha anunciado igualmente que el navegador estaraacute
disponible para televisores y reproductores DVD
Flock especializado en el suministro de redes sociales y otros
como la Web 20 que trabaja con caracteriacutesticas incluidas en
su interfaz de usuario
El navegador se basa en coacutedigo Firefox de Mozilla
El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute
que el navegador Flock sustituiraacute a Firefox como navegador
principal
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
las URLs
URL significa Localizador Uniforme de
Recursos es parecido a una direccioacuten
electroacutenica pero contienen informacioacuten
adicional
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Permite que el navegador la encuentre y la
muestre de forma adecuada
Por ello la URL combina el nombre del ordenador
que proporciona la informacioacuten el directorio
donde se encuentra el nombre del fichero y el
protocolo a usar para recuperar los datos
httpeswikipediaorgwikiPortada ftp mail telnet
El formato general de un URL es protocolomaacutequinadirectoriofichero
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
los dominios
Un dominio de Internet es un nombre base
que agrupa a un conjunto de equipos o
dispositivos
httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio
Veamos la diferencia entre una URL y un nombre de dominio
Cada nombre de dominio termina en un Dominio de nivel superior que es
siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes
caracteres) o un coacutedigo territorial de dos caraacutecteres
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
ejemplos de dominios de nivel superior
geograacuteficos
ejemplos de dominios de nivel superior geneacutericos
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada
Access mdb Legacy chp Office Writer ow4
AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3
ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr
ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf
Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf
DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid
dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb
dBXL dbf Microsoft Multiplan cod col PostScript ps
DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp
DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf
Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2
First Choice ss fol Microsoft Windows Works dbf Reflex r2d
Flash swf Microsoft Windows Write wri Samna Word sam
FoxBase dbf Microsoft Word doc SmartWare II doc db ws
Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr
Freelance prz pre Microsoft WordPad doc SuperCalc cal
Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw
HTML html htm asp shtml nsf MSG msg Unicode Text txt
IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf
IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4
IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks
Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp
JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc
WordPerfect wp wp5 wpd pln shw wbk wkb wpf
WordStar ws ws2 wsd ws4 ws6
XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
listos para navegar
El WWW nos ofrece hipertextos nodos de la
telarantildea global Las palabras subrayadas y las
imaacutegenes recuadradas son links que nos
conducen a otros nodos Para viajar hasta ellos
basta situarse con el ratoacuten sobre el link y pulsar
el botoacuten
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
de doacutende obtenemos informacioacuten hoyhellip
buscadores el 85 de los internautas comienzan por ahiacute (Michael K
Bergman The Deep Web Surfacing Hidden Value - 2003)
bases de datos
sitios especializados o portales dedicados
revistas cientiacuteficas
sitios integradores
blogs
redes sociales
hellip
una tendencia cumplida
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
explosioacuten informativa en la web
Para organizar la masa de informacioacuten se vienen
desarrollando herramientas documentales que
pretenden hacer posible una recuperacioacuten
raacutepida efectiva y eficiente de la informacioacuten
Son sistemas IR conocidos como buscadores
absolutamente imprescindibles a la hora de
movernos por la red
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es
por poner ejemplos obvios y los nuacutemeros cantanhellip
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
conociendo la existencia de lo ocultohellip
bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas
bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la
web diferentes tipo de archivos
2Internet en uno que suman 7500 terabytes de informacioacuten
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
hasta el infinito y maacutes allaacute
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
olas enormes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
alturas infinitas
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
asiacute las cosas la te recomienda
cosas que debemos saber
sobre los buscadores
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
aprender a buscar
Es necesario definir una estrategia correcta perder
un poco de tiempo y pensar queacute opciones seguir
1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)
2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)
3 Extraer palabras clave para expresar la buacutesqueda
4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
definir claramente iquestQUEacute se busca aprender a formular la pregunta
definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text
coacutemo empezamoshellip
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento
1 definir criterios baacutesicos
bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten
2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
los buscadores
2 tipos 2 filosofiacuteas
bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)
bull motores de buacutesqueda (buscadores por contenido)
bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas
bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en
concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que
presentan estos sistemas de recuperacioacuten de informacioacuten
directorios versus motores
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios
directorios
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
motores
Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos
No existe por tanto clasificacioacuten jeraacuterquica
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
metabuscadores
Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)
No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo
Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
es un metabuscador que interroga filtra y ordena
resultados de otros buscadores Desde su servicio de
buacutesqueda avanzada podremos obtener los diferentes
buscadores con los que trabaja Su caracteriacutestica maacutes
resentildeable como metabuscador es su capacidad para
estructurar y agrupar los resultados por categoriacuteas
temaacuteticas o clustering
Otro detalle destacable es que realiza buacutesquedas en la
Wikipedia una enciclopedia universal de acceso libre
aunque Clusty soacutelo tiene en cuenta su edicioacuten en
ingleacutes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Kartoo est un meacutetamoteur de recherche qui preacutesente ses
reacutesultats sous la forme dune carte
Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse
interroge les moteurs de recherche les plus pertinents
seacutelectionne pour vous les sites concerneacutes et vous les livre sous
la forme dune carte
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
en cualquier caso hay que tener en cuenta las limitaciones
bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)
bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
siempre teniendo presente que
Los buscadores NO VEN toda la web su visioacuten es muy limitada
Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
desarrollo de nuevas capacidades
3 liacuteneas claras de investigacioacuten
bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)
traduccioacuten
bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores
bull Mejora de los criterios de relevancia
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
se impuso desde el principio no soacutelo por
la relevancia de los resultados ofrecidos
como buscador sino tambieacuten por su
disentildeo austero y simplicidad de uso
1995 la fecha
Sergey Brin Larry Page los
nombres
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Noticias
Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google
vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia
respecto a sus competidores Los resultados expresados en porcentaje son
Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)
Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado
interesante es el crecimiento de Teoma (08)
una tendencia reconocida
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en
un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo
despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas
bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo
bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se
registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado
bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un
Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
hoy por
hoy
una industria ramificada
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a
partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de
informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias
que alertaban sobre la violacioacuten de la privacidad de los usuarios
el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs
y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados
ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente
la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Google Docs y Hojas de caacutelculo oficialmente Google Docs amp
Spreadsheets es un programa gratuito basado en Web para crear
documentos en liacutenea con la posibilidad de colaborar en grupo
Incluye un Procesador de textos una Hoja de caacutelculo Programa
de presentacioacuten baacutesico y un editor de formularios destinados a
encuestas
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Tambieacuten es famoso su programa Google Earth mapamundi en 3D
con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite
mapas y el motor de buacutesqueda de Google
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
34 compantildeiacuteas apoyan Android pero los primeros
terminales no apareceraacuten hasta mediados de 2008
El Paiacutes Madrid - 05112007
Google crea la
primera
plataforma de
coacutedigo abierto
para la
telefoniacutea moacutevil
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
En septiembre de 2008 lanzan un
navegadorhelliprdquoreiventando la ruedardquo
desde acuerdos con Mozilla
compitiendo con MS IExplorerhellip
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
y maacuteshellip
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
en constante desarrollohellip
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
que cotiza en bolsa
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
con la que estaacute cayendohellip
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
PageRank
el secreto estaacute en el ranking
Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas
Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B
Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
bull Mantiene todas las ventajas de un robot de
buacutesqueda automaacutetica (consigue rastreos muy
amplios) pero intenta eliminar el problema de
informacioacuten de baja calidad
bull Aplica como criterio principal para ordenar los
resultados el criterio de cita bibliograacutefica y no el
nuacutemero de veces que una palabra clave se
repite en una paacutegina (por ejemplo)
bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Son los propios usuarios de internet
mediante sus particulares selecciones de
paacuteginas favoritas en cada momento
quienes determinan el orden en que
apareceraacuten los resultados al realizar una
buacutesqueda
En teoriacutea los resultados de este buscador son siempre de
calidad y actuales
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
buacutesqueda avanzada en Google
se trata de establecer filtroshelliptodos los que creas oportunos
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
tiene capacidad para localizar una gran variedad de
documentos en diferentes formatos A modo de ejemplo
podemos realizar una consulta de contenidos que
contengan la palabra ldquogerontologiacuteardquoen formato ppt
(presentacioacuten Power) y en dominios es
El formulario de buacutesqueda avanzada en Google soacutelo
permite restringir las pesquisas a unos pocos formatos
Es recomendable realizar la consulta desde la paacutegina
inicial escribiendo en la caja de buacutesqueda mediante la
sentencia filetype y el formato de archivo
correspondiente obtendremos los resultados deseados
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
se trata de establecer filtroshelliptodos los que creas oportunos
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
o buscar de forma raacutepida definicioneshellip
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Un directorio de
direcciones de
sitios web
donde miles de
usuarios hacen
de editores
clasificando y
manteniendo
actualizadas las
direcciones y
descripciones
del mismo
Colaboran de
forma
desinteresada
maacutes de 46000
personas de
todo el mundo y
hay clasificados
maacutes de 3
millones de
sitios web
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Open Archives Initiative httpwwwopenarchivesorg
Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica
poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica
que se genera en las diferentes universidades y organismos de
investigacioacuten de todo el mundo
Es una alternativa o complemento al sistema tradicional de
comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales
comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de
publicar sus trabajos en entornos que posibiliten la visibilidad e
intercambio con los colegas para mejorar la investigacioacuten
progreso y difusioacuten del conocimiento
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Budapest Open Access Initiative
En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se
acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde
se promueven dos estrategias para hacer frente a los retos de la publicacioacuten
cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios
institucionales e impulsar las publicaciones especializadas de acceso abierto
Ejemplos
bull PLos acceso libre a revistas de fiacutesica y medicina
bull PubMed Central
bull BioMed Central
bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades
bull CogPrints psicologiacutea
bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)
bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas
bull e-revistas de Tecnociencia
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
icono de Google books
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
La Blogosfera es una gran
globo bien inflado pero un
globo
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
linkesfera de la blogesfera
blogger blogging blogia blogalia
bloglines webblog bitaacutecorahellip
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
por no seguir hablandohellip
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
hay soluciones para todo hellip o casi todo
No abandoneshellip
tambieacuten en internet
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Deteccioacuten de errores
Servicio de traduccioacuten
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟
De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con
la definicioacuten que Google hace de la palabra bdquointernet‟
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Maacutes
Servicio de respuestas
personalizadas
Se tata de un servicio pago a traveacutes
del cual los ldquoclientesrdquo del buscador
pueden lanzar una pregunta a un
grupo de expertos
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
si buscas imaacutegenes y tienes problemas con los idiomashellip
realmente tienes un problema
multibuscador
porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a
buscar el buscador ofrece un listado de diferentes idiomas con la
traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone
opciones para determinar el sentido correcto que deseamos en nuestra pesquisa
en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas
la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo
completordquohellipy conocer de queacute dimensiones hablamos en cada caso
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)
permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)
Los resultados nos devuelven las imaacutegenes en el tamantildeo original
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Un nuevo producto de Google que permite personalizar al maacuteximo
todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado
Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor
de buacutesqueda circunscrito a un soacutelo dominio
buscadores a medidahellip
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip
ejemplos son
- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc
- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de
paacuteginas en su Base de Datos
- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil
millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y
noticias
- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de
paacuteginas indexadas
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan
pone a Yahoo por encima de Google en el 2007
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Scirus buscador especiacutefico de informacioacuten cientiacutefica
por cierto podemos optar por buscadores especializadoshellip
productor de la base de datos ScienceDirect
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
buacute
sq
ue
da
ava
nza
da
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Todo esto hay que tenerlo en cuenta ya que Google a
pesar de tener la mayor base de datos de paacuteginas en la
web y de poseer una relevancia adecuada sufre de un
defecto grave sigue devolviendo demasiados resultados y
por tanto es difiacutecil clasificar la informacioacuten
una nueva generacioacuten de motores que
pretende resolver este problema
todo un oceacuteano de opciones
abiertas para estudiarhellip
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
por ciertohellipquieacuten haya comprado
un ordenador con hellip
se encontraraacute con
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
el mundo de los buscadores no es paciacuteficohellip
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
la web semaacutentica
Web extendida
y maacuteshellip
httpwwww3ces
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante
si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004
para referirse a una segunda generacioacuten en la historia de
la Web basada en comunidades de usuarios y una gama
especial de servicios como las redes sociales los blogs
los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten
y el intercambio aacutegil de informacioacuten entre los usuarios
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
A globally linked database
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad
todos hemos leiacutedo previsiones de un futuro incierto del tipo
ldquoInternet podriacutea colapsar Y eso seriacutea antes de que
termine 2007rdquo
Las razones son bastantes sencillas seguacuten las
principales consultoras como Deloitte Consulting el
crecimiento del nuacutemero de usuarios y de dispositivos
de acceso a la red estaacuten poniendo al liacutemite su
capacidadrdquo
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
YouTube estaacute sirviendo al diacutea 40 millones de
viacutedeos lo que supone unos 200 terabytes de
datos es decir aproximadamente 200000
gigashellip
maacutes de un tercio de todo el traacutefico de internet son
aplicaciones de viacutedeo y audio que consumen
mucho ancho de banda Los nuevos protocolos
de viacutedeo y voz requieren cada vez maacutes calidad y
maacutes ancho de banda
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
htt
p
ww
winte
rnet2
edu
buscando nuevos paradigmashellip In
tern
et2
(I2
) (u
niv
ers
idades a
mericanas)
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
GEacuteANT es la red de Investigacioacuten
pan-Europea de alta velocidad
maacutes de 3000 centros de investigacioacuten de
32 paiacuteses
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
htt
p
ww
wg
eant
net
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo
httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes
httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538
ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet
que inventaron y que utiliza el comuacuten de los mortales Por eso desde
mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado
sus propias redes de comunicacioacuten una especie de Internet paralela
Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de
la actual Internet comercial En Europa recibe el nombre de GEacuteANT y
en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)
Disponible en
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
htt
p
ww
wg
ea
nt2
ne
t
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes
universidad de jaeacuten
vicerrectorado de extensioacuten universitaria
biblioteca infobibujaenes