apprehender les ressources numeriques en ligne. le biais de la navigation sociale
DESCRIPTION
Le biais de la navigation sociale comme moyen de trouver l'information autrement.TRANSCRIPT
Appréhender les ressources numériques en ligne
Le biais de la navigation sociale
Loïc Le Roux
CDDP d’Indre et Loire
avril 2009
Appréhender les ressources numériques en ligne
2
Trouver des ressources sur Internet :
trois problématiques importantes Problématique « technique »
(Taille du Web, Web visible vs invisible, Typologie des outils …).
Problématique « socio-technique » (Usages des outils et du Web documentaire …).et aussi « techno-sociale » : outils développés pour répondre à un besoin communautaire (Twitter, Flickr …)
Problématique pédagogique(Didactisation de la recherche, méthodologie et culture de l’information…).
Appréhender les ressources numériques en ligne
3
1. Problématique « technique »
Définition de l’Internet et mise au point préalable :
Internet (1969) est différent du Web (1990)
La recherche sur le Web n’est donc pas uniquement réductible à la recherche sur Internet. Exemple : une « ressource » peut être une adresse mel ou une réponse sur un forum.
Internet = un réseauLe WWW = du contenu
Appréhender les ressources numériques en ligne
4
1.1 La taille de Web [visible]
Une étude de l’université de l’Iowa évalue en janvier 2005 la taille du Web indexable (ou Web de surface) à 11,5 milliards de pages (« seulement » 2,5 milliards en sept. 2001).
http://www.cs.uiowa.edu/~asignori/web-size/
Une autre étude plus récente de février 2007 parle de 29,7 milliards de pages.Ce qu’il faut retenir : Chiffres à prendre comme ordre de grandeur : la taille du Web s’accroît de manière exponentielle (« infobésité »).
Appréhender les ressources numériques en ligne
5
1.2 Web visible & Web invisible
Le Web dit visible est accessible aux outils de recherche alors que le Web invisible ou profond (deep Web) ne l’est pas.
Une étude de sept. 2001 réalisée par l'entreprise BrightPlanet estime que le Web profond pouvait contenir 500 fois plus de ressources que le Web indexé par les moteurs de recherche.
Appréhender les ressources numériques en ligne
6
1.3 Typologies et caractéristiques des outils de recherche
Trois types d’outils de recherche classiques :
Moteur (Google, Yahoo, Live, Exalead, AV …) Métamoteur (Dogpile, Vivisimo, Kartoo …) Annuaire (ODP…).
Nécessité de comprendre comment ces outils fonctionnent pour mieux s’en servir (cf. Bruillard, 2000 et la problématique pédagogique).
Appréhender les ressources numériques en ligne
7
Principe d’un moteur de recherche
Appréhender les ressources numériques en ligne
8
Principe d’un métamoteur
Appréhender les ressources numériques en ligne
9
Principe d’un annuaire
Appréhender les ressources numériques en ligne
10
1.4 Un taux de recouvrement faible des moteurs de recherche
« Les moteurs de recherche ne travaillent pas que sur le même segment du Web, et quand ils sont sur la même portion, leurs algorithmes classent les pages et les restituent souvent, de manière radicalement différente » (BNF).
Même base = résultats différents
Exemple sur : http://ranking.thumbshots.com/
Appréhender les ressources numériques en ligne
11
Google vs YahooÉquation = didactique des sciences « cycle3 »
Appréhender les ressources numériques en ligne
12
Autre exemple de recouvrement
Les résultats de recherche – pour une grande majorité - sur Google, Yahoo, MSN et Ask Jeeves sont différents. Une étude récente montre que seulement 1.1% des résultats sur la première page de ces quatre principaux moteurs sont identiques (étude portant 485 460 premières pages).
Etude sur Dogpile (2005).
Appréhender les ressources numériques en ligne
13
Recouvrement des premières pages de résultats : Google, Yahoo, MSN, Ask
Appréhender les ressources numériques en ligne
14
Appréhender les ressources numériques en ligne
15
Moteurs et clusterisation :une approche « lexico-sémantique »
Clusterisation : structuration automatique des résultats d’un moteur en présentant d’autres pistes de recherche reliées plus ou moins sémantiquement en vue d'affiner une nouvelle requête. Altavista le faisait déjà en 1996 : fonction refine puis Live Topics.
La catégorisation dynamique représente un facteur positif pour les recherches documentaires chez les élèves (désambiguïsation ).
Appréhender les ressources numériques en ligne
16
Rappel : Altavista (fonction refine)
Pour une recherche sur Bill Clinton, nous avions (en 1997) :
71% Clinton, presidential, president, campaign, candidates40% Republican, republicans, dole, democrats, gop,
gingrich, democratic, newt, bob22% Reform, welfare, illegal, immigrants, families,
immigration, recipients, poverty, afdc18% Hillary, governor, clintons, whitewater, rodham,
arkansas, scandal, starr, mcdougal
Vous pouviez alors choisir de rechercher à nouveau, cette fois en additionnant ou en excluant un terme.
Appréhender les ressources numériques en ligne
17
Moteurs de catégorisation actuels
Exalead, Vivisimo, Clusty, Aol Recherche et … Google ?
Appréhender les ressources numériques en ligne
18
Appréhender les ressources numériques en ligne
19
2. Problématique « socio-technique»
La réalité sociale du web compte aujourd’hui près d’un milliard d’internautes (Nielsen 2005, cf. Affordance).
L’outil de recherche se situe au carrefour de plusieurs mondes avec des logiques différentes : celui des concepteurs et des développeurs (orientations technologique et commerciale), celui des contenus de données (orientations documentaire et commerciales) et celui des comportements, des représentations et des appropriations des usagers (orientations socio-technique et commerciale).Au cours d’une recherche documentaire, ces mondes s’interfèrent ce qui crée des usages hybrides entre appropriation technologique et pratique sociale dans les apprentissages.
Appréhender les ressources numériques en ligne
20
Le cadre socio-technique de toute recherche documentaire
« Intégrer dans une même analyse technique et société, sans choisir un terme au détriment de l’autre (…) Il ne s’agit pas d’articuler seulement deux pôles : technique et société, mais de voir comment interfèrent de nombreux mondes sociaux, ceux des ingénieurs et des usagers, des industriels, des exploitants de services, des réparateurs, des commerçants, etc.» .
Flichy (2003). L’innovation technique : récents développements en sciences sociales. Ed. de la Découverte.
Appréhender les ressources numériques en ligne
21
2.1 Caractéristiques socio-techniques de Google
« Le résultat sans doute le plus frappant est le degré de satisfaction très médiocre des utilisateurs. Pour les meilleurs moteurs (Yahoo, Google), la note moyenne sur le premier écran de 10 résultats atteint à peine 2,3 sur une échelle de 0 à 5. […] Enfin, on remarquera que rien dans cette étude ne permet d’expliquer la préférence massive des internautes pour le moteur Google, puisque, globalement Google et Yahoo ont des performances à peu près équivalentes, et se détachent de leurs concurrents. Il faut donc supposer que les raisons en sont autres que des critères de pure pertinence des résultats ». (Véronis, 2006)
Appréhender les ressources numériques en ligne
22
Google : un outil technologique et social à la fois (PageRank)
PageRank est l’indice de popularité d'une page Web, calculé selon un algorithme sophistiqué, élaboré par Google.
L'algorithme PageRank fait partie des critères utilisés pour déterminer le positionnement (ranking) des pages dans Google. Ainsi, pour deux pages aux contenus comparables, celle ayant le meilleur PageRank sera souvent classée devant, surtout pour les requêtes très concurrentielles.
Une explication en français :
http://www.webmaster-hub.com/publication/L-algorithme-du-PageRank-explique.html
Appréhender les ressources numériques en ligne
23
La « sagesse » de Google
"La sagesse des foules fonctionne étonnamment bien. Les systèmes qui marchent sur le web fonctionnent du bas vers le haut ('bottom-up'). (...) Par exemple Flickr ne dit pas à ses utilisateurs quel tag utiliser pour leurs photos. Loin de là. N'importe qui peut déposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la clé - Flickr offre un retour sur les tags les plus utilisés et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement à utiliser ce lexique si celui-ci fait sens. Cela rend le système étonnamment stable. Del.icio.us fait la même chose. Le succès de Google pour rendre les recherches plus pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)… » Adam Bosworth (2004)
Appréhender les ressources numériques en ligne
24
De la « sagesse populaire » …… à la dépendance technologique
La sagesse populaire de Google est-elle possible pour la recherche de documents « académiques » ? Entre notoriété et autorité, la confusion existe (idem entre affluence et influence et entre publicité et légitimité).
L’omniprésence (omnipotence ?) de l’utilisation de cet outil génère-t-il une captation technologique et intellectuelle de tout acte de recherche ? Si oui … Le recoupement de l’information n’existe plus… La réflexion sur l’utilisation de l’outil le plus
adéquat non plus … Google devient la seule perception du Web …
Appréhender les ressources numériques en ligne
25
Appréhender les ressources numériques en ligne
26
Lecture des résultats sur Google
Une étude de l'enregistrement des mouvements de l'œil (oculométrie ou eye tracking) révèle la présence d'un « triangle d’or ». Ce triangle symbolise une zone spatiale parcourue par les internautes sur la première page des résultats. Il représente surtout la visibilité des sites sur le moteur (importance stratégique pour le Web marchand).
Le triangle est d'or parce qu'il se révèle être l'endroit où 100% des usagers regardent. Les zones rouges représentent les endroits ou l'œil s’arrête le plus souvent.
… Ce qui n'est pas dans Google n'existe pas …
Appréhender les ressources numériques en ligne
27
Appréhender les ressources numériques en ligne
28
Appréhender les ressources numériques en ligne
29
Enquiro Eye Tracking Report II :
Appréhender les ressources numériques en ligne
30
…Vers un monde selon Google ?
Appréhender les ressources numériques en ligne
31
2.1 Un cas classique de recherche (élève)… Un seul outil (Google pour + 90 %) : dépendance et captation Très peu de mots-clés (deux en moyenne) : champ lexical très
pauvre Une interface de recherche simple Pas de reformulation du sujet si mauvais résultats Une lecture très linéaire des résultats (cf. « triangle d’or ») Un découragement rapide + faible motivation Un attrait des TIC sans passer par la documentation classique
(i.e. support papier).
Cf. Perriault (2002). L’accès au savoir en ligne
Appréhender les ressources numériques en ligne
32
… pour un résultat incertain et non probant … Des pages prises dans le « triangle d’or » Un site jugé pertinent par son temps de réponse Un site jugé pertinent par son ergonomie Parfois une sur-utilisation peu efficace du Web par les
utilisateurs réguliers (Tricot) Une perte de temps et un coût cognitif trop élevé par rapport à
l’objectif initial (risque de surcharge mentale dû à une trop grande sollicitation de l’outil et/ou de l’interface).
Cf. André Tricot. Apprentissages et documents numériques. Belin, 2007.
Appréhender les ressources numériques en ligne
33
3. Problématique pédagogique : quelques pistes
D’abord définir qu’est-ce que nous entendons par le mot ressource ? Toujours expliciter(Polysémie du mot ; que voulons-nous ? Que cherchons-nous ? Profondeur de l’information…)
Méthode(s) de recherche (pédagogie procédurale)(Existe-t-il une méthode générale de questionnement et de recherche documentaire ?)
Répondre au mieux au besoin informationnel (Le besoin informationnel comme représentation informationnelle d’un problème décisionnel).
Appréhender les ressources numériques en ligne
34
3.1 Qu’est ce qu’une ressource ?
Polysémie : cf. TLFI
Appréhender les ressources numériques en ligne
35
Définition d’une ressource
Étymologie du latin : "resurgere" se relever, se rétablir, reprendre des forces ; puis issu du verbe "resourdre" rejaillir, se rétablir, rétablir.
La ressource est proprement une seconde ou dernière source, une chose qui relève, un moyen qui fait sortir d'embarras. (XML Littré)
Appréhender les ressources numériques en ligne
36
Définition de la ressource numérique
Définition : tout composant d'un système. En informatique et en multimédia, 3 types de ressources sont distinguées : les ressources humaines, matérielles et logicielles : ressources humaines : programmeur spécialisé, vidéaste,
ingénieur du son, graphiste, réalisateur, ressources matérielles : unité centrale (processeur, mémoire
centrale, cartes), unités périphériques (d'extension de mémoire, de communication),
ressources logicielles : système d'exploitation et système d'exploitation.
(Educnet)
Appréhender les ressources numériques en ligne
37
3.2 De la méthodologie … à une ‘méthode’
Il existe de nombreux sites sur la méthodologie documentaire (tous les SCD en disposent en général).
Par exemple :
http://www.uhb.fr/scd/Methodoc_accueil.html
http://castore.univ-nantes.fr/didacticiel/
Voir aussi : Cerise, Sapristi ou Repere …
Appréhender les ressources numériques en ligne
38
Trouver une méthode satisfaisante (malgré l’incomplétude) pour
Réduire le coût cognitif de toute recherche
(compréhension de la question, procédures de recherche, sélection, validation : « la charge cognitive imposée par de nombreuses stratégies de résolution des problèmes gêne l'apprentissage, tout en n’empêchant pas d’atteindre la solution du problème ». [Tricot, 1998])
Réduire le temps de cette recherche (démotivation). Augmenter le rapport qualité /temps /coût
Appréhender les ressources numériques en ligne
39
Exemples de recherche (problématique récurrente des ressources en adéquation avec le public)
Trouver un document sur la production d’électricité lisible en cycle 3 (= pour des élèves de cycle 3)
Le traitement de l’eau (pour des élèves de cycle 3)
Les peintures préhistoriques (pour des élèves de collège)
Chercher des albums de jeunesse pour cycle 1 où des notions de SVT sont implicitement présentes (évaporation, ombre, gravitation, biologie, etc.) = travail de sciences à partir de littérature jeunesse.
Appréhender les ressources numériques en ligne
40
Pistes 1/2 : survalorisation technique
Ce qui rend une recherche difficile est peut-être la manière dont l’outil est pensé : omnipotence du moteur (i.e. de la technologie) pour trouver une information.
Appréhender les ressources numériques en ligne
41
Pistes 2/2 : médiation sociale
L’outil est essentiel mais pas forcément indispensable pour trouver directement l’information (i.e. la ressource numérique) il peut servir à pointer (indirectement) où peut se trouver cette information par le biais d’un vecteur social (la communauté ici).
Appréhender les ressources numériques en ligne
42
Le cas de la Préhistoire
Je cherche un document sur la taille de la pierre et l’habitat néolithique en Asie mineure et en Europe.
Recherchons sur un site ressource sur le domaine en s’aidant par la même occasion d’un moteur . Voir ainsi dans celui-ci un outil permettant de trouver un repère d’autorité informationnelle sur le Web (musée, association, organisme…).
Appréhender les ressources numériques en ligne
43
La communauté éducative comme ressource pédagogique
Un constat : difficulté de contextualiser une demande sur un moteur + difficulté de trouver une document par niveau pour faire une séquence.
La communauté peut servir d’outil pour trouver l’information pertinente : c’est le principe de la navigation sociale (via une « communauté de pratique »). Par recommandation des pairs ou de personnes autorisées …
Appréhender les ressources numériques en ligne
44
Créer une « navigation sociale »
Se tenir au courant = pratiquer une veille informationnelle.
Connaître des gisements de ressources « humaine », papier et numérique.
La navigation sociale : définition
La navigation sociale sur Internet est une manière de naviguer en prenant en compte l'avis des autres.
C'est une technique relationnelle qui juge d’une information en tenant compte de sa notoriété ou de la notoriété de l'auteur qui donne l'information. Cf. Wikipedia
Appréhender les ressources numériques en ligne
45
Appréhender les ressources numériques en ligne
46
Pratiquer une veillehttp://www.defidoc.com/publications/dossierspecial_veille.htm
Listes de discussion (ex. : listes du CRU) Lettres de diffusion (ex. : Café pédagogique) Alertes mel (ex. : Vigilibris) Twitter (ex. de Twitter docaucentre en Infodoc) Flux RSS (ex. : Netvibes cddp37) Portails & sites ressources Annuaires professionnels (ex. : La porte des Lettres) Partage de signets (ex. : del.icio.us ; diigo …) Sites de communautés d’usage (ex. : Etoody) Veille (classique) : périodiques …
Appréhender les ressources numériques en ligne
47
Pour conclure (trop rapidement …)
« La nouvelle fracture numérique n'est donc pas entre ceux qui peuvent s'offrir les machines et les services et ceux qui ne le peuvent pas, mais entre ceux qui savent les utiliser à leur avantage et ceux qui sont victimes de la sur-information. Ce n'est pas un problème entre ceux qui ‘possèdent’ et les autres, mais entre ceux qui "savent" et les autres ».
Howard Rheingold