de l’usage de la plateforme Éruditcongrescpi.com/wp-content/uploads/2016/11/cpi2016_af... ·...
TRANSCRIPT
-
1. CONTEXTE 2. MÉTHODE
Sarah Cameron-Pesant1, Yorrick Jansen2 et Vincent Larivière3
1 Université de Montréal, École de bibliothéconomie et des sciences de l’information, 3150 Jean-Brillant, H3T 1N8, Montréal, QC. 2 1science, 3863 boul. St-Laurent, suite 206, H2W 1Y1, Montréal, QC. 3 Université de Montréal, École de bibliothéconomie et des sciences de l’information, C.P. 6128, succ. Centre-Ville, H3C 3J7, Montréal, QC et Université du
Québec à Montréal, Centre Interuniversitaire de Recherche sur la Science et la Technologie (CIRST), Observatoire des Sciences et des Technologies (OST), C.P. 8888, succ. Centre-Ville, H3C 3P8, Montréal, QC.
SI ( le référent est vide ET aucune image n’est téléchargée ET l’adresse IP télécharge plus de
100 articles savants / jour )OU ( aucun JavaScript n’est téléchargé ET aucune feuille CSS n’est téléchargée ET l’adresse IP télécharge plus de
100 articles savants / jour )ALORS considère l’adresse IP comme un robot
• Modèle commercial de la publication savante : situation oligopolistique liée à l’avènement du numérique
• Problèmes de couverture en sciences sociales et humaines (SSH) dans les grandes bases de données, en particulier pour les langues autres que l’anglais
• Importance des revues locales et nationales pour les SSH, notamment au Québec et au Canada qui publient beaucoup dans ces disciplines
• Création de la plateforme Érudit en 1998 pour donner une plus grande visibilité aux revues franco-canadiennes en SSH
• Revues diffusées en libre accès différé (période d’embargo de 2 ans), mais certaines en libre accès complet
• Notre projet de recherche : étude exploratoire de l’usage de la plateforme Érudit basée sur l’indicateur bibliométrique des données de téléchargements
1. Réfléchir aux enjeux méthodologiques liés à l’analyse des données de téléchargements, ainsi qu’aux avantages et limites de ce nouvel indicateur
2. Étudier l’impact du passage au libre accès sur l’usage des articles de la collection d’Érudit
4. DISCUSSION
• Source des données : 91 016 articles provenant de 106 revues savantes en sciences sociales et humaines (SSH) de la collection d’Érudit
• Logs de serveurs du 1er avril 2010 au 31 décembre 2015 • Nettoyage des données pour identifier les téléchargements d’articles
de revues savantes (plein texte)
• Géolocalisation des usagers grâce aux adresses IP
3. RÉSULTATS
Nombre de requêtes HTTP dans les fichiers de logs 999 367 190
Pourcentage de requêtes HTTP qui réfèrent à des articles savants ( et )
10,34 %
Pourcentage de requêtes HTTP qui réfèrent à des articles savants ( seulement)
3,95 %
Nombre total de téléchargements d’articles savants par des
39 437 659
Références Boismenu, G. et Beaudry, G. (2002). Le nouveau monde numérique : le cas des revues universitaires. Montréal :
Presses de l’Université de Montréal. Geens, N., Huysmans, J. et Vanthienen, J. (2006). Evaluation of web robot discovery techniques: a
benchmarking study. Dans P. Perner (dir.), Advances in data mining: applications in medicine, web mining, marketing, image and signal mining (p. 121‑130). Springer Berlin Heidelberg. Repéré à http://link.springer.com/chapter/10.1007/11790853_10
IDATE et Cairn Info. (2015). L’open access et les revues SHS de langue française : tendances du secteur, environnement réglementaire et perspectives 2018. Repéré à http://www.openaccess-shs.info/wp-content/uploads/2015/10/Etude-IDATE-CAIRN-INFO-20151002.pdf
Larivière, V., Gingras, Y. et Archambault, É. (2008). Long-term variations in the aging of scientific literature: from exponential growth to steady-state science (1900-2004). Journal of the American Society for Information Science and Technology, 59(2), 288‑296. doi:10.1002/asi.20744
Moed, H. F. et Halevi, G. (2016). On full text download and citation distributions in scientific-scholarly journals. Journal of the Association for Information Science and Technology, 67(2), 412‑431. doi:10.1002/asi
Wang, X., Xu, S., Peng, L., Wang, Z., Wang, C., Zhang, C. et Wang, X. (2012). Exploring scientists’ working timetable: do scientists often work overtime? Journal of Informetrics, 6(4), 655‑660. doi:10.1016/j.joi.2012.07.003
De l’usage de la plateforme Érudit :Que révèlent les téléchargements?
Figure 4. Nombre moyen de téléchargements par article pour les revues en libre accès différé et les revues en libre accès complet selon le continent. Échantillon d’articles mis en ligne en 2011 (fin de l’embargo en 2013).
Pays % d’articles téléchargés
Canada 29,42 %
France 22,63 %
États-Unis 6,43 %
Chine 4,72 %
Algérie 4,32 %
Maroc 3,47 %
Allemagne 3,27 %
Belgique 2,71 %
Tunisie 1,81%
Royaume-Uni 1,56 %
Villes % d’articles téléchargés
Montréal 11,92 %
Québec 5,03 %
Shenzhen 3,75 %
Paris 3,45 %
Ottawa 2,33 %
Gatineau 1,65 %
Sherbrooke 1,48 %
Toronto 1,01 %
Laval 1,01 %
Chicago 0,89 %
Tableaux 1 et 2. Les 10 pays et villes qui téléchargent le plus.
Impact du libre accès
• Technique de détection de robots pour exclure les téléchargements de robots d’indexation & se comportant comme des humains :
(tous services)
Search
Images
Scholar
• La majorité des téléchargements proviennent du Canada, de la France et des États-Unis, ou de pays d’Europe de l’Ouest et d’Afrique du Nord.
• L’âge moyen des articles téléchargés est de 15 ans, ce qui montre que l’obsolescence des publications en SSH est plus lente que celle des sciences naturelles et génie.
• Près de 60 % des téléchargements sont en provenance de l’un des services de Google (importance de l’indexation).
• Au Canada, les usagers semblent être des étudiants de 1er cycle universitaire, tandis qu’en France et aux États-Unis, il semble plutôt s’agir de chercheurs.
• Le passage au libre accès, pour les revues soumises à une période d’embargo, a un impact positif sur les téléchargements.
• Les revues en libre accès complet ont un nombre moyen de téléchargements par article plus élevé que celles en accès différé pendant 3 ou 4 ans après la mise en ligne. Malgré qu’elles soient souvent plus récentes, les revues sans embargo ont un net avantage sur les autres.
.
.
sous embargo libre accès
n = 39 436 791
n = 29 951 265
n = 19 318 374
n = 1 083 019
n = 38 901 921
n = 26 852 807