de l’usage de la plateforme Éruditcongrescpi.com/wp-content/uploads/2016/11/cpi2016_af... ·...

1
1. CONTEXTE 2. MÉTHODE Sarah Cameron-Pesant 1 , Yorrick Jansen 2 et Vincent Larivière 3 [email protected] 1 Université de Montréal, École de bibliothéconomie et des sciences de l’information, 3150 Jean-Brillant, H3T 1N8, Montréal, QC. 2 1science, 3863 boul. St-Laurent, suite 206, H2W 1Y1, Montréal, QC. 3 Université de Montréal, École de bibliothéconomie et des sciences de l’information, C.P. 6128, succ. Centre-Ville, H3C 3J7, Montréal, QC et Université du Québec à Montréal, Centre Interuniversitaire de Recherche sur la Science et la Technologie (CIRST), Observatoire des Sciences et des Technologies (OST), C.P. 8888, succ. Centre-Ville, H3C 3P8, Montréal, QC. SI ( le référent est vide ET aucune image n’est téléchargée ET l’adresse IP télécharge plus de 100 articles savants / jour ) OU ( aucun JavaScript n’est téléchargé ET aucune feuille CSS n’est téléchargée ET l’adresse IP télécharge plus de 100 articles savants / jour ) ALORS considère l’adresse IP comme un robot Modèle commercial de la publication savante : situation oligopolistique liée à l’avènement du numérique Problèmes de couverture en sciences sociales et humaines (SSH) dans les grandes bases de données, en particulier pour les langues autres que l’anglais Importance des revues locales et nationales pour les SSH, notamment au Québec et au Canada qui publient beaucoup dans ces disciplines Création de la plateforme Érudit en 1998 pour donner une plus grande visibilité aux revues franco-canadiennes en SSH Revues diffusées en libre accès différé (période d’embargo de 2 ans), mais certaines en libre accès complet Notre projet de recherche : étude exploratoire de l’usage de la plateforme Érudit basée sur l’indicateur bibliométrique des données de téléchargements 1. Réfléchir aux enjeux méthodologiques liés à l’analyse des données de téléchargements, ainsi qu’aux avantages et limites de ce nouvel indicateur 2. Étudier l’impact du passage au libre accès sur l’usage des articles de la collection d’Érudit 4. DISCUSSION Source des données : 91 016 articles provenant de 106 revues savantes en sciences sociales et humaines (SSH) de la collection d’Érudit Logs de serveurs du 1 er avril 2010 au 31 décembre 2015 Nettoyage des données pour identifier les téléchargements d’articles de revues savantes (plein texte) Géolocalisation des usagers grâce aux adresses IP 3. RÉSULTATS Nombre de requêtes HTTP dans les fichiers de logs 999 367 190 Pourcentage de requêtes HTTP qui réfèrent à des articles savants ( et ) 10,34 % Pourcentage de requêtes HTTP qui réfèrent à des articles savants ( seulement) 3,95 % Nombre total de téléchargements d’articles savants par des 39 437 659 Références Boismenu, G. et Beaudry, G. (2002). Le nouveau monde numérique : le cas des revues universitaires. Montréal : Presses de l’Université de Montréal. Geens, N., Huysmans, J. et Vanthienen, J. (2006). Evaluation of web robot discovery techniques: a benchmarking study. Dans P. Perner (dir.), Advances in data mining: applications in medicine, web mining, marketing, image and signal mining (p. 121130). Springer Berlin Heidelberg. Repéré à http:// link.springer.com/chapter/10.1007/11790853_10 IDATE et Cairn Info. (2015). L’open access et les revues SHS de langue française : tendances du secteur, environnement réglementaire et perspectives 2018. Repéré à http://www.openaccess-shs.info/wp-content/ uploads/2015/10/Etude-IDATE-CAIRN-INFO-20151002.pdf Larivière, V., Gingras, Y. et Archambault, É. (2008). Long-term variations in the aging of scientific literature: from exponential growth to steady-state science (1900-2004). Journal of the American Society for Information Science and Technology, 59(2), 288296. doi:10.1002/asi.20744 Moed, H. F. et Halevi, G. (2016). On full text download and citation distributions in scientific-scholarly journals. Journal of the Association for Information Science and Technology, 67(2), 412431. doi:10.1002/asi Wang, X., Xu, S., Peng, L., Wang, Z., Wang, C., Zhang, C. et Wang, X. (2012). Exploring scientists’ working timetable: do scientists often work overtime? Journal of Informetrics, 6(4), 655660. doi:10.1016/j.joi. 2012.07.003 De l’usage de la plateforme Érudit : Que révèlent les téléchargements? Figure 4. Nombre moyen de téléchargements par article pour les revues en libre accès différé et les revues en libre accès complet selon le continent. Échantillon d’articles mis en ligne en 2011 (fin de l’embargo en 2013). Pays % d’articles téléchargés Canada 29,42 % France 22,63 % États-Unis 6,43 % Chine 4,72 % Algérie 4,32 % Maroc 3,47 % Allemagne 3,27 % Belgique 2,71 % Tunisie 1,81% Royaume-Uni 1,56 % Villes % d’articles téléchargés Montréal 11,92 % Québec 5,03 % Shenzhen 3,75 % Paris 3,45 % Ottawa 2,33 % Gatineau 1,65 % Sherbrooke 1,48 % Toronto 1,01 % Laval 1,01 % Chicago 0,89 % Tableaux 1 et 2. Les 10 pays et villes qui téléchargent le plus. Impact du libre accès Technique de détection de robots pour exclure les téléchargements de robots d’indexation & se comportant comme des humains : (tous services) Search Images Scholar La majorité des téléchargements proviennent du Canada, de la France et des États-Unis, ou de pays d’Europe de l’Ouest et d’Afrique du Nord. L’âge moyen des articles téléchargés est de 15 ans, ce qui montre que l’obsolescence des publications en SSH est plus lente que celle des sciences naturelles et génie. Près de 60 % des téléchargements sont en provenance de l’un des services de Google (importance de l’indexation). Au Canada, les usagers semblent être des étudiants de 1 er cycle universitaire, tandis qu’en France et aux États- Unis, il semble plutôt s’agir de chercheurs. Le passage au libre accès, pour les revues soumises à une période d’embargo , a un impact positif sur les téléchargements. Les revues en libre accès complet ont un nombre moyen de téléchargements par article plus élevé que celles en accès différé pendant 3 ou 4 ans après la mise en ligne. Malgré qu’elles soient souvent plus récentes, les revues sans embargo ont un net avantage sur les autres. . . sous embargo libre accès n = 39 436 791 n = 29 951 265 n = 19 318 374 n = 1 083 019 n = 38 901 921 n = 26 852 807

Upload: others

Post on 20-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 1. CONTEXTE 2. MÉTHODE

    Sarah Cameron-Pesant1, Yorrick Jansen2 et Vincent Larivière3

    [email protected]

    1 Université de Montréal, École de bibliothéconomie et des sciences de l’information, 3150 Jean-Brillant, H3T 1N8, Montréal, QC. 2 1science, 3863 boul. St-Laurent, suite 206, H2W 1Y1, Montréal, QC. 3 Université de Montréal, École de bibliothéconomie et des sciences de l’information, C.P. 6128, succ. Centre-Ville, H3C 3J7, Montréal, QC et Université du

    Québec à Montréal, Centre Interuniversitaire de Recherche sur la Science et la Technologie (CIRST), Observatoire des Sciences et des Technologies (OST), C.P. 8888, succ. Centre-Ville, H3C 3P8, Montréal, QC.

    SI ( le référent est vide ET aucune image n’est téléchargée ET l’adresse IP télécharge plus de

    100 articles savants / jour )OU ( aucun JavaScript n’est téléchargé ET aucune feuille CSS n’est téléchargée ET l’adresse IP télécharge plus de

    100 articles savants / jour )ALORS considère l’adresse IP comme un robot

    •  Modèle commercial de la publication savante  : situation oligopolistique liée à l’avènement du numérique

    •  Problèmes de couverture en sciences sociales et humaines (SSH) dans les grandes bases de données, en particulier pour les langues autres que l’anglais

    •  Importance des revues locales et nationales pour les SSH, notamment au Québec et au Canada qui publient beaucoup dans ces disciplines

    •  Création de la plateforme Érudit en 1998 pour donner une plus grande visibilité aux revues franco-canadiennes en SSH

    •  Revues diffusées en libre accès différé (période d’embargo de 2 ans), mais certaines en libre accès complet

    •  Notre projet de recherche  : étude exploratoire de l’usage de la plateforme Érudit basée sur l’indicateur bibliométrique des données de téléchargements

    1.  Réfléchir aux enjeux méthodologiques liés à l’analyse des données de téléchargements, ainsi qu’aux avantages et limites de ce nouvel indicateur

    2.  Étudier l’impact du passage au libre accès sur l’usage des articles de la collection d’Érudit

    4. DISCUSSION

    •  Source des données : 91 016 articles provenant de 106 revues savantes en sciences sociales et humaines (SSH) de la collection d’Érudit

    •  Logs de serveurs du 1er avril 2010 au 31 décembre 2015 •  Nettoyage des données pour identifier les téléchargements d’articles

    de revues savantes (plein texte)

    •  Géolocalisation des usagers grâce aux adresses IP

    3. RÉSULTATS

    Nombre de requêtes HTTP dans les fichiers de logs 999 367 190

    Pourcentage de requêtes HTTP qui réfèrent à des articles savants ( et )

    10,34 %

    Pourcentage de requêtes HTTP qui réfèrent à des articles savants ( seulement)

    3,95 %

    Nombre total de téléchargements d’articles savants par des

    39 437 659

    Références Boismenu, G. et Beaudry, G. (2002). Le nouveau monde numérique : le cas des revues universitaires. Montréal  :

    Presses de l’Université de Montréal. Geens, N., Huysmans, J. et Vanthienen, J. (2006). Evaluation of web robot discovery techniques: a

    benchmarking study. Dans P. Perner (dir.), Advances in data mining: applications in medicine, web mining, marketing, image and signal mining (p.  121‑130). Springer Berlin Heidelberg. Repéré à http://link.springer.com/chapter/10.1007/11790853_10

    IDATE et Cairn Info. (2015). L’open access et les revues SHS de langue française  : tendances du secteur, environnement réglementaire et perspectives 2018. Repéré à http://www.openaccess-shs.info/wp-content/uploads/2015/10/Etude-IDATE-CAIRN-INFO-20151002.pdf

    Larivière, V., Gingras, Y. et Archambault, É. (2008). Long-term variations in the aging of scientific literature: from exponential growth to steady-state science (1900-2004). Journal of the American Society for Information Science and Technology, 59(2), 288‑296. doi:10.1002/asi.20744

    Moed, H. F. et Halevi, G. (2016). On full text download and citation distributions in scientific-scholarly journals. Journal of the Association for Information Science and Technology, 67(2), 412‑431. doi:10.1002/asi

    Wang, X., Xu, S., Peng, L., Wang, Z., Wang, C., Zhang, C. et Wang, X. (2012). Exploring scientists’ working timetable: do scientists often work overtime? Journal of Informetrics, 6(4), 655‑660. doi:10.1016/j.joi.2012.07.003

    De l’usage de la plateforme Érudit :Que révèlent les téléchargements?

    Figure 4. Nombre moyen de téléchargements par article pour les revues en libre accès différé et les revues en libre accès complet selon le continent. Échantillon d’articles mis en ligne en 2011 (fin de l’embargo en 2013).

    Pays % d’articles téléchargés

    Canada 29,42 %

    France 22,63 %

    États-Unis 6,43 %

    Chine 4,72 %

    Algérie 4,32 %

    Maroc 3,47 %

    Allemagne 3,27 %

    Belgique 2,71 %

    Tunisie 1,81%

    Royaume-Uni 1,56 %

    Villes % d’articles téléchargés

    Montréal 11,92 %

    Québec 5,03 %

    Shenzhen 3,75 %

    Paris 3,45 %

    Ottawa 2,33 %

    Gatineau 1,65 %

    Sherbrooke 1,48 %

    Toronto 1,01 %

    Laval 1,01 %

    Chicago 0,89 %

    Tableaux 1 et 2. Les 10 pays et villes qui téléchargent le plus.

    Impact du libre accès

    •  Technique de détection de robots pour exclure les téléchargements de robots d’indexation & se comportant comme des humains :

    (tous services)

    Search

    Images

    Scholar

    •  La majorité des téléchargements proviennent du Canada, de la France et des États-Unis, ou de pays d’Europe de l’Ouest et d’Afrique du Nord.

    •  L’âge moyen des articles téléchargés est de 15 ans, ce qui montre que l’obsolescence des publications en SSH est plus lente que celle des sciences naturelles et génie.

    •  Près de 60 % des téléchargements sont en provenance de l’un des services de Google (importance de l’indexation).

    •  Au Canada, les usagers semblent être des étudiants de 1er  cycle universitaire, tandis qu’en France et aux États-Unis, il semble plutôt s’agir de chercheurs.

    •  Le passage au libre accès, pour les revues soumises à une période d’embargo, a un impact positif sur les téléchargements.

    •  Les revues en libre accès complet ont un nombre moyen de téléchargements par article plus élevé que celles en accès différé pendant 3 ou 4 ans après la mise en ligne. Malgré qu’elles soient souvent plus récentes, les revues sans embargo ont un net avantage sur les autres.

    .

    .

    sous embargo libre accès

    n = 39 436 791

    n = 29 951 265

    n = 19 318 374

    n = 1 083 019

    n = 38 901 921

    n = 26 852 807