laurent capelli (ccsd) laurence farhi (inria) carrefour de l’ist - 25 novembre 2014
TRANSCRIPT
IDENTIFIANT ET RÉFÉRENTIELDANS HAL
Laurent Capelli (CCSD) Laurence Farhi (Inria)
Carrefour de l’IST - 25 novembre 2014
Gestion des référentiels : AURéHAL
IdHAL : identifiant unique d’un auteur
API Recherche
Utilisation des référentiels pour Haltools
2
PLAN
GESTION DES RÉFÉRENTIELS
https://aurehal.archives-ouvertes.fr
AuteursStructures de rechercheRevuesProjets ANRProjets EuropéensDisciplines
4
AURÉHAL : ACCÈS UNIFIÉ AUX RÉFÉRENTIELS HAL
Les référentiels peuvent être consultés, même sans authentificationL’historique de chaque entrée est visible par toute personne authentifiée : date de création, de mise à jourChaque entrée d’un référentiel permet de lancer une requête dans HAL pour consulter les dépôts liésUne mise à jour dans un référentiel génère automatiquement une mise à jour dans les dépôts liés
5
RÉFÉRENTIELS :CARACTÉRISTIQUES COMMUNES
AlimentationDépôt dans HALAURéHAL
Un administrateur de portail a les droits de création et modification sur tous les référentiels, à l’exception de celui des disciplinesToute personne qui a les droits « référent structure » peut modifier les informations de la structure de recherche dont il est référent
6
RÉFÉRENTIELS : PRINCIPES
Création d’une forme auteur : champs NomPrénomAutres prénoms (initiales)Adresse courrielURL site personnelÉtablissement d’appartenance = institution dont dépend le chercheur
Statuts : Incoming/ Valid/ OldIncoming : forme auteur sans IdHAL : rougeValid : forme auteur par défaut d’un IdHAL : vertOld : autre forme auteur d’un IdHAL : jauneCode couleur lors du dépôt et dans AURéHAL 7
RÉFÉRENTIEL AUTEUR
Règles de fusion :Une forme auteur n’appartenant pas à un IdHAL peut être remplacée par n’importe quelle autre forme auteurUne forme auteur appartenant à un IdHAL ne peut être remplacée que par une forme auteur appartenant au même IdHALLa forme auteur par défaut d’un IdHAL ne peut pas être remplacée
8
FUSION DES FORMES AUTEUR
Création d’une structure : ChampsNomSigleAdressePaysType structure (équipe, département, laboratoire, institution/entreprise)URL
Statut + code couleur dans AURéHAL: Valide (vert)/ Fermée (jaune)/ A valider (rouge)
9
RÉFÉRENTIEL STRUCTURES
4 niveaux de structureEquipe de rechercheDépartementLaboratoireInstitution
Chaque type de structure a une structure parent (sauf l’institution)
10
STRUCTURES DE RECHERCHE
11
STRUCTURES DE RECHERCHE
Institution
Laboratoire
Département
Équipe
Équipe
Laboratoire
Département
Laboratoire
Champs :Nom de la revue *Nom abrégé ISSN et E-ISSNEditeur *Racine DOIURL
Etat : Valide / Non valideLien avec SHERPA/ ROMEO
12
RÉFÉRENTIEL REVUES
ChampsTitre *Acronyme *Référence *IntituléAcronyme appelAnnée *
Validité : Valide/ Non valide
Convention avec l’ANR (conclu le 1er février2014)
13
RÉFÉRENTIEL PROJETS ANR
ChampsNuméro *Acronyme *Titre *ProgrammeDate débutDate finIdentifiant
Validité : Valide/ Non valide
14
RÉFÉRENTIEL PROJETS EUROPÉEN
Champs multivalués
Collections / Moissonnage
Compatibilité Openaire
Compatibilité H2020
15
PROJETS ANR ET PROJETS EUROPÉENS
IDHAL : IDENTIFIANT D’UN AUTEUR
IdHAL= Identifiant unique d’un auteur sur HALConstitué par l’auteur (lié à l’utilisateur connecté)Pas de fusion des formes auteurRassemble les formes auteur co-existant dans HAL (avec choix publication par publication)Choix d’une forme auteur « par défaut »lien avec des identifiants auteur sur d’autres plateformes (arXivid, Orcid, ResearcherId) et réseaux sociaux (Twitter, blog de recherche, …)Eléments de l’identité numérique du chercheur
17
IDHAL : IDENTIFIANT D’UN AUTEUR
18
CRÉATION DE L’IDHAL
Par défaut prénom-nom
Forme auteur par défaut
Autres formes auteur de l’IdHAL
Autre forme auteur de l’IdHAL
ArXiv : l'identifiant ArXiv est le nom d’utilisateur dans l’archive ArXiv ou son identifiant auteur (author identifier) : https://arxiv.org/help/author_identifierResearcherID : l’identifiant ResearcherID est l’identifiant obtenu après inscription sur la plateforme ResearcherID.com de ThomsonReuters.ORCID : l’identifiant ORCID (Open Researcher and Contributor ID) est l’identifiant obtenu après inscription sur la plateforme ORCIDIdRef : IdRef (Identifiants et Référentiels) est une application Web développée et maintenue par l’ABES (Agence Bibliographique de l’Enseignement Supérieur). Tout auteur d’un ouvrage, d’une thèse, d’un rapport catalogué dans le Sudoc a un idRef qu’il peut retrouver en interrogeant la plateforme : http://www.idref.fr/autorites/autorites.html Autres identifiants : sur Twitter, facebook, etc…Lien vers un blog 19
IDHALAUTRES IDENTIFIANTS
20
MON CV / MA PAGE CHERCHEUR
Choix des widgetsaffichés
Choix des documents affichés
API DE RECHERCHE
Solr est une plateforme logicielle de recherche s'appuyant sur le moteur de recherche Lucene, créée par la Fondation Apache et distribuée et conçue sous licence libreCaractéristiques principales : réplication, interfaces XML, JSON et HTTP, recherche par facettes, etc…Pour HAL : SOLR permet :
Accélérer les accès aux données Recherche Consultation (auteurs, laboratoires, …) Statistiques Auto-complétion API de recherche
22
MOTEUR DE RECHERCHE SOLR
Documentation et recherche :https://api.archives-ouvertes.fr/docs
Recherche dans HALhttps://api.archives-ouvertes.fr/docs/search
Recherche dans les référentielshttps://api.archives-ouvertes.fr/docs/ref
23
LES API RECHERCHE
Construire une URL de recherche sous la forme : http://api.archives-ouvertes.fr/ref/ Préciser le référentiel à interroger : author/ journal/ structure/ domain/ anrproject/ europeanprojectEtablir le critère de recherche : q=query
https://api.archives-ouvertes.fr/ref/journal/q/... Ou https://api.archives-ouvertes.fr/ref/journal/?q=…
Pour chaque référentiel : description et nom des champs à utiliser pour la requête
24
RECHERCHE SUR LES RÉFÉRENTIELSSYNTAXE ET PARAMÈTRES
q (=query) paramètre de rechercheOpérateurs :
AND (&&) / NOT (!) / OR (||) / + / -on donne une valeur à un paramètre avec =
nom du paramètre = valeur du paramètre Recherche sur un champ :
nom du champ : valeur du champ
& pour séparer les paramètres
25
RECHERCHESYNTAXE ET PARAMÈTRES
Paramètres de sortie des résultats :wt format de sortie : csv/ json/ xml/ et formats supplémentaires pour la recherche sur la base :
atom/ rss/ bibtex/ xml-tei rows nombre de résultats affichésstart : décalage des résultatssort (asc ou desc) tri des résultats par champ facet.sort tri des résultats par facette
Champs à retourner : Par défaut : champs docid et label_sfl (séparateur = virgule) Pour choisir les champs fl=* pour retourner tous les champs
facet=true , facet.field (nom du champ) et facet.mincount : facettesfq : filtre sur la requête 26
RECHERCHESYNTAXE ET PARAMÈTRES
27
RECHERCHEEXEMPLES
Sur les référentiels :https://api.archives-ouvertes.fr/ref/journal/?q=publisher_t:elsevier&wt=xml&fl=*&facet=true&facet.field=sherpaColor_shttps://api.archives-ouvertes.fr/ref/author/?q=fullName_t:(eric verdeil)&fl=label_html,idHal_s&wt=xml&indent=true&facet=true&facet.field=valid_s&facet.mincount=1
Sur la base :https://api.archives-ouvertes.fr/search/index/?q=(docType_s:ART OR REPORT) AND status_i:11 AND structName_t:INSERM&rows=10&wt=xml&fl=docid,title_shttps://api.archives-ouvertes.fr/search/?q=collCode_s:TRIANGLE_UMR5206&wt=rss
UTILISATION DES RÉFÉRENTIELS POUR HALTOOLS
Types de documents : https://api.archives-ouvertes.fr/ref/doctype/?instance=inria&wt=xml
instance=all à venirPour Bib2hal, RRRT : types de documents, métadonnées pour chaque type de document (https://api.archives-ouvertes.fr/ref/metadata/?q=*:*&wt=xml&docType_s=REPORT
), Structures de recherche valides (auto-complétion), domaines, …
30
INTERROGATION DES RÉFÉRENTIELS
Pour faire des recherches exactesPlus de problèmes d’homonymes sur les auteurs, structures de recherches, projets …Utilisations de AURéHALou des API puis utilisation dans le formulaire
31
UTILISATIONS DES RÉFÉRENTIELS
Rechercher l’idhal étant donné un nom et prénom (ex: « Laurent Romary »: https://api.archives-ouvertes.fr/ref/author/?wt=xml&q=fullName_s:"Laurent Romary"&fl=*
Rechercher structId (ex: « Maverick »: https://api.archives-ouvertes.fr/ref/structure/?q=name_s:MAVERICK OR acronym_s:MAVERICK&wt=xml&fl=docid,name_s,acronym_s,code_s,valid_s
Rechercher un projet européen (ex: « peer ») : https://api.archives-ouvertes.fr/ref/europeanproject/?wt=xml&q=acronym_s:PEER
32
UTILISATION DES RÉFÉRENTIELSIDHAL, STRUCTID, ID DE PROJET
33
UTILISATION DES RÉFÉRENTIELS PAGE WEB DES PUBLICATIONS D’UN CHERCHEUR
34
UTILISATION DES RÉFÉRENTIELS PAGE WEB DES PUBLICATIONS D’UNE ÉQUIPE
35
UTILISATION DES RÉFÉRENTIELS PAGE WEB DES PUBLICATIONS D’UN PROJET EUROPEEN
Ex:https://api.archives-ouvertes.fr/search/index/?q=status_i:11&fq=title_t:tei+AND+authIdHal_s:laurentromary+AND+producedDateY_i:[2014+TO+2014]&wt=xml-tei&rows=5000
Auteur :/tei:TEI/tei:text/tei:body/tei:listBibl/tei:biblFull/tei:titleStmt/tei:author<persName> <forename type="first">Laurent</forename> <surname>Romary</surname> </persName><idno type="idhal">laurentromary</idno><idno type="halauthor">49567</idno><idno type="arXiv">http://arxiv.org/a/Romary_L</idno> <idno type="IdRef">http://www.idref.fr/060702494</idno><idno type="ORCID">http://orcid.org/0000-0002-0756-0508</idno>
36
IDENTIFIANTS DANS L’EXPORT TEI
Affiliations:<affiliation ref="#struct-266432"/>
<org type="laboratory" xml:id="struct-84774"> <orgName>Centre Marc Bloch</orgName> <orgName type="acronym">CMB</orgName> <desc> <address> <addrLine>Friedrichstr. 191 D-10117 Berlin</addrLine> <country key="DE"/> </address> <ref type="url">http://www.cmb.hu-berlin.de</ref> </desc> <listRelation> <relation active="#struct-301498" type="direct"/> <relation active="#struct-301499" type="direct"/> <relation active="#struct-306442" type="direct"/> <relation name="USR3130" active="#struct-388064" type="direct"/> </listRelation> </org>…
37
IDENTIFIANTS DANS L’EXPORT TEI
MERCI …