gérer l’information d’une démarche scientifique
DESCRIPTION
L’exposé porte sur l’illustration par des cas concrets des problèmes qui se posent de nos jours au scientifique dans la gestion de la masse considérable d’information qu’il doit consulter ou générer que sa démarche soit exploratoire (ex: thèse) ou finalisée (ex: projet contractuel).TRANSCRIPT
Gérer l'information d'une démarche scientifique
J-M MongetMines Paristech - Nov 2011
[email protected] LinkedIn
Adresse Sudoc : PPN=075598078
L'information en recherche L'information en recherche scientifiquescientifique
Gérer des textes publiés pour :Gérer des textes publiés pour : Développer ses connaissancesDévelopper ses connaissances Suivre l'actualité scientifiqueSuivre l'actualité scientifique Faire le point exhaustif d'un sujet de recherche (démonstration Faire le point exhaustif d'un sujet de recherche (démonstration
d'originalité)d'originalité) Une foule d'autres contenus :Une foule d'autres contenus :
Notes (colloques, e-mails, démarches et procédés)Notes (colloques, e-mails, démarches et procédés) Codes de logicielsCodes de logiciels Fichiers de données structurés ou non (ex : tableaux Excel, schémas Fichiers de données structurés ou non (ex : tableaux Excel, schémas
graphiques, fichiers SIG)graphiques, fichiers SIG) Flux d'information sur InternetFlux d'information sur Internet Images et vidéos (ex : cours)Images et vidéos (ex : cours)
Des Questions :Des Questions : Comment gérer tout ceci au fil de la vie d'un projet ?Comment gérer tout ceci au fil de la vie d'un projet ? Comment partager dans un travail d'équipe ?Comment partager dans un travail d'équipe ? Comment synthétiser dans une publication de qualité ?Comment synthétiser dans une publication de qualité ? Comment faire reconnaître son expertise ?Comment faire reconnaître son expertise ?
Les principales phases de Les principales phases de gestion de l'informationgestion de l'information
1.1.Démarche exploratoireDémarche exploratoire
2.2.Organisation de l'informationOrganisation de l'information
3.3.Rédaction et travail collaboratifRédaction et travail collaboratif
4.4.CommunicationCommunication
1. La démarche exploratoire1. La démarche exploratoire
Les moteurs de recherche plein texte, Les moteurs de recherche plein texte, spécialisés ou nonspécialisés ou non
Les bases bibliographiquesLes bases bibliographiques Les sources pédagogiquesLes sources pédagogiques Les flux d'informationLes flux d'information
Les moteurs de recherche Les moteurs de recherche générauxgénéraux
Principe : tout atome d'information est indéxé. Principe : tout atome d'information est indéxé. Le monde de Google y est omniprésentLe monde de Google y est omniprésent
GoogleGoogle et ses outils et ses outils Les autres outils : Les autres outils : BingBing, , YahooYahoo, , ExaleadExalead, , BaiduBaidu La recherche de la litérature numérisée : La recherche de la litérature numérisée : Google BooksGoogle Books
+ + NGramsNGrams, , GallicaGallica Le traitement multilingue : Le traitement multilingue : Google TranslateGoogle Translate La recherche multimédia : La recherche multimédia : Google ImagesGoogle Images, , YouTubeYouTube, ,
DailyMotionDailyMotion La recherche géographique : La recherche géographique : Google Google MapsMaps, ,
OpenStreetMapOpenStreetMap
Les bases bibliographiquesLes bases bibliographiques
L'accès par le serveur L'accès par le serveur Mines Mines ParitechParitech Les outils d'éditeurs : Les outils d'éditeurs : Science DirectScience Direct Les bases ouvertes : Les bases ouvertes : HAL-SHSHAL-SHS
La recherche personnalisée (bibliométrie) : La recherche personnalisée (bibliométrie) : Web of ScienceWeb of Science,, SUDOCSUDOC
Un outil fédérateur : Un outil fédérateur : Google Google ScholarScholar
Les sources pédagogiquesLes sources pédagogiques
Les cours en ligne : Les cours en ligne : MIT,MIT, ParitechParitech
Les diaporama : Les diaporama : SlideShareSlideShare Les présentations différées : Les présentations différées : YouTube, YouTube, VimeoVimeo
Les séminaires on-line (Ex : Les séminaires on-line (Ex : EETimesEETimes ) )
Les cours en ligne : Les cours en ligne : MIT, ParitechMIT, Paritech
Les diaporama : Les diaporama : SlideShareSlideShare Les présentations différées : Les présentations différées : YouTube, YouTube, VimeoVimeo
Les séminaires on-line (Ex : Les séminaires on-line (Ex : EETimesEETimes ) )
Les flux d'informationLes flux d'information
Les flux d'information sur Internet permettent Les flux d'information sur Internet permettent une veille scientifique systématiqueune veille scientifique systématique
Les Les flux RSSflux RSS de blogs de blogs TwitterTwitter et ses « hashtags » et ses « hashtags »
Un outil de regroupement et de veille : Un outil de regroupement et de veille : Google ReaderGoogle Reader
2. L'organisation de 2. L'organisation de l'informationl'information
La capture en continu et la gestion La capture en continu et la gestion des notesdes notes
Organiser et indexer ses fichiersOrganiser et indexer ses fichiers Les données de projet et leur Les données de projet et leur
structurationstructuration Usage du « cloud » et Usage du « cloud » et
dématérialisation dématérialisation
La gestion des notesLa gestion des notes
L'exemple de L'exemple de EvernoteEvernote
La capture et la saisie des notesLa capture et la saisie des notes L'indexation par mot-clefs (tagging) et par L'indexation par mot-clefs (tagging) et par
cataloguescatalogues La gestion décentralisée des donnéesLa gestion décentralisée des données La consultation multi-plateformesLa consultation multi-plateformes
Structurer les données de Structurer les données de projetprojet
• La nature diversifiée des La nature diversifiée des informations : mesures informations : mesures expérimentales, notes d’essais, expérimentales, notes d’essais, programmation …programmation …
Indexation locale des contenus : Indexation locale des contenus : CopernicCopernic
Des solutions décentralisées : Des solutions décentralisées : Google TablesGoogle Tables et ses et ses outils de saisie : outils de saisie : Google Google RefineRefine
Gestion des versions : Gestion des versions : Google CodeGoogle Code et et SVNSVN Bases de données et outils d'intégration : Bases de données et outils d'intégration :
Google FusionGoogle Fusion Utiliser le « Cloud Computing» : Utiliser le « Cloud Computing» : AmazonAmazon, , Google Google AppApp
EngineEngine Une pratique industrielle, organisation et Une pratique industrielle, organisation et
traçabilité : le traçabilité : le LIMSLIMS
3. Les exigences de la thèse3. Les exigences de la thèse
• Le travail de thèse doit démontrer 4 Le travail de thèse doit démontrer 4 choses :choses :
Originalité, nouveautéOriginalité, nouveauté AuthenticitéAuthenticité Preuve de la véracité de la démarche (traçabilité)Preuve de la véracité de la démarche (traçabilité) Intégration dans un projet de recherche collectifIntégration dans un projet de recherche collectif
Construire sa bibliographieConstruire sa bibliographie
• La bibliographie doit démontrer la La bibliographie doit démontrer la nouveauté de la démarche.nouveauté de la démarche.
• Un exemple d'outil : Un exemple d'outil : ZoteroZotero
La capture et la saisie des notes références avec La capture et la saisie des notes références avec Google Scolar ou autresGoogle Scolar ou autres
L'indexation par mot-clefs (tagging) et par L'indexation par mot-clefs (tagging) et par cataloguescatalogues
La gestion décentralisée des données avec La gestion décentralisée des données avec FirefoxFirefox
La consultation : Web et localeLa consultation : Web et locale
D'autres outils : D'autres outils : EndNoteEndNote, , CiteULikeCiteULike
Travail collaboratifTravail collaboratif
Travail collaboratif : Travail collaboratif : Google DocsGoogle Docs Collaboration « on-line » : Collaboration « on-line » : TeamViewerTeamViewerGotoMeetingGotoMeeting,,
E-Science - les grands projets : E-Science - les grands projets : National Virtual National Virtual LaboratoryLaboratory
, , IPCC Climate ModelsIPCC Climate Models Plateformes scientifiques « cloud » - HPC (High Plateformes scientifiques « cloud » - HPC (High
Performance Computing) : Performance Computing) : CINES (Centre Informatique National de l'Enseignement Supérieur)CINES (Centre Informatique National de l'Enseignement Supérieur)
Des outils publics : Des outils publics : MyExperimentMyExperiment, , TavernaTaverna
Une archive ouverte à consulter : E-Science, perspectives et opportunitésUne archive ouverte à consulter : E-Science, perspectives et opportunités
Les nouveaux défis de la Les nouveaux défis de la « Provenance »« Provenance »
Authenticité : Détection plagiat ( ex : Authenticité : Détection plagiat ( ex : WikipediaWikipedia ) ) Référence unique des publications : Référence unique des publications : DOIDOI
Vérification automatisée et évaluation des Vérification automatisée et évaluation des citations : citations : concept de concept de nanopublicationnanopublication
Identité informatique du chercheur : SUDOC, Identité informatique du chercheur : SUDOC, ORCIDORCID
« Know thy examiners »« Know thy examiners » Suivi bibliométrique : Suivi bibliométrique : PublishPublish or or PerishPerish
Traçabilité : Traçabilité : OSCAR (Open Source OSCAR (Open Source ChemicalChemical AnalysisAnalysis Routines) Routines)
4. Publication et 4. Publication et communicationcommunication
Archives ouvertes et publication : Archives ouvertes et publication : HALHAL
Réseaux professionnels : Réseaux professionnels : LinkedInLinkedIn
Les espoirs et exigences du Les espoirs et exigences du Web SémantiqueWeb Sémantique
La base de connaissances universelle : La base de connaissances universelle : LinkedDataLinkedData