la donnÉe : un nouveau bien essentiel pour la … · les chantiers essentiels de la supervision...

28
LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA TRANSITION ÉCOLOGIQUE ET SOLIDAIRE ET LA COHÉSION DES TERRITOIRES 40 ACTIONS DE LA FEUILLE DE ROUTE 2018-2019

Upload: others

Post on 09-Aug-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

LA DONNÉE : UN NOUVEAU BIENESSENTIEL POUR LA TRANSITION

ÉCOLOGIQUE ET SOLIDAIRE ETLA COHÉSION DES TERRITOIRES

40 ACTIONS DE LA FEUILLEDE ROUTE 2018-2019

Page 2: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

2

Page 3: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

3

LES CHANTIERS ESSENTIELSDE LA SUPERVISION DESDONNÉES

Le 31 mai 2016 était remis le rapport de préfiguration de la fonction de supervision gé -nérale des données. Au cours de ces deux dernières années, le pôle ministériel s’est pro-gressivement inscrit dans une nouvelle dynamique pour mieux gérer ses données et enfavoriser l’usage pour ses propres missions. De nombreuses actions ont été réalisées : 14séminaires d’acculturation « big data » et une journée dédiée à la donnée le 17 no-vembre 2017, la création de la task-force SGD, la mise en place des correspondants don-nées...

Les récentes lois, et tout particulièrement celle pour une République numérique, visent àfavoriser la circulation de données et à préparer la stratégie d’État plateforme, avec desservices comme API entreprise et le service public de la donnée. Il s’agit d’une nouvelletransformation, inévitable, comme il a pu s’en produire dans le passé. Cela nécessite des’y préparer et de repenser les formes de gouvernance, de nouvelles connaissances, denouveaux outils et de nouvelles exigences pour l’encadrer.

Pour inscrire pleinement le pôle ministériel dans cette nouvelle « révolution », la SGDpropose 40 actions aux services du pôle ministériel de s’engager activement sur 2018-2019 dans une feuille de route ambitieuse, réaliste et adaptée à leurs enjeux de la don -née.

Cette période doit marquer une nouvelle étape : l’enracinement de la valeur des don-nées au sein des services du pôle ministériel. Parmi les chantiers prioritaires :

• définir les nouvelles modalités d’une gouvernance partagée qui croise les di -mensions métier, données, transformation numérique et systèmes d’informa-tion et qui permet un échange avec les utilisateurs des données ;

• finaliser l’inventaire des données du pôle ministériel avec une sémantique par-tagée et mettre en qualité les données les plus critiques ;

• libérer la créativité des agents avec un accompagnement dans les projets, dansles nouveaux outils ou les technologies innovantes, et grâce à un nouveau socletechnique performant ;

• systématiser l’approche API pour accéder aux données et contribuer notam-ment aux attentes du chantier DLNUF ;

• garantir la sécurité des données détenues avec une nouvelle approche sur lecycle de vie de la donnée.

Pour le pôle ministériel, et le service public plus généralement, puisse réussir à remplirses missions au meilleur état de l’art, cette révolution impose une évolution profonde,au plus près des services, des producteurs de données ou des utilisateurs de données.C’est l’ambition de cette feuille de route.

Page 4: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

4

Page 5: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

SOMMAIRE

Les chantiers essentiels de la supervision générale des donnéespage 3

Une feuille de route ambitieuse, réaliste, mesurable et opérationnellepage 6

Gouvernance de la donnée : faire des données métiers une force du pôle ministérielpage 7

Architecture de la donnée : connaître nos propres données pour créer de nouveaux usagespage 12

Infrastructure applicative et technique : faire émerger une nouvelle offre d’outils pour traiter la don-née page 18

Sécurité et conformité : répondre aux enjeux de la protection de données et de traçabilité desusages page 21

Annexes

Liste des actionspage 24

Définitions & glossairepage 26

5

Page 6: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

UNE FEUILLE DE ROUTE AMBITIEUSE, RÉA -LISTE, MESURABLE ET OPÉRATIONNELLE

Depuis 2016, la fonction de supervision générale des données (SGD) a créé les conditions pour favoriser l’émer-gence d’une nouvelle dynamique de maîtrise et d’utilisation des données au sein du pôle ministériel. Depuisnombre d’actions inédites ont été réalisées : acculturation des services aux sciences de la donnée et au big data(deux saisons de séminaires et la journée de grande ampleur d’encapacitation du 17 novembre 2017), organisa-tion d’événements participatifs sur la donnée (data-sessions, hackathons, concours de data-visualisation, code-sprint RST-Analytics), incitations à la valorisation des données par des start-up à travers la démarche Greentechverte, mise en place d’une task-force SGD et d’un comité des correspondants données (avec une représentationtrès large du pôle ministériel : DG, Dreal et principaux opérateurs concernés).

Comme l’évoque le deuxième rapport de l’AGD, il s’agit de penser la donnée comme une infrastructure essen -tielle du fonctionnement de l’économie et de l’État. Les lois récentes ou à venir – loi Grandguillaume, loi pourune République numérique, loi (TEPCV), loi d’orientation de la mobilité… – intègrent dorénavant une dimension« données », ce qui illustre une meilleure intégration des enjeux de la donnée dans la conduite des politiquespubliques et dans le rôle régulateur de l’État.

Pour 2018-2019, au sein du pôle ministériel, le SGD propose de tracer les grandes lignes de cette nouvelle infra -structure « données », que les services devront adapter et décliner dans leur programme de travail, car ils sonten première ligne de la production d’informations. Ainsi la donnée pourra devenir un bien essentiel à la transi -tion écologique et solidaire et à la cohésion des territoires ; cette démarche SGD devant par ailleurs contribueret être en parfaite articulation avec les ambitions interministérielles (État plateforme, ouverture de données,expérimentation des solutions de datasciences comme l’IA) et les démarches ministérielles de transformationnumérique.

Pour mener à son terme la transformation nécessaire des services du pôle ministériel, la SGD propose d’organi -ser la feuille de route SGD 2018-2019 en quatre thèmes transversaux à l’ensemble des métiers et des politiquespubliques traitées. Ces quatre thèmes couvrent la dimension stratégique « gouvernance de la donnée », quiincarne la dynamique de transformation au plus haut niveau dans toutes les composantes organisationnellesdu pôle ministériel, la dimension connaissance « architecture de la donnée », qui crée un cadre commun dedialogue et de connaissance sur la donnée, la dimension technique « infrastructure applicative et technique »,qui permet l’émergence d’une nouvelle offre de services adaptées aux données, aux traitements et aux valori -sations, et enfin la dimension « sécurité et conformité », pour garantir un usage dans les règles des donnéesdétenues.

Cette feuille de route 2018-2019 propose de mener 40 actions par les directions générales, les directions régio-nales et les opérateurs, avec l’appui et l’expertise de la supervision générale des données. Cela participe à lamontée en compétences des services du pôle ministériel. Un tableau de l’ensemble des actions est disponibleen annexe.

6

Page 7: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

GOUVERNANCE DE LA DONNÉE

FAIRE DES DONNÉES MÉTIERS UNE FORCE DU PÔLE MINISTÉRIEL

Comme tout actif vital d’une entreprise ou d’une administration, la donnée nécessite la mise en place d’unegouvernance.

La gouvernance de la donnée permet d’identifier, classer, piloter et contrôler les données à travers des proces -sus, des règles, des acteurs et des instances de décision clairement définis et partagés au sein du pôle ministé-riel. Cette gouvernance veillera à ce que les différentes actions se focalisent dans un premier temps sur les don -nées à forte valeur et que les moyens pour les produire, les mettre en qualité ou les mettre à disposition soientidentifiés, priorisées et alloués pour y parvenir.

METTRE EN PLACE UNE GOUVERNANCE DE LA DONNÉE

La maîtrise de la donnée est un des trois enjeux du pôle ministériel. Elle s’intègre pleinement dans le nouveauschéma directeur et elle se décline dans l’ensemble de la comitologie stratégique et opérationnelle du pôle mi-nistériel. Ce dispositif a vocation à évoluer pour s’adapter aux prochaines orientations interministérielles sur lenumérique et la donnée.

• Faire de la maîtrise de la donnée un enjeu du pôle ministériel (action 1)

• Intégrer la dimension donnée dans une gouvernance stratégique à des fins de pilotage et d’arbitrage,en lien étroit avec la gouvernance des systèmes d’information, les nouveaux projets numériques et latransformation qu’ils imposent dans les services du pôle ministériel (action 2)

• Mettre en place un comité des correspondants « données » (volet opérationnel de la gouvernancestratégique, qui pourra s’étoffer au gré des attentes exprimées par les directions générales, les direc-tions régionales et les opérateurs) pour assurer un rôle de courroie de transmission à double sensentre les services métiers et la SGD, pour être à l’écoute des besoins et des difficultés et pourconstruire des solutions pour y parvenir. Ce comité se réunit trois fois par an et assure le pilotage de lafeuille de route. (action 3)

• Assurer un appui méthodologique, une expertise ou un relai pour aider au traitement des probléma-tiques ou difficultés rencontrées par les services du pôle ministériel. La task-force SGD accompagne lescorrespondants à leur demande et co-anime avec les services un réseau social pour faciliter leséchanges d’informations et d’expériences entre correspondants « données », et plus globalemententre tous les acteurs du pôle ministériel, dont les services non représentés au comité des correspon-dants. (action 4)

• Assurer un rôle de référent auprès de l’AGD pour relayer les attentes spécifiques du pôle ministérielau regard de la richesse des données traitées (logement, transport, énergie, climat, biodiversité, envi-ronnement, qualité de l’air et de l’eau, développement durable, économie circulaire, etc.), pour diffu-ser l’ensemble des éléments de doctrine, et représenter le pôle ministériel au sein du réseau des ad-ministrateurs ministériels des données. (action 5)

7

Page 8: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

• Organiser des actions d’acculturation et de mobilisation pour aider les services à s’approprier les nou-veaux usages de la donnée, démystifier les sciences de la donnée, inspirer les services, et globalementavec une approche à la fois stratégique et opérationnelle. Ce sont des moments privilégiés pour parta -ger et valoriser les projets centrés sur les données (traitements, visualisations notamment) et in finefavoriser l’émulation des services. Ces actions prennent par exemple les formes suivantes (action 6) :

◦ une troisième saison des conférences big data, en lien plus étroit avec les directions générales mé-tiers et la sphère interministérielle ;

◦ une journée dédiée à la « donnée », chaque année, pour présenter des travaux des directions gé-nérales, des directions régionales ou des opérateurs autour de la donnée ;

◦ des présentations lors des geek-lunchs.

DÉFINIR LES PROCESSUS ENTRE ACTEURS

La maîtrise de la donnée est en prise directe avec de nombreux acteurs du pôle ministériel, de la sphère inter -ministérielle, et sans oublier les acteurs externes (associations, bureaux d’étude, ONG, etc.). Une connaissancefine de ces acteurs et de leurs responsabilités favorise la bonne coordination des travaux à conduire.

• Partager le fonctionnement de la task-force SGD et des correspondants données, du réseau des admi-nistrateurs ministériels des données (pour faciliter la mise en relation entre les ministères pour l’accèsaux données détenues par d’autres) (action 7)

• Partager les synergies possibles entre tous les acteurs des dimensions données et système d’informa-tion, qu’ils soient dans les directions générales, les directions régionales, les opérateurs, le secrétariatgénéral, avec la comitologie associée (par exemple, les comités d’orientation stratégique du systèmed’information) (action 8)

8

Le comité des correspondants « données » : uneprise de conscience des services

En mai 2017, un comité des correspondants« données » a été mis en place pour faciliter leséchanges avec les directions générales, les direc-tions régionales et les principaux opérateurs et lesaccompagner dans leurs travaux sur les données.Un premier recensement des attentes, des diffi-cultés et des projets « données » en cours et à ve-nir a été réalisé et a permis de produire cettefeuille de route 2018-2019.

La task-force SGD… à votre écoute !

Une équipe resserrée de sept agents déjà spéciali-sés dans la gestion et la maîtrise de la donnée aété créée pour animer au sein du ministère la su-pervision générale des données. En poste au SG etau CGDD (Cabinet, DRI et SDES), ces agents sontles relais privilégiés pour aider les services du pôleministériel à développer de nouvelles compé-tences, de nouveaux usages et à mobiliser lesdonnées détenues dans l’exercice de leurs mis-sions. Ils apportent également un appui sur la car-tographie des données, la qualité des données etles licences. Ils facilitent la préparation des comi-tés des correspondants données.

Page 9: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

De même, la maîtrise de la donnée impose une définition précise des travaux à conduire, c’est-à-dire des objec-tifs à atteindre, des moyens techniques ou humains pour y parvenir, des indicateurs de mesure, etc. Parexemple, la mise en qualité des données est un chantier prioritaire que les producteurs de données doivent in -tégrer pour permettre à leurs services, mais également à des réutilisateurs externes, un usage et une valorisa -tion les plus adaptés.

• Mettre en place un groupe d’experts composés d’agents de services volontaires pour accompagner lesservices à la mise en œuvre du corpus de règle (cf. point supra) (action 9)

• Évaluer deux sources de données chaque année pour chacune des directions générales, des directionsrégionales, des principaux opérateurs au regard du corpus de règle (action 10)

• Évaluer la satisfaction des services quant à l’appui de la fonction SGD dans leurs travaux ou projets« données » (action 11)

DÉFINIR UN CORPUS DE RÈGLES POUR MAÎTRISER LES DONNÉES

Maîtriser une langue maternelle ou étrangère, c’est connaître et appliquer les règles, comme la grammaire oul’orthographe. Maîtrise une langue, ce n’est pas réservé aux seuls spécialistes, aux écrivains. Maîtriser la don -née, c’est également connaître et appliquer les règles pour en faciliter l’usage, la compréhension, l’accès à l’in-formation.

La richesse des données produites par le pôle ministériel nécessite la définition et le partage d’un corpus derègles afin de disposer d’un cadre de gestion et d’utilisation des données, cadre qu’il convient qu’il soit connu,partagé et fiable. Ce corpus doit donner aux producteurs du sens à leurs données. Il doit également permettreune vision claire des enjeux et des objectifs natifs de la donnée pour en faciliter la valorisation.

9

Unifier les référentiels des cours d’eau

Les agences de l’eau utilisent depuis plusieurs an-nées une cartographie des cours d’eau, appeléeBD CARTHAGE. Du point de vue géométrique, ellen’était pas suffisamment précise pour la définitionréglementaire des cours d’eau, notamment celledes cours d’eau « bonnes conditions agricoles etenvironnementales » (code rural) et celle descours d’eau pour la continuité écologique (codede l’environnement). Les DDT quant à elle s’ap-puyaient la plupart du temps sur la BD TOPO del’IGN, dont la précision géométrique répondait aubesoin. Avec l’appui de l’IGN, l’AFB a lancé la réali-sation de la BD TOPAGE avec les informations dela BD CARTHAGE et de la BD TOPO, unifiant ainsid’unifier les référentiels cartographiques descours d’eau. Cette cartographie est complexe, carles cours d’eau sont des « objets mobiles » trèsdifférents des arrêts de bus par exemple.

Mise en qualité de la base des DPE

La loi du 12 juillet 2010 portant engagement na-tional pour l’environnement a introduit l’obliga-tion de transmettre à l’ADEME les diagnostics deperformance énergétique (DPE) réalisés à l’occa-sion de la vente ou de la location d’un bâtimentou d’un logement. L’agence gère donc un impor-tant patrimoine de données probablement trèsutile pour les politiques de transition énergétique.Un travail de montée en qualité de cette base dedonnées sera mené afin de faciliter son exploita-tion au bénéfice des politiques publiques du pôleministériel.

Page 10: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

Le corpus de règles permet de définir les informations sur ladonnée elle-même (les métadonnées), les formats à utiliserpour en faciliter l’usage, les référentiels associés, dont le ser-vice public de la donnée (cf. supra p 13), le statut vis-à-vis del’ouverture des données, les conditions d’usage, les limitesd’usage, la qualité de données au regard d’attendus ou del’état de l’art (qualité de la géolocalisation ou de l’adressepar exemple).

• Construire une première version du corpus de règlesen privilégiant une approche de co-constructionavec les correspondants « données » et sur quelques thématiques essentielles, comme l’accès auxdonnées, les traitements ou calculs, les référentiels, les conditions et les limites d’usage, la qualité desdonnées. (action 12)

• Tester les règles du corpus au sein des services et définir un indicateur de convergence de la donnéevis-à-vis des règles du corpus (action 13)

• Identifier les conditions d’une généralisation et faire du corpus un standard au sein du pôle ministériel(action 14)

• Partager les travaux du pôle ministériel avec l’AGD et les autres ministères, et identifier les synergiespossibles (action 15)

10

Phraséologie de l’aviation

Les communications dans l’aéronautique garan-tissent la sécurité des vols et des passagers. Ellesse caractérisent par des instructions claires,concises et sans ambiguïté. Mélangeant textes etchiffres, toute confusion ou erreur peut avoir desconséquences dramatiques. Pour les éviter, laphraséologie de l’aviation a été définie pour« normer » les contrôleurs aériens et les pilotes.

Eurovoc : simplifions-nous la gestion des thesau-rus !

Dans nos outils, nombre de référentiels théma-tiques ont été créés pour organiser, classer, in-dexer l’information. À l’échelle du ministère, l’ab-sence de référentiels partagés freine l’interopéra-bilité de nos donnés. Au sein du CGDD, un chan-tier d’harmonisation des pratiques d’indexationest en cours : pour tout projet, les référentiels« spécifiques » sont remplacés par des outils mu-tualisés ou des références nationales ou interna-tionales. Pour les politiques publiques, le thésau-rus d’indexation de l’Office européen des publica-tions – « Eurovoc » – est désormais préféré etremplace les listes thématiques élaborés en in-terne. Ce référentiel reconnu, en opendata et enmultilingue, garantit l’interopérabilité de l’infor-mation en interne, mais également à un niveaueuropéen. Outil à déployer au sein de nos ser-vices, libérant les équipes d’une gestion indivi-duelle de référentiels, il permet aux sources dedonnées du pôle ministériel de parler un langagecommun.

La qualité des données de Sitadel : une questiond’usage

Depuis le 1er janvier 2018, le SDES publie en open-data la liste des permis de construire des maîtresd’ouvrage personne morale. Via la plateforme da-ta.gouv.fr, les réutilisateurs ont demandé deschangements pour leur faciliter l’utilisation de cesdonnées, en particulier la structure du fichier et leformat de certaines variables (comme les dates),qui représentent les deux premiers contacts avecles données. D’autres changements ont été égale-ment demandés en lien direct avec les usages en-visagés par les utilisateurs : par exemple le formatdes adresses ou les codes géographiques. Mettreen qualité une donnée, c’est avant tout com-prendre et fournir une donnée adaptée auxusages.

Page 11: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

11

Page 12: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

ARCHITECTURE DE LA DONNÉE

CONNAÎTRE NOS PROPRES DONNÉES POUR CRÉER DE NOUVEAUX USAGES

Bien avant la meilleure utilisation des données ou leur qualité, la question de la connaissance du patrimoine dé-tenu par les services du pôle ministériel doit être traitée : il s’agit de construire en priorité une vision la plus ex-haustive possible et partagée des données existantes. La méconnaissance du patrimoine crée un risque majeurprésenté dans le rapport Fouilleron : la création par les services de leurs propres bases de données lorsquecelles-ci ne sont pas accessibles. S’ensuivent des effets désastreux : doublons, coûts importants, incohérencesentre bases, difficultés de mises à jour, etc.

L’architecture de la donnée repose avant tout sur une cartographie des données, librement accessible et à jour,qui permet le classement et l’organisation des données selon des critères partagés et avec la prise en comptede la dimension métier portées par les données.

ÉTABLIR LA CARTOGRAPHIE DES DONNÉES

Les directions générales, les directions régionales et les opérateurs réalisent un inventaire des données qu’ilsproduisent dans le cadre de leurs missions. Ils assurent une mise à jour régulière de cet inventaire et versentleur inventaire dans la cartographie des données du pôle ministériel, en veillant à la cohérence d’ensemble.

La task-force SGD accompagne les services pour la mise en place pérenne de cet inventaire dans les missions,en particulier sur les informations à recueillir et son intégration dans les activités des services producteurs dedonnées.

Avec l’appui de la SGD, les directions générales, les directionsrégionales et les opérateurs utilisent la cartographie desdonnées pour valoriser leurs données avec le croisement dedonnées détenues par d’autres, pour mener des projets dedata-visualisation, pour identifier les points d’adhérenceavec le chantier « dites-le-nous une fois », etc.

Un audit de la cartographie doit permettre d’identifier lesaméliorations les plus utiles pour faciliter l’utilisation decette cartographie dans les projets SI, numérique ou don-nées.

• Réaliser un inventaire des données par les directionsgénérales, les directions régionales et les opéra-teurs, avec l’appui de la task-force SGD (action 16)

12

Dataroom : la cartographie des données du pôleministériel

Grâce à un travail d’inventaire réalisé par les di-rections générales et les principaux opérateurs,sous le pilotage du CGEDD et l’appui du CGDD,une première cartographie des données du pôleministériel a été réalisée. Près de 510 bases sontréférencées sous tous les domaines d’interven-tion : logement, transport, biodiversité, risques,urbanisme, climat, énergie… Les correspondants« données » ont été mobilisés pour en améliorerla qualité et l’exhaustivité. Cet outil simple seraproposé en interministériel pour aider les AMD àproduire la cartographie de leur ministère.

Premier ministère à le mettre en place, dire lestravaux sur l’outil de saisie par Etalab

https://mtes-mct.github.io/dataroom/

Page 13: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

Picto-Occitanie : le catalogue régional des données géographiques et statistiques

En Occitanie, à la demande du préfet de Région, les services de l’État ont créé le ré-seau Géo-Occitanie dédié au partage et à la diffusion des données géographiques etstatistiques, ainsi qu’à la recherche de solutions numériques innovantes basées surl’exploitation de ces données. Ce réseau regroupe l’ensemble des directions régio-nales, l’ARS, les deux rectorats, l’Insee, les directions départementales des terri-toires ainsi que des établissements publics. Ce réseau a mis en place la plateformePicto-Occitanie, qui contribue au porter-à-connaissance de l’État, à la simplificationde l’accès aux données publiques et à l’élaboration d’outils d’aide à la décision.

Construire autour de l’information géographique et statistique, cette plateformepropose des fonctionnalités de catalogue, de téléchargement et de visualisation dedonnées. Elle permet également la production de rapports territoriaux thématiquespar exemple sur le logement ou l’énergie. Cela est possible notamment grâce à uncatalogue de données important : 500 lots de données sur l’ensemble du territoirerégional et près de 4 000 données moissonnées auprès de services départementauxou de plateformes nationales (Atlasanté, Atlas des patrimoines, data.gouv.fr, etc.).

https://www.picto-occitanie.fr/

DÉFINIR UNE CLASSIFICATION NORMÉE DES DONNÉES

Pour permettre une cohérence d’ensemble de la cartographie des données du pôle ministériel, des critères declassification sont à identifier et à appliquer : usage de la donnée et limites, origine de la donnée, degré dequalité, licence, privé ou publique, etc. Cela permet d’inscrire les données détenues par les services selon descritères existants.

Des ateliers sont organisés pour identifier de manière collégiale les critères de classification, à mettre en cohé-rence avec la directive européenne Inspire quand cela est nécessaire. La task-force SGD veille à sa mise enœuvre dans les inventaires produits par les directions générales, les directions régionales et les opérateurs, etassure la coordination de la définition des critères avec la mission Etalab.

13

Page 14: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

• Identifier collégialement les critères de classificationdes données (action 17)

• Assurer une diffusion et une mise en œuvre des cri-tères au sein de la cartographie des données dupôle ministériel (action 18)

MODÉLISER DES OBJETS MÉTIERS SOUS-JACENTS AUX DONNÉES POUR EN FACILITER L’USAGE

Les bases de données sont complexes : elles peuvent rassembler des informations variées sur des personnesphysiques ou morales, sur des procédures administratives, mais aussi sur les routes, les logements, la biodiver-sité, le climat, les énergies, la pollution, l’artificialisation… Pour décrire le plus précisément possible les don-nées que les bases contiennent et ainsi en favoriser la compréhension et l’utilisation, il est nécessaire d’organi-ser la description des données selon des critères compréhensibles et propres à l’ensemble des acteurs tra-vaillant sur une thématique : il s’agit des « objets métiers », parfois appelé aussi « concept ». La définition et lamise en œuvre des objets métiers sur les bases de données est donc une condition nécessaire à la circulationde données, qui pourra alors s’appuyer plus facilement sur des API.

14

Quelle licence utiliser pour ouvrir des données ?

Le choix de la licence à utiliser dans le cadre d’uneouverture nouvelle de données est une questionrécurrente des services producteurs que ce soiten interne ou en interministériel. En relayant laquestion auprès des équipes juridiques de la mis-sion Etalab, et en lien avec a DAJ du ministère, laSGD apporte son appui aux services producteurset participe ainsi à l’émergence d’une doctrinepartagée au sein du pôle ministériel et en cohé-rence avec les autres ministères.

Objets métiers selon Inspire

Dans le cadre de la directive européenne Inspire,le règlement concernant l’interopérabilité desdonnées géographiques définit de nombreux ob-jets géographiques métiers utilisés pour la protec-tion de l’environnement comme « région biogéo-graphique », « zone à risque », « unité administra-tive », « parcelle cadastrale », etc.

Les objets métiers : l’exemple de la statistiquepublique

L’Institut national de la statistique et des étudeséconomiques (Insee) a défini les principauxconcepts utilisés dans l’ensemble du système sta-tistique public. De concepts utiles aux données dupôle ministériel, comme l’objet « logement autori-sé » pour les données de permis de construire(base Sitadel), y sont déjà définis et pourraientainsi être utilisés pour les expérimentations àconduire.

https://www.insee.fr/fr/metadonnees/definitions

Page 15: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

Perturbateurs endocriniens : un exemple qui mixe cartographie, objets métierset API

L’information utile n’est pas toujours dans une base de données bien structuréeou un tableur. Il faut parfois croiser des données extraites de documents et fairese parler différents objets métiers définis malgré une thématique commune.Pour démontrer la faisabilité technique d’un croisement de données entre cellesproduites en « silo » et celles a priori non compatibles, sous des formats textepar exemple, le CGDD finalise une preuve de concept – un POC – qui permet devaloriser chacun des objets dans un accès unique à l’information pour réponseaux besoins d’usage de l’information. Les « perturbateurs endocriniens » ont étéchoisis, car ils croisent des données documentaires, statistiques avec des don-nées d’opérateurs (Ademe) et des référentiels nationaux et internationaux (san-té, produits…). Avec une approche centrée utilisateurs, le projet vise à offrir auxinternautes un accès multi-facettes indépendamment à l’organisation structu-relle des producteurs de données.

Ainsi, pour faciliter l’échange et l’usage des données, il est essentiel d’en fiabiliser la description grâce aux ob-jets métiers. Pour y parvenir, il est proposé une approche progressive et adaptée aux besoins que les servicesont signalés fin 2017.

• Dans un premier temps, une expérimentation est menée pour confirmer la faisabilité de la modélisa-tion et les éventuelles difficultés à relever pour industrialiser la démarche. Les directions générales, lesdirections régionales et les opérateurs doivent identifier les données prioritaires à décrire par la mo-délisation des objets métiers, les objets métiers les plus critiques afin de rendre les données asso-ciées accessibles via un mécanisme d’API à construire. La modélisation des objets métiers des don-nées prioritaires est réalisée avec les acteurs métiers concernés. (action 19)

• Après un bilan de l’expérimentation, les directions générales, les directions régionales et les opéra-teurs identifient l’ensemble des données qui doivent être décrites par la modélisation des objetsmétiers, évaluent les moyens pour y parvenir et incitent leurs services à inscrire ces travaux dans leurprogramme de travail annuel. (action 20)

• Cartographier et identifier les objets ne suffisent pas à valoriser les données. Pour créer les connexionsnécessaires entre les données produites en « silo » et les usages pouvant solliciter chacun d’eux, unearchitecture dite de « middle office » reposant sur les outils du web-sémantique (entrepôt de don-nées, datalake, référentiels partagés et traitementdes données) doit être mise en œuvre. (action 21)

Les moteurs de règles

15

Donner les données...

En complément des besoins déjà exprimés (cf. en-cadré supra), les Dreal sont invitées à signaler lesdonnées de l’administration centrale, qui simpli-fieraient leurs travaux si elles étaient rendus ac-cessible par API.

Page 16: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

Par la réglementation, différentes règles s’appliquent sur les objets métiers : un objet « bâtiment » est parexemple soumis à des règles du code de l’urbanisme et du code de la construction. Le SGD ouvrira un chantierde réflexion et de prototypage sur la modélisation de telles règles, c’est-à-dire leur traduction en code informa-tique à la fois compréhensible par des humains et directement lisibles par des machines.

OpenFisca modélise le système socio-fiscal français en code informatique et permet, avec son moteur de simu -lation, de mieux comprendre les lois de finances, d’en analyser leurs changements et de tester de nombreusessituations, y compris des projets de réforme.

Sur ce principe, la modélisation des codes réglementaires (construction, urbanisme, environnement, trans-ports…) associée à des algorithmes de nouvelles générations permettrait par exemple d’automatiser des pré-instructions d’autorisations environnementales ou de procédures d’urbanisme et d’indiquer en temps réel à unpétitionnaire que son projet est ou non conforme, en précisant le cas échéant les raisons du diagnostic et ses li-mites (ex : pré-instruction automatique du permis de construire). Cette modélisation facilitera à terme l’appli -cation des réglementations notamment environnementales.

Ce sujet est très lié à l’intelligence artificielle (IA) et la transformation numérique. L’IA apporte les algorithmeset les méthodes pour créer des nouveaux services autour des règles (moteur de règles). Elle permettrait aussisur le principe de modéliser rapidement et à faible coût le patrimoine important de règles existantes. Enfin, cesujet est intimement lié à la transformation numérique, car il induirait le besoin de créer un nouveau réflexeauprès des porteurs de politiques publiques : celui de modéliser les nouvelles règles en code numérique en plusde les publier en format textuel dans les lois et règlements.

SE PROJETER DANS LE NOUVEAU CADRE DE LA DONNÉE AU S EIN DE L’ÉTAT

16

Les premiers besoins d’accès à des données mé-tiers via des API

Un premier recensement des données à rendreaccessible via des API aux directions régionales aété réalisé et couvre un champ très large d’appli-cations (SUDOCUH, SANDRE, SITADEL...), d’outilsde diffusion (Prodige, Géo-ide, GéoKit3…) et deportails (GéoPortail IGN, portail Météo-France,GPU, Géorisques, GéoMCE…). Le développementd’un mécanisme d’API pour chaque donnée estcoûteux et chronophage. Pour répondre néan-moins au besoin d’accès dans un délai plus court,une solution transitoire est en cours de prototy-page par le SPSSI et permettrait de proposer auxproducteurs de données internes une premièrecollection d’API sur les données identifiées par lesdirections régionales et modélisées par des objetsmétiers. Le SPSSI et la DGALN expérimentent lemécanisme d’API sur la base de données SUDO-CUH.

Un référentiel partagé et accessible des zonagesréglementaires

Le SGD retient également la constitution, par l’ins-titut national de l’information géographique et fo-restière (IGN), d’un référentiel consolidé des zo-nages réglementaires pour faciliter leur mise enœuvre dans des procédures.

Page 17: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

Deux axes principaux sont à traiter d’ici à la fin de l’année 2019 : le service public de la donnée et le chantier« dites-le-nous une fois ».

Le service public de la donnée

Pour faciliter leur mise en œuvre dans les SI existants ou les nouveaux SI, la task-force SGD veille à acculturerles services du pôle ministériel au « service public de la donnée » (SPD). Des communications dédiées et unguide permettront d’apporter des conseils et des bonnes pratiques en la matière. C’est un bien commun au ser-vice de tous. (action 22)

Un travail spécifique est à mener avec les équipes SPSSI pour intégrer dans les processus de maintien en condi-tion opérationnelle et de projets le SPD. Une mise à jour des fiches projets et des conventions sera nécessaire,ainsi qu’une revue lors des comitologies SI du pôle ministériel. (action 23)

Dites-le nous une fois

Le principe « dites-le-nous une fois » vise à réduire le nombre d’informations et de pièces justificatives deman-dées aux usagers en développant les échanges d’informations entre administrations. Appliqué aux services cen-traux comme aux collectivités, cela conduit à un allégement des charges administratives des usagers. Il s’agit depromouvoir « une action publique modernisée, simplifiée et plus efficace ».

Quant à la mise en œuvre de DLNUF, une évaluation des impacts sur les démarches administratives du pôle mi-nistériel et les systèmes d’information qui leur sont associés est nécessaire pour construire une approche pro-gressive, réaliste et sans remise en cause du fonctionnement nominal des procédures concernées. Par un effortcoordonné entre le SGD et les services du SG, la réalité de la mise en œuvre des principes de DLNUF devra êtreexpertisée.

La réussite de l’API Entreprise ne doit pas occulter les difficultés réelles au sein des services pour la mise enœuvre de DLNUF (comme les zonages réglementaires). De fait, les directions générales, les directions régionaleset les opérateurs définissent des terrains d’expérimentation avec l’appui de la task-force SGD et en concerta-tion avec la Dinsic, la mission Etalab et les ministères concernés.

• Assurer la coordination des travaux pour faire inté-grer dans les démarches dématérialisées du pôle mi-nistériel les informations produites par d’autres ser-vices et qui ne seront plus demandés au regard duprincipe DLNUF (action 24)

• Assurer le relais des autres ministères qui ont expri-mé des attentes pour accéder aux données pro-duites par tout service du pôle ministériel et néces-saires à leurs démarches dématérialisées (action 25)

17

API entreprise

Opérée par la DINSIC, la plateforme d’échange« API Entreprise » met à disposition des donnéeset des documents administratifs de référence, re-latifs aux entreprises et association et délivrés parles administrations et les organismes publics, à finde simplifier les démarches administratives et lagestion des dossiers. Cet outil est une premièrecomposante de l’État plateforme, qui ambitionnela fourniture de ressources et de nouveaux ser-vices numériques à forte valeur.

https://api.gouv.fr/api/api-entreprise.html

Page 18: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

INFRASTRUCTURE APPLICATIVE ET TECHNIQUE

FAIRE ÉMERGER UNE NOUVELLE OFFRE D’OUTILS POUR TRAITER LA DONNÉE

Comme une route facilite les échanges et le transport des biens et des personnes, les lignes à haute tension lamise à disposition de l’électricité, l’infrastructure applicative et technique doit permettre une meilleure exploi -tation des données.

Cette infrastructure s’adresse en premier lieu aux services du pôle ministériel qui en sont les premiers bénéfi-ciaires, mais aussi à l’ensemble des acteurs de la chaîne de valorisation des données : société civile, entreprises,associations, bureaux d’étude, etc.

Les nouvelles technologies – intelligence artificielle (IA) objets connectés – et l’émergence des données mas-sives sur les transports, l’énergie ou le logement imposent une révision des moyens physiques (stockage, sauve-garde, archivage, capacité de traitement, etc.), des outils (base de données orientée documents1, stockage dis-tribué pour stocker et traiter des données (principe Hadoop2) et des solutions utilisables (datalake, gestionnaired’URI...) au sein du pôle ministériel. Ces outils une fois associés entre eux doivent permettre la définition denouveaux modèles d’infrastructure (successeurs de l’unique modèle gestion – ETL – infocentre actuellementdéployé pour tout projet SI) plus facilement utilisable.

IDENTIFIER LES NOUVELLES BRIQUES TECHNOLOGIQUES NÉCESSAIRES

Au regard du nouveau champ des possibles avec les données, une nouvelle réflexion en co-conception sur lesbriques technologiques sous-jacentes – associant le métier – est nécessaire.

Dans un premier temps, avec l’appui de la task-force SGD et des bureaux PSI du SPSSI, les directions générales,les directions régionales et les opérateurs construisent un nouveau cadre de leurs besoins métiers : parexemple l’échange de données au sein du pôle ministériel ou avec des partenaires externes, le stockage de don-nées en masse (big data), des traitements innovants (machine learning, deep learning, IA), etc. (action 26)

Il est à noter que les récents textes de loi ou les projets en cours intègrent dorénavant des dispositifs dédiés auxdonnées : loi Grandguillaume, TEPCV, biodiversité, mobilité, etc. À l’instar des données locales d’énergie (article179 de la loi TEPCV), il existe une évolution réelle vers la mise à disposition de données de plus en plus dé-taillées.

Dans un deuxième temps, avec l’appui métier des directions générales, les directions régionales et les opéra-teurs, le SPSSI conduit une expertise des besoins exprimées au regard de son offre de services et des nouvellessolutions techniques. Il propose une nouvelle offre, ainsi que les conditions de succès – en particulier lesmoyens humains et financiers – pour la déployer d’ici à la fin 2019. (action 27)

1 https://fr.wikipedia.org/wiki/Base_de_donn%C3%A9es_orient%C3%A9e_documents

2 https://fr.wikipedia.org/wiki/Hadoop

18

Page 19: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

Cette démarche fortement participative doit permettre decalibrer précisément ces nouveaux besoins pour ensuite pro-poser de nouvelles solutions. Elle se veut pragmatique enmobilisant la forte expertise du SPSSI ainsi que les initiativesexistantes et l’expérience accumulée par la réalisation deprototypes. Les travaux conduits par les entrepreneurs d’in-térêt général (EIG), les projets de la Fabrique numérique etceux issus de la transformation numérique lancés dans lesservices avec le sponsoring du SG ou les autres initiativesportées par les services sont autant d’expériences qu’ilconvient de valoriser.

CONSTRUIRE DES « MODÈLES » D’INFRASTRUCTURE

Bien que les projets répondent à des besoins précis et très différents entre eux, la construction de « modèles »d’infrastructure est nécessaire pour aider les services du pôle ministériel à construire leurs nouveaux SI dans ledomaine de la maîtrise des données ou de la gestion des API.

• La plateforme transport.data.gouv.fr constitue le point d’accès national aux données de transportafin de garantir une information voyageur fiable sur l’ensemble du territoire national. Cela contribue àaméliorer les liens entre les producteurs et utilisateurs de données, tout en fournissant les outils et lagarantie de leur qualité et de leur interopérabilité. (action 28)

• En septembre 2018, un « datalake » met à disposition des données publiques produites par le servicestatistique (SDES) du pôle ministériel. Courant 2019, en fonction de la maturité du projet, son déploie-ment hors du périmètre initial pourra être envisagé. Il serait alors un des outils sur étagère pour sim-plifier la mise à disposition des données dans des formats ouverts et dans le respect du 5 étoiles. (ac-tion 29)

• Dans le contexte de la directive européenne Inspire, un registre de listes de codes pour l’environne-ment ainsi qu’un gestionnaire d’URI sont mis en place par le BRGM et le CGDD. Ces éléments d’infra-structure ont pour objet de partager des listes de valeurs référentielles utilisées par plusieurs acteurset pourront être utilisés indépendamment de la directive Inspire par tout système d’information. (ac-tion 30)

• Un travail dédié à l’anonymisation des données, prérequis à l’ouverture de certaines données – enparticulier celles disposant de données personnelles – est à mener par les services du pôle ministérielproducteurs de données, avec l’appui de la DAJ et de la mission Etalab, qui dispose d’un marché dédiéà la science de la donnée. (action 31)

• Le SDES et son réseau des statisticiens en direction régionale a élaboré une nouvelle offre de forma-tion sur le logiciel opensource R. Son déploiement au sein du pôle ministériel est en court sous le pilo -tage des équipes FORCQ du SG. Cela contribue à la montée en compétence des agents sur le traite-

19

Les bases de données non relationnelles pourmettre en lumière les montages financiers

Depuis près de dix ans, les bases de données nonrelationnelles ont été démocratisées par lesgrandes entreprises du numérique, qui étaient li-mitées par les bases relationnelles dans leur ges-tion et le traitement du volume de données trèsimportants qu’elles détenaient. Récemment, lesbases de données orientées graphes ont été forte-ment popularisées par les journalistes lors de larévélation des « Panama papers » ou des « Para-dise papers » : elles leur avaient permis d’organi-ser et traiter une masse importante de donnéessous tout format (document PDF, image, mail,etc.), soit près de 13 millions de documents pourun volume de 1,3 To.

Page 20: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

ment de données, le machine learning et l’IA. De nouveaux modules de formation seront définis pourcouvrir ces nouveaux besoins. (action 32)

FAVORISER LA MISE EN ŒUVRE OPÉRATIONNELLE DES SOLUTIONS APPLICATIVES ET TECH -NIQUES

Le succès des projets innovants repose en premier lieu sur la capacité des services métiers à innover. Néan -moins, dès le lancement d’un projet, la capacité à fournir un nouveau service fiable et sécurisé – avec la priseen comte des exigences sécurité du règlement général de sécurité (RGS) – doit également être rapidement priseen compte. La pérennité de ces nouveaux outils construits sur des solutions nouvelles repose quant à elle surl’expertise des équipes techniques en charge de l’hébergement et de l’exploitation.

• Assurer la montée en compétence des équipes en charge de l’exploitation des centres serveurs dupôle ministériel pour assurer une mise en œuvre des nouvelles solutions de manière pérenne et selonles bonnes pratiques en la matière (dont la sécurité) (action 33)

20

Page 21: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

SÉCURITÉ ET CONFORMITÉ

RÉPONDRE AUX ENJEUX DE PROTECTION DE DONNÉES ET DE TRAÇABILITÉ DESUSAGES

La sécurité des données est l’affaire de tous. Pour y parvenir, au sein du pôle ministériel, une politique généralede sécurité du système d’information (PGSSI) est en application et son suivi est assuré par le bureau PSI4 en col-laboration avec le fonctionnaire de sécurité du systèmesd’information (FSSI).

Conçue en 19783 pour se protéger principalement des intrusions de l’État dans la vie privée, la protection desdonnées personnelles concerne très largement aujourd’hui les entreprises privées, particulièrement celles quiproposent les services numériques – réseaux sociaux et autres applications – fortement plébiscités par leurusage massif.

L’ambition du règlement général sur la protection des données (RGPD), qui entre en application le 25 mai 2018,est d’assurer la souveraineté des citoyens sur les données qui les concernent. Il y est réaffirmé l’obligation d’ob-tenir un consentement sur l’utilisation des données, le droit d’accès et de rectification aux données. Est égale-ment inscrit le droit à l’oubli et la mise en place de sanctions dissuasives, pouvant atteindre 4 % du chiffre d’af-faires mondial de l’entreprise concernée.

Il n’y a pas d’injonctions paradoxales entre ce règlement qui sanctionne la mauvaise gestion des données per-sonnelles et le mouvement de transparence des politiques publiques (ouverture des données et gouvernementouvert). C’est une réflexion équilibrée entre la protection de la vie privée et la mise à disposition de données deplus en plus massives et détaillées qu’il est nécessaire de construire. Les directions générales, les directions ré-gionales et les opérateurs pourront être accompagnés dans ces travaux grâce à l’appui de la direction des af -faires juridiques, de la mission Etalab et de la task-force SGD. Ces travaux doivent être réalisées en étroite colla -boration avec l’expertise de la DAJ et SPSSI.

PRENDRE EN COMPTE LES EXIGENCES RÉGLEMENTAIRES DANS LE CYCLE DE VIE DE LA DONNÉE

Dans le cadre de la mise en place du RGPD, la première étape consiste à construire un registre des traitementsde données. Cela revient à identifier les activités principales de chaque service du pôle ministériel qui néces -sitent la collecte et le traitement de données. Par exemple : gestion des ressources humaines (formation, recru-tement, paye), gestion des informations des entreprises oudes personnes physiques en relation avec les services, ges-tion des données d’enquêtes statistiques (sous secret), ges-tion des données fiscales (transmises par la DGFiP), etc.

• Mise en place du registre des traitements de don-nées, sous pilotage du Délégué à la protection desdonnées (DPD) et de la DAJ (action 34)

3 Loi de 1978 relative à l’informatique, aux fichiers et aux libertés, qui créa la Commission nationale informa-tique et libertés (CNIL), chargée de veiller à la protection des données à caractère personnel

21

Revue des traitements par la DAJ

Début 2018, la DAJ et le DPD ont lancé une revuedes traitements avec toutes les directions géné-rales pour constituer le registre des traitementsdu pôle ministériel. Des bilatérales sont program-mées avec chacune des directions générales, laDAJ et un représentant de la task-force SGD.

Page 22: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

DÉFINIR ET APPLIQUER UNE POLITIQUE DES DROITS D’ACCÈS

Pour les données non publiques, la politique des droits d’accès doit permettre d’établir un cadre de protectionet de sécurisation des données pour limiter le risque d’accès inapproprié ou non autorisé. Le risque zéron’existe pas en informatique, des mesures sont nécessaires pour garantir la sécurité des données. Le pôle mi-nistériel – l’ensemble de ses services – est tenu à une obligation légale d’assurer la sécurité des données per-sonnelles qu’il détient.

Au regard de la mise en application du RGPD, les chantiers prioritaires à traiter dans les tout prochains moissont :

• Définir la politique des droits d’accès aux données pour garantir leur sécurité, avec l’aide des équipesPSI du SPSSI, le HFDS, la DAJ et le SDES (action 35)

• Faire réaliser, par les services du pôle ministériel producteurs ou détenteurs de données sensibles, unepremière campagne d’audits sur les données les plus critiques, avec l’accompagnement de la sous-di -rection PSI du SPSSI (action 36)

• Veiller à l’intégration, dans les processus existants, d’un principe d’audits réguliers des droits d’accèssur les données en regard de leur criticité et des enjeux qu’elles portent (action 37)

Exemple : Vous immatriculez les marins. Ces derniers communiquent leur adresse précise, leur lieu de travail,des informations détaillées sur leur carrière, leurs formations, les dates de visite médicale. Si ces informationssont piratées ou perdues, elles peuvent être utilisées pour s’introduire frauduleusement au domicile des marinsabsents ou les démarcher abusivement pour des fausses formations. Conséquence désastreuse pour les marinset l’image du pôle ministériel.

METTRE EN ŒUVRE LES MÉCANISMES POUR TRACER LES ACCÈS AUX DONNÉES ET LEURS TRANSFORMATIONS AU COURS DU CYCLE DE VIE

Pour identifier un accès frauduleux, une utilisation abusive de données ou pour déterminer la chronologie d’unincident, il est nécessaire que les actions effectuées sur les systèmes informatiques soient enregistrées et régu-lièrement analysées. Deux dispositifs techniques participent à la maîtrise des accès aux données : une gestiondes traces et incidents (centralisation de l’enregistrement des événements sans possibilité d’altération) et uneanalyse de la corrélation des événements (a posteriori ou en temps réel).

Pour y parvenir, les premières actions prioritaires :

• Définir les mécanismes pour disposer d’informations détaillées sur l’accès aux données et leurs trans-formations tout au long du cycle de vie (action 38)

• Intégrer ces mécanismes dans les nouveaux projets selon la criticité des données qu’ils contiennent(action 39)

• Mettre en place une offre de service dédiée à la gestion des traces et à leur exploitation pour faciliterla détection des incidents sur les données (action 40)

22

Page 23: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

ANNEXES

23

Page 24: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

LISTE DES ACTIONS

action 1 : Faire de la maîtrise de la donnée un enjeu du pôle ministériel

action 2 : Intégrer la dimension donnée dans la gouvernance stratégique du pôle ministériel

action 3 : Mettre en place un comité des correspondants « données »

action 4 : Assurer un appui méthodologique, une expertise ou un relai

action 5 : Assurer un rôle de référent auprès de l’AGD

action 6 : Organiser des actions d’acculturation

action 7 : Partager le fonctionnement de la task-force SGD et des correspondants données et du réseau des ad-ministrateurs ministériels des données

action 8 : Partager les synergies possibles entre tous les acteurs des données et des systèmes d’information

action 9 : Mettre en place un groupe d’experts pour accompagner les services à la mise en œuvre du corpus derègles

action 10 : Évaluer deux sources de données chaque année pour chacune des directions générales, des direc-tions régionales, des principaux opérateurs au regard du corpus de règles

action 11 : Évaluer la satisfaction des services quant à l’appui de la fonction SGD dans leurs travaux ou projets« données »

action 12 : Construire une première version du corpus de règles en privilégiant une approche de co-construc-tion

action 13 : Tester les règles du corpus au sein des services et définir un indicateur de convergence de la donnéevis-à-vis des règles du corpus

action 14 : Identifier les conditions d’une généralisation et faire du corpus un standard au sein du pôle ministé-riel

action 15 : Partager les travaux du pôle ministériel avec l’AGD et les autres ministères, et identifier les synergiespossibles

action 16 : Réaliser un inventaire des données par les directions générales, les directions régionales et les opé-rateurs, avec l’appui de la task-force SGD

action 17 : Identifier collégialement les critères de classification des données

action 18 : Assurer une diffusion et une mise en oeuvre des critères au sein de la cartographie des données

action 19 : Expérimenter la modélisation des objets métiers sur les données prioritaires

action 20 : Identifier l’ensemble des données qui doivent être modélisées par des objets métiers

action 21 : Mettre en œuvre d’une architecture dite de « middle office » reposant sur des outils du web-séman-tique

action 22 : Acculturer les services au « service public de la donnée »

24

Page 25: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

action 23 : Intégrer le « service public de la donnée » dans le maintien en condition opérationnel des systèmesd’information

action 24 : Assurer la coordination des travaux pour faire intégrer dans les démarches dématérialisées du pôleministériel les informations produites par d’autres services et qui ne seront plus demandés au regard du prin -cipe DLNUF

action 25 : Assurer le relais des autres ministères qui ont exprimé des attentes pour accéder aux données pro -duites par tout service du pôle ministériel et nécessaires à leurs démarches dématérialisées

action 26 : Construire un nouveau cadre des besoins métiers par les directions générales, les directions régio-nales et les opérateurs, avec l’appui de la task-force SGD et des bureaux PSI du SPSSI

action 27 : Conduire une expertise des besoins exprimées au regard de son offre de services et des nouvellessolutions techniques.

action 28 : Construire le point d’accès national aux données de transport : transport.data.gouv.fr

action 29 : Construire un « datalake » pour mettre à disposition des données publiques produites par le servicestatistique (SDES) du pôle ministériel

action 30 : Mettre en place un registre de listes de codes pour l’environnement ainsi qu’un gestionnaire d’URI

action 31 : Mener un travail dédié à l’anonymisation des données, prérequis à l’ouverture de certaines données– en particulier celles disposant de données personnelles – avec l’appui de la DAJ et de la mission Etalab

action 32 : Elaborer une nouvelle offre de formation sur le logiciel opensource R

action 33 : Assurer la montée en compétence des équipes en charge de l’exploitation des centres serveurs dupôle ministériel pour assurer une mise en œuvre des nouvelles solutions de manière pérenne et selon lesbonnes pratiques en la matière (dont la sécurité)

action 34 : Mettre en place du registre des traitements de données, sous pilotage du Délégué à la protectiondes données (DPD) et de la DAJ

action 35 : Définir la politique des droits d’accès aux données pour garantir leur sécurité, avec l’aide deséquipes PSI du SPSSI, le HFDS, la DAJ et le SDES

action 36 : Faire réaliser, par les services du pôle ministériel producteurs ou détenteurs de données sensibles,une première campagne d’audits sur les données les plus critiques, avec l’accompagnement de la sous-directionPSI du SPSSI

action 37 : Veiller à l’intégration, dans les processus existants, d’un principe d’audits réguliers des droits d’accèssur les données en regard de leur criticité et des enjeux qu’elles portent

action 38 : Définir les mécanismes pour disposer d’informations détaillées sur l’accès aux données et leurstransformations tout au long du cycle de vie

action 39 : Intégrer ces mécanismes dans les nouveaux projets selon la criticité des données qu’ils contiennent

action 40 : Mettre en place une offre de service dédiée à la gestion des traces et à leur exploitation pour facili -ter la détection des incidents sur les données

25

Page 26: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

DÉFINITIONS & GLOSSAIRE

AGD : Administrateur général des données

AMD : Administrateur ministériel des données (fu-ture dénomination pour les ministères)

Anonymisation : rendre très difficile voire impos-sible la « ré-identification » des personnes phy-siques ou morales

API : Application programming interface. Permetl’échange d’informations entre deux logiciels de ma-nière simple et autonome

ARS : Agence régionale de santé

Big data : données en masse ou mégadonnées. Sedit à la fois des données avec certaines caractéris-tiques (volumétrie, hétérogénéité) et des usages quipeut en être fait

CGDD : Commissariat général au développementdurable

CGEDD : Conseil général de l’environnement et dudéveloppement durable

CNIL : Commission nationale informatique et liberté

DAJ : Direction des affaires juridiques

DGAC : Direction générale de l’aviation civile

DGALN : Direction générale de l’aménagement, dulogement et de la nature

DGEC : Direction générale de l’énergie et du climat

DGFiP : Direction générale des finances publiques

DGITM : Direction générale des infrastructures, destransports et de la mer

DGPR : Direction générale de la prévention desrisques

DINSIC : Direction interministérielle du numérique,des systèmes d’information et de la communication

DLNUF : Dites-le-nous une fois

DPD : Délégué à la protection des données

Dreal : Direction régionale de l’environnement, del’aménagement et du logement

DRI : Direction de la recherche et de l’innovation

DDT : Direction départementale des territoires

EIG : Entrepreneur d’intérêt général

Géo-ide : outil ministériel pour la cartographie

GéoKit3 : infocentre de données statistiques pourles DG, Dreal et DDT

GéoMCE : outil de géolocalisation des mesures com-pensatoires

GéoPortail : portail public permettant l’accès à desservices de recherche et de visualisation de donnéesgéographiques ou géolocalisées

GéoRisques : portail national d’information sur lesrisques naturels et technologiques

IA : Intelligence artificielle

IGN : Institut national de l’information géogra-phique et forestière

Insee : Institut national de la statistique et desétudes économiques

POC : Proof of concept, prototype

Prodige : outil libre, open source et gratuit pourmettre en œuvre une infrastructure de donnéesgéographiques

PSI : politique des systèmes d’information

RGPD : règlement européen pour la protection desdonnées

RGI : Référentiel général d’interopérabilité

RGS : Référentiel général de sécurité

RST : Réseau scientifique et technique

26

Page 27: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle

SANDRE : portail d’information des référentiels dusystème d’information de l’eau

SDES : Service de la donnée et des études statis-tiques

SG : Secrétariat général

SGD : Supervision générale des données

SITADEL : base des demandes d’autorisation pour laconstruction de locaux ou de logements

SPSSI : service de la politique sécurité et des sys-tèmes d’information

SUDOCUH : application nationale de suivi des docu-ments d’urbanisme et d’habitat

TEPCV : Territoire à énergie positive pour la crois-sance verte

27

Page 28: LA DONNÉE : UN NOUVEAU BIEN ESSENTIEL POUR LA … · LES CHANTIERS ESSENTIELS DE LA SUPERVISION DES DONNÉES ... Pour inscrire pleinement le pôle ministériel dans cette nouvelle