rapport agd

2ème édition du rapport de l’AGD : La donnée, une infrastructure essentielle ?

Les dernières années ont vu se développer une prise de conscience de la donnée vis à vis de son ouverture, ses utilisations. L’Etat s’est emparé du sujet et propose différentes initiatives dont la deuxième édition du rapport de l’Administrateur Général des Données (AGD) qui tente d’apporter un cadre général. Quel est son apport ? Comment un groupe bancaire comme BPCE peut en bénéficier ?

Une ressource rare qui devient abondante, induit forcément des transformations sociales. L’agriculture pour la nourriture, l’imprimerie pour l’instruction, les processus industriels pour la production en série, sont des ressources qui ont profondément modifié nos modes de consommation. Chacune se traduit par une révolution (agricole, industrielle…). De fait, Internet marque l’abondance de la donnée sous le sceau d’une révolution (appelez-la numérique, digitale).

La fonction d’Administrateur Général des Données (AGD, l’équivalent anglo-saxon des Chiefs Data Officer) a été créée en septembre 2014 pour préparer l’Etat français à cette révolution de la donnée. Ainsi commence le 2ème rapport de l’AGD, paru le 10 avril 2018 et remis symboliquement par Henri Verdier, administrateur général des données et « DSI de l’Etat » à Mounir Mahjoubi secrétaire d’Etat auprès du Premier ministre chargé du Numérique. Classiquement, on y trouve un état des lieux, un bilan et une feuille de route sur la donnée. Au-delà d’un plébiscite pour l’ouverture des systèmes d’informations, ce qui en fait son intérêt c’est son engagement et sa volonté de transparence.

Un pas en avant vers la transparence de la données

 

 Que ce soit dans les réussites, les constats de faiblesse ou les articulations théoriques, la transparence est l’une des caractéristiques de ce rapport. Choix logique : il s’agit par la construction d’une Plateforme Numérique d’Etat, d’inciter différents acteurs de l’économie numérique à s’en emparer, développer leur propre valeur ajoutée et faciliter la capacité à générer leurs propres revenus. Un exemple notable est la description de la mise en œuvre et des résultats du programme Entrepreneurs d’Intérêt Général. Sa vocation c’est, avec une petite équipe qui travaille en mode agile, de répondre à un besoin, un irritant, en 10 mois. Parmi les résultats, l’utilisation de nouveaux services pour la lutte contre le chômage, l’aide à l’identification des entreprises en difficulté, la lutte contre la fraude aux permis de conduire. Une entreprise acquérant une masse salariale critique a tout intérêt à mettre en œuvre ce type de programme pour faire émerger ce qu’on appelle une innovation ouverte. Cela devient un jeu d’identifier les différences, de se « benchmarker ».

Un engagement de la part de tous les acteurs de la donnée

 

Parler de « préservation de la souveraineté informationnelle », ce n’est pas juste faire référence aux technologies, mais aussi à la stratégie et la politique. Ce rapport dénombre une petite dizaine de référentiels dont la criticité a été jugée telle que les données sont désormais dites de référence. Et d’autres pourraient émerger.

Chapitre essentiel de la théorie des bases de données : les identifiants uniques (ou clé primaires, ou indexes) permettant d’isoler et d’identifier chaque élément dans une table pour une base de données. En général, cet identifiant est interne et spécifique à chaque système de base de donnée. Ces données de références sont des identifiants uniques, publics et permettent donc de relier deux ou plusieurs bases de données entre elles.

A propos du SIRET, l’identifiant d’entreprises émis par l’INSEE institution de l’Etat, le rapport mentionne la possibilité de se retrouver en concurrence avec l’identifiant de l’acteur privé américain Bloomberg. On perçoit alors un risque potentiel pour l’Etat et pour les entreprises dont les systèmes d’information dépendent du SIRET, accessible librement et gratuitement depuis janvier 2017. Il apparaît sur les fiches de paye, est mentionné sur l’ensemble des documents commerciaux, et mentions légales, mais il est aussi utile aux banques, puisqu’il prouve l’existence légale d’une entreprise lors de certaines démarches bancaires (attribution d’un prêt…) S’il venait à disparaître (bien que cela soit peu probable), le remplacer par l’identifiant Bloomberg signifierait techniquement, qu’il faille analyser les impacts SI (Système d’Information), les projet d’évolution, la vérification de non régression… Opérationnellement, il faudrait aussi négocier avec Bloomberg sur la tarification d’usage. Stratégiquement, cela signifierait, créer une dépendance vis-à-vis d’une entreprise privée étrangère.

La base SIREN et les SIRETs, identifient des entreprises françaises. On pourrait concevoir l’ajout d’une série de caractères permettant de les intégrer dans un référentiel international, un peu comme pour les préfixes téléphoniques pour les appels internationaux. Le schéma mentionné dans ce rapport, attribué à l’économie numérique ouverte : standard de fait, est plus que jamais d’actualité.

L’ouverture du système d’information

 

L’ouverture d’un système d’information n’a d’intérêt que pour des interactions avec d’autres systèmes d’informations ouverts. Elle implique une standardisation, que ce soit sur le plan technique, puisque « certains travaux visent à définir des normes et obligations de format, afin de rendre comparables et agrégeables des données qui sont produites par une grande variété d’acteurs » (page 20 – 2nd rapport de l’AGD) ou même juridique car  « la loi supprime la possibilité de se prévaloir de droits de propriété intellectuelle pour faire obstacle à la libre réutilisation de leurs bases de données (droit sui generis du producteur de base), sauf pour les données produites dans le cadre d’une mission de service public industriel et commercial soumise à la concurrence » (page 24 – 2nd rapport de l’AGD).  Nous avons vu précédemment, la différence entre l’identifiant interne d’une base de données, la clé primaire et le pivot public, le SIRET –. D’après le code des relations entre le public et les administrations, les données de référence doivent permettre d’« identifier ou de nommer des produits, des services, des lieux, et des personnes ». Si le périmètre actuel des données est public, on peut également imaginer des pivots non publics recélant un intérêt similaire. Les numéros de sécurité sociale qui permettent d’identifier une personne physique de manière unique, les IBAN bancaires, les PDL ou PCE utilisés pour l’identification de points de livraison ou de comptage d’énergie, les plaques d’immatriculations… Ces identifiants font le pont entre le monde réel et les systèmes d’information.

L’ouverture de l’indexation de produits et services d’une entreprise n’a pas toujours vocation à devenir publique, mais elle peut permettre à une entreprise d’intégrer les marchés digitaux de l’offre et de la demande et d’y jouer, en conservant une liberté de choix dans ses règles, ses politiques et ses stratégies. On parle souvent du CEO d’Amazon Jeff Bezos qui en 2002 dans une communication interne a exigé une API-fication du SI autant pour les communications externes  qu’internes. Cette approche facilite la mise en œuvre de nouveaux développements soit parce  que les API le permettant existent déjà, soit parce que le développement d’une nouvelle d’API est devenu une compétence usuelle de l’entreprise

 

Baptiste Sans-Jofre
Architecte IT-CE – Groupe BPCE
@BaptSansJofre