open source et Scikit-learn-contrib

Partage d’algorithme en open source et publication dans Scikit-learn-contrib : les nouveaux virages data du Groupe BPCE

To be open or not to be ? A priori, ce n’est pas forcément naturel. Et pourtant, aujourd’hui, tous les grands groupes digitaux comme Google, Amazon, Facebook nous démontrent l’inverse en partageant codes et logiciels gratuitement, en toute transparence avec la communauté des développeurs. Cette démarche, d’open source comporte de nombreux avantages comme garantir et améliorer en continu la qualité de l’algorithme ou intégrer le contributeur dans une communauté dynamique et innovante.

S’ouvrir à la communauté data avec Skope Rules

 

To be open or not to be ? C’est justement à une nécessité d’ouverture que répond Skope Rules, un package de data science autour d’un algorithme de prédiction, développé par l’équipe Modèles internes et Big Data, de la Direction des risques du Groupe BPCE. Les modèles utilisés aujourd’hui en data science sont très performants mais il s’agit de modèles dits « boîte noire », c’est à dire que le résultat de l’algorithme est connu mais pas le processus qui a permis d’aboutir à ce résultat. Un état de fait qui ne correspondait évidemment pas aux critères d’audits inhérents à l’activité bancaire. Alors, l’équipe s’est attelée à la tâche et a relevé le défi « d’ouvrir » la boîte noire en réussissant à extraire les règles logiques de ces modèles. Une véritable innovation partagée avec toute la communauté internationale des développeurs grâce à l’Open Source et qui pourra servir demain dans de nombreux domaines d’application comme la médecine ou l’industrie.

 

Y aura-t-il un avant et un après ?

 

To be open or not to be ? Dans le secteur bancaire, certainement ! Grâce à ses équipes, le Groupe BPCE devient le premier groupe bancaire à partager un algorithme en Open Source et à publier un algorithme dans Scikit-learn-contrib, bibliothèque de langage de développement d’une grande exigence, la plus connue et la plus utilisée par les développeurs du monde entier ! « Cela va nous donner une grande visibilité dans le monde de l’open source et des data scientists. Nous allons être identifiés comme contributeurs et pas seulement comme utilisateurs des travaux des autres et ça, ça change tout », déclare Bibi N’Diaye à l’initiative du projet. Et l’histoire ne fait que commencer !  » Notre algorithme permet de suivre le processus de décision qui amène d’un point A à un point B. Par exemple, dans le cas d’une fraude, ce qui nous intéresse c’est la stratégie qu’ont adopté les fraudeurs », explique-t-il. « Mais nous souhaitons aller encore plus loin. Pour reprendre notre exemple, les stratégies de fraudeurs changent ; nous souhaitons donc développer un algorithme cognitif permettant de les suivre dans le temps. » A suivre !