À propos de Substra Foundation

Substra Foundation est une organisation à but non lucratif indépendante, dédiée à l’exploration d’approches de la data science sûres, responsables et protectrices des données sensibles, et au développement d’écosystèmes de data science de confiance. Elle travaille en particulier sur les collaborations multi-partenaires en data science. Elle promeut, contribue et anime le projet open source Substra qui permet l'orchestration décentralisée, sécurisée, et traçable de tâches de machine learning dans un cadre protecteur de la confidentialité des données. Elle se donne pour objectif de :

  • Collecter des retours sur l’usage de Substra

  • Synthétiser les suggestions d’évolutions et proposer une roadmap commune de développement

  • Héberger les dépôts Github de Substra

  • Animer des groupes de travail sur les collaborations multi-partenaires en data science

  • Proposer de nouvelles idées et pratiques pour des approches responsables et de confiance de la data science

Le premier contributeur et partenaire-clef de Substra Foundation est Owkin, une start-up spécialisée en machine learning dans le domaine médical, qui dédie une équipe technique au développement de la première version de Substra Framework. Sa publication à l’automne 2019 sous licence Apache 2.0 démarrera l’ouverture des collaborations open source.

Substra Foundation se donne notamment pour objectif de fédérer et animer une communauté active de contributeurs et d'utilisateurs du framework Substra.

Pourquoi ?

Un nouvel espace émerge au croisement entre expansion des algorithmes d'IA dans les organisations et inquiétudes du public sur les données privées et le manque de transparence des algorithmes. Ce sont deux tendances puissantes, qui ne ralentiront pas, et qui commencent à se percuter.

Cela ouvre donc un espace de recherche et d'innovation sur les approches, les méthodologies et les outils qui permettront de conjuguer les deux. Il s'agit de libérer plus de données pour la recherche et pour combler le "manque à savoir" dans de nombreuses disciplines, tout en assurant un haut niveau de protection aux données personnelles ou sensibles, et en garantissant la qualité et la transparence des travaux de data science. Défi immense et passionnant !

Le framework open source Substra s'inscrit dans ce mouvement de conjugaison des 2 tendances décrites, en permettant d'orchestrer de manière sécurisée et transparente des projets de data science entre plusieurs partenaires. Il est compatible avec des architectures décentralisées où les données restent locales et ne sont jamais transmises.
C'est une petite pièce du problème, mais qui ouvre déjà des cas d'usage prometteur (coopération entre compétiteurs par exemple). Un enjeu est aussi de favoriser la complémentarité et la compatibilité avec les techniques et outils dites 'privacy-enhancing' (e.g. differential privacy, SMPC, FHE...) sur lesquels la communauté travaille.

Lignes d’action

Nous sommes une équipe de passionnés, engagés, qui souhaite rassembler une communauté de contributeurs et de parties prenantes intéressées, et participer à l’effort collectif de recherche et d’innovation dans le domaine de la data science de confiance. Nous nous concentrons sur les lignes d’action suivante :

 

Consortiums industriels de R&D

Nous sommes engagés dans des consortiums de recherche (voir pages HealthChain et Melloddy) dédiés à de nouvelles collaborations en data science sur des données sensibles

Initiative open source Substra Framework

Notre rôle est de promouvoir, contribuer et animer le projet open source Substra. Substra est un framework pour l’orchestration sécurisée, traçable et décentralisée de tâches de ML. Il est basé sur Hyperledger Fabric, le framework DLT de référence hébergé par la Fondation Linux. La 1ère version de Substra est développée par Owkin, elle sera publiée sous licence Apache 2.0 à l’automne 2019 afin d’ouvrir les collaborations open source.

Contribuer à l’effort collectif

Nous contribuons à l’effort collectif de la communauté ‘IA de confiance’. Nos sujets d’étude : contributivité d’un jeu de données à un modèle, certification du mode de validation d’un modèle, scoring des pratiques de “data science responsable”.

 
 

STATUT ADMINISTRATIF

Substra Foundation est une association loi 1901. Elle a été créée auprès de la préfecture de Loire-Atlantique le 11 mai 2018, elle a reçu l’identifiant RNA W442019641 et son siret est 839 793 171.

Plus d’infos

Pour obtenir plus d’informations nous vous invitons à :

postes ouverts

Voici la liste des postes sur lesquels nous recrutons actuellement :

  • Open source software engineer (Nantes, France), lien

Partagez-les à volonté ou bien candidatez à jobs@substra.org !