Intelligence artificielle : l’Inria pousse au partage des algorithmes

Bruno Sportisse, PDG de l'Inria depuis juin 2018 (Inria / Photo C. Tourniaire)

L’Inria, l’Institut national de la recherche en informatique et en automatique, entend étendre l’initiative scikit-learn, une bibliothèque logicielle de référence dans le domaine du Machine Learning (apprentissage automatique).

Axa et BNP Paribas Cardif partenaires

Des entreprises utilisatrices sont partenaires telles que les assureurs Axa ou BNP Paribas Cardif. De grands acteurs américains tels que Microsoft, Nvidia et Intel sont également associés. Seul prestataire français, la jeune pousse Dataiku qui propose une plateforme de développement de solutions d’intelligence artificielle.

Les logiciels partagés ont des usages diversifiés : lutte contre la fraude et le spam, ciblage marketing par e-mailing, prévision des comportements des utilisateurs et optimisation des processus industriels et logistiques. A titre d‘exemple, une utilisation grand public comme la réservation de lieux d’hébergement touristiques a besoin d’outils de Machine Learning tels que ceux de scikit-learn afin d’automatiser les tâches. Il faut faire appel à un Data Scientist pour comprendre les applications et les données qu’elles génèrent, afin de programmer les systèmes de traitement de ces données.

En évolution continue, scikit-learn est une bibliothèque d’apprentissage statistique qui se veut accessible aux non-experts en sciences des données. Au stade de l’exploration des données, l’utilisateur saisit quelques lignes de commande dans une interface interactive et doit pouvoir immédiatement visualiser les résultats de sa requête.

Débuts du projet en 2007

Scikit-learn a été lancé en 2007 et réunit des logiciels développés en langage Python. Il est dans le top 3 des logiciels de Machine Learning les plus populaires sur GitHub, indique l’Inria.

Scikit-learn extrait la structure des données complexes pour prendre des décisions à partir de bases de données, de textes, et d’images pour les classifier en utilisant des techniques statistiques. Scikit-learn est développé en Open source et est disponible sous licence BSD. Un site Web (scikit-learn.org), présente le projet et ses applications.

Scikit-learn est employé par exemple par les entreprises du Web pour prédire des comportements d’achat de consommateurs, pour recommander des produits ou pour détecter les tendances ainsi que les comportements abusifs tels que les fraudes, les spams, etc. Scikit-learn sert à extraire la structure de données complexes (textes, images), et à les classifier en utilisant des techniques correspondant à l’état de l’art.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *