Au coeur de la plateforme « Data Science » de l’institut de sondage BVA


L’analyse de la donnée commence à se démocratiser. Preuve en est de la toute récente plateforme développée par l’institut de sondage BVA. Elle repose sur le Cloud Azure de Microsoft, et ses outils de manipulation de données, ainsi que sur les outils propres aux Data Scientists. 

La Data Science monte en puissance. C’est la volonté de l’institut de sondage BVA. Sa plateforme de Data science « simple » et sécurisée, a été créée dans un premier temps pour les Data Scientists de BVA, qui en avaient besoin pour leurs études.

Présentée par le DSI de BVA


Désormais, BVA veut la commercialiser auprès de ses clients, qui pourront toucher du doigt les données et les algorithmes résultant de leurs études. Voire plus. La plateforme, baptisée DmrP, a été présentée en détail par Alain Saugnac, le directeur des systèmes d’information de BVA, le 19 mars à Paris.

La partie « Data Science » repose sur les produits Azure de Microsoft, accessibles via un portail web. Comme socle, Azure délivre une distribution Hadoop dans le Cloud dénommée HDinsight. Elle s’accompagne d’Azure Machine Learning, un produit récent pour créer, déployer et partager des solutions d’analyse avancée des données.

Graphe des flux de données

Azure Machine Learning assure une expérience simplifiée, pour tous les niveaux de compétences, basée sur la création d’un graphe de flux de données et de ses transformations. Un exemple d’utilisation est proposé par BVA en vidéo

Plateforme BVA - 1 - BF

A partir des données, deux options de travail sont possibles. On peut soit prédire soit décrire. Dans le premier cas, on permet aux Data Scientists d’employer les outils qu’ils affectionnent : Python, R, SAS, etc.

BVA - Data Sciences - Prédire - BF

Dans le second cas, on emploie les outils de Microsoft disponibles dans le Cloud : Microsoft Office 365, Excel, etc.

Vision Prédire - BVA - BF

PowerPivot de Microsoft

La partie client de la plateforme se base également sur des produits Microsoft, en particulier sur PowerPivot qui est désormais installé dans Excel, PowerQuery et bientôt PowerBI. PowerPivot est utilisé pour insérer et intégrer de grands volumes de données dans des classeurs Excel.

Les données ajoutées au classeur sont stockées en interne, sous la forme d’une base de données PowerPivot elle-même incorporée dans le fichier Excel au format .xlsx. Cette base de données peut être utilisée dans les rapports Excel ou Power View qui est un add-on de visualisation de données pour Excel.

Outil de requête Microsoft

Afin de poser des questions, on utilise Microsoft Power Query pour Excel, qui est un ajout à Excel et qui permet de réaliser des requêtes sur de nombreuses sources de données, y compris sur HDinsight, de créer des vues, de nettoyer les données, etc.

Enfin, on dispose de PowerBI, qui est un outil récent de visualisation des données dans le Cloud, c’est un équivalent du produit de Tableau Software, qu’il est possible d’utiliser à partir d’Excel ou en direct.

Cloud privé si nécessaire

Côté stockage des données, la plateforme DmrP a été conçue pour offrir un stockage sécurisé sur le sol français. Les données résident dans le système d’information de BVA lorsque le projet n’est pas du Big Data, c’est à dire quand le volume de données est inférieur à 500 Go.

Sinon, les données sont placées sur un Cloud privé, partagé ou personnalisé, proposé par Novulys dans les autres cas. La question du stockage est donc prise en charge par BVA. BVA étant un revendeur certifié de Microsoft, les clients n’auront qu’un seul interlocuteur à gérer pour obtenir l’ensemble des produits qui leur sont nécessaires.

William El Kaim

William El Kaim est expert reconnu de la transformation digitale. Consultant indépendant, et auteur pour la Revue du Digital, il a exercé les responsabilités de "Marketing Technology Director" dans le domaine du voyage d'affaires. Il a contribué à l'invention de multiples concepts et produits digitaux, ainsi qu'au déploiement réussi d'un réseau social d'entreprise.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *