Le groupe de cosmétiques Clarins se transforme pour être Data Driven

Le groupe familial Clarins accélère sur la donnée

Pour un groupe familial tel que Clarins, leader en cosmétiques et parfums, le traitement intelligent des données massives devient un passage obligé.

Le département Data Science créé il y a 1 an et demi

Il y a un an et demi, le groupe a créé son département Data Science afin de répondre aux besoins de ses lignes métiers. Plusieurs cas d’usage ont été sélectionnés. On citera par exemple l’analyse des ventes e-commerce, le suivi de la fréquence d’achat des clientes ou l’écoute de la voix des consommateurs. La transformation par la donnée est en cours. « Cette transformation n’est clairement pas terminée. Nous avons pris une bonne direction et nous essayons d’être de plus en plus Data Driven » relate Pierre Andrieux, en charge du département Data Science pour le groupe Clarins. Il s’est exprimé à l’occasion du salon Big Data à Paris, le 11 mars.

“Le digital permet un contact direct avec les clientes et augmente les feedbacks collectés”

En particulier, Clarins entend être leader dans l’écoute de ses clientes. Le groupe souhaite notamment faire de ses clientes des ambassadrices de ses marques. Ce qui nécessite d’écouter tous les feedbacks collectés. Clarins développe un modèle de vente directe à ses clientes au fur et à mesure des années. « Le digital permet d’avoir un contact direct avec les clientes et d’augmenter les feedbacks et les verbatims collectés » présente le responsable.

Mais les outils existants ne permettaient pas de traiter des volumes de données aussi importants. De nouvelles compétences et de nouvelles technologies devenaient indispensables. « Il s’agissait à la fois de savoir ce qui se passe, à l’instar des équipes de Business Intelligence, et d’y ajouter du prédictif, pour savoir ce qui va se passer et émettre diverses hypothèses » résume Pierre Andrieux.

Quatre lignes métiers ont été retenues

Le département de Data Science de Clarins a été créé il y a 1 an et demi, en juillet 2017. « L’objectif est d’accompagner l’ensemble des équipes métiers dans le traitement de leurs données » ajoute-t-il. Plusieurs lignes métiers du groupe ont été sélectionnées qui avaient des besoins en termes d’analyse de données non traités jusqu’alors. Clarins a retenu le e-commerce, le CRM, les équipes média et la R&D.

Le pilotage de l’activité e-commerce nécessite plus de chiffres

Pour des raisons organisationnelles, Clarins s’est concentré sur trois cas d’usage dans la première phase du projet : e-commerce analytics,  second purchase conversion et consumer voice. « E-commerce analytics » avait comme objectif de piloter de manière un peu plus chiffrée le e-commerce, avec des indicateurs quasi temps réel sur l’activité online. « Second purchase conversion » était destiné aux équipes CRM afin de mesurer la fréquence d’achat des clients.

Pierre Andrieux, en charge du département Data Science pour le groupe Clarins

Le cas d’usage « consumer voice » est issu de la famille Clarins elle-même qui souhaitait remettre la voix du client au centre de l’entreprise. Le fondateur de Clarins, Jacques Courtin avait pour habitude de commencer toutes ses journées en lisant les petites fiches qu’il mettait dans ses packs produits sur lesquelles les clientes pouvaient faire des retours. L’objectif du cas d’usage « Consumer voice » était de transcrire cette habitude à l’ère du digital où l’on capture énormément d’avis clients afin de les lire et les analyser.

Les avis clientes sont analysés par un algorithme de Facebook

Après ses achats, la cliente peut laisser des avis sur le site de Clarins. Le Poc (Proof of concept) « consumer voice » a débuté avec différentes sources de données. Clarins utilise les informations issues de Google Customer Review, qui est un programme qui permet à tous les détaillants d’envoyer un questionnaire à leurs clients post achat pour leur demander leur avis sur leur expérience online. Clarins utilise également Bazaarvoice qui est un outil de gestion des avis clients et MyFeelback qui est un questionnaire envoyé aux clientes afin de collecter leur NPS (Net Promoter Score), popularisé par Amazon.

La solution associe le Cloud public de Microsoft et l’intelligence artificielle de Facebook

Tous ces avis clients sont placés dans un Data Lake. Ils sont traduits en anglais grâce à une interface applicative API de traduction d’Azure, le Cloud de Microsoft. La donnée est ensuite confiée à un algorithme de « sentiment analysis », analyse de sentiment, intitulé Fast Text, développé par Facebook Research et fonctionnant en apprentissage automatique (Machine Learning). Il s’agit d’un projet Open Source qui permet de réaliser de l’analyse de sentiment sur des verbatims. Afin de visualiser ces résultats, ils sont traités dans des tableaux de bord gérés par Superset, un outil Open Source.

L’outil permet de filtrer par exemple selon les marques ou les pays. Les données sont collectées sur l’ensemble du groupe Clarins. A ce jour, Clarins dispose de près de 90 000 avis. L’algorithme en a qualifié 60 000 comme positifs. Une partie est neutre, l’algorithme n’arrivant pas à se positionner. Et 17 000 sont indiqués comme négatifs.

Améliorer l’algorithme grâce aux collaborateurs de Clarins

L’algorithme n’est pas à 100% exact. Il peut se tromper et ne pas analyser le texte d’avis de manière correcte. « On peut retrouver le verbatim dans sa langue d’origine, la traduction en anglais, l’analyse sentimentale, le score donné par le client et ensuite les noms des produits sur lesquels ont été postés ces avis quand ils sont liés à un produit » décrit le responsable.

Une centaine de collaborateurs accèdent aux avis clients

Ce Poc, réalisé au premier semestre 2018, a été mis en production il y a quelques semaines auprès d’une centaine de collaborateurs. L’algorithme sera enrichi tous les jours par les nouveaux avis et enregistrer les nouveaux avis afin d’améliorer son système de scoring. Un nouveau projet devrai suivre : l’apprentissage renforcé. « Nous allons aider l’algorithme à améliorer son score. L’idée serait une nouvelle interface qui permettrait aux collaborateurs de revoir le sentiment qui a été attribué par l’algorithme » annonce Pierre Andrieux.

Clarins est un groupe familial spécialisé dans les parfums, la cosmétique et la mode. Il a été créé en 1954 par Jacques Courtin-Clarins. Le pôle Beauté rassemble les marques Clarins et My Blend ainsi que l’activité Spas. L’ensemble des marques de parfums Mugler, Azzaro Parfums et la Mode Mugler sont regroupées sous l’entité Clarins Fragrance Group. Sur certains territoires, le groupe gère également la distribution d’autres marques. Le groupe emploie 10 000 personnes dans le monde et gère 28 filiales pour la distribution de ses produits.

Il faut absolument définir un vocabulaire commun entre tous les métiers

Un projet Big Data n’est pas un long fleuve tranquille. Clarins a rencontré deux types de difficultés lors de la mise en place de son Data Lake : la définition d’un vocabulaire partagé pour décrire les activités de l’entreprise par toutes les lignes métiers, et arriver à embarquer les utilisateurs qui ne sont pas des experts techniques. « Les difficultés principales que l’on a pu rencontrer concernent le sujet du MDM, le master data management » confirme Pierre Andrieux, en charge du département Data Science pour le groupe Clarins.
« Il a fallu faire travailler des équipes de différentes lignes de métiers, la finance avec la supply chain, le e-commerce et le CRM. Chacun ayant son propre vocabulaire et ses propres définitions » souligne-t-il. « Cette partie MDM est clé pour l’ensemble des projets Data car si on n’arrive pas à avoir un consensus ou au moins un endroit où les définitions des mots utilisés pour faire de l’analyse sont posées, cela reste très compliqué » prévient-il. Enfin, il a fallu embarquer les équipes qui n’ont pas forcément les compétences techniques pour manipuler la donnée et leur proposer des solutions les plus simples à utiliser.

Une trentaine de cas d’usages issus des groupes de travail

Lors des groupes de travail et la phase d’idéation, des cas d’usages ont été listés en fonction de leurs gains potentiels et de leur complexité. On trouve ainsi, la personnalisation, la personnalisation du site Web, la saisonnalité des ventes, la vision 360° des produits, l’abandon de panier, la fréquence des achats et le réapprovisionnement, la qualité du trafic, la qualification de la base de données, les sessions client, la conversion sur le second achat, l’analyse du e-commerce, la conversion des prospects en clients, la personnalisation des emails, un tableau de bord des investissements en digital, la voix du client, la détection de fraudes, l’identification des nouveaux clients, le taux de conversion, la détection du canal de communication préféré, la réduction des risques par rapport au temps de développement, l’amélioration de la qualité des données, le programme de fidélité, le suivi des campagnes, les ventes croisées et upsell, l’efficacité média, l’échantillonnage, et la recommandation ou reformulation.

Une plateforme Open source dans le Cloud Azure

Le département Data Science de Clarins a été créé en juillet 2017. Clarins retient alors la société de conseil Openvalue comme partenaire, spécialisée en Big Data, Internet des objets et en Machine Learning. Lors d’une première phase d’idéation, des groupes de travail ont été menés avec les équipes du e-commerce, du CRM, des médias et la R&D. Il en est sorti un ensemble de cas d’usage et il a été mis en place une infrastructure pour les traiter.
En janvier 2018, Clarins effectue le choix des cas d’usage pour la Data Science et définit les composants logiciels de sa plateforme informatique. Clarins choisit alors le Cloud Azure de Microsoft. « Nous avions le choix entre les différents Clouds publics de Amazon et de Google, mais nous nous sommes orientés sur Azure avec qui on avait déjà un partenariat » explique Pierre Andrieux, en charge du département Data Science pour le groupe Clarins.
L’équipe Data met ensuite en place la technologie Open Source Hadoop dans sa version proposée par Cloudera, complétée par les outils Spark et Hive. « Il n’y avait pas énormément de distributions Hadoop différentes, les principales étant MapR, Cloudera, et Horton Works. Nous avons choisi Cloudera afin de gérer l’ensemble de ces données, et avoir accès aux technologies Open Source liées au Big Data ». Pour la Data Visualisation, Clarins a utilisé Superset, un autre outil Open Source, qui présente l’avantage budgétaire de ne pas devoir acheter une nouvelle licence à chaque fois qu’il y un nouvel utilisateur. Cela permettait d’étendre plus facilement l’accès à la donnée à l’ensemble des collaborateurs.

 

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletters de La Revue

Retrouvez le meilleur de l'actualité du digital


Restez connecté !