Orange se prépare au Machine Learning pour analyser le comportement de ses clients


Orange passe au Big Data et au Machine Learning afin de traiter un plus grand nombre de variables plus rapidement. Il s’agit de mieux prédire le comportement et les appétences en services de ses clients. 

Orange passe à la vitesse supérieure en matière de prédiction du comportement de ses clients. L’opérateur prépare le passage au Big Data et au Machine Learning. C’est ce qu’a présenté Claude Riwan, directeur de l’équipe scoring d’Orange. Il est intervenu lors de la conférence “PAPI Connect” du 21 Mai à la Cité Universitaire Internationale de Paris.

Multiplication par 16


L’opérateur télécoms multiplie le nombre de variables suivies. Il était temps de passer au Big Data et au Machine Learning. Avec l’aide de la startup PredicSis, Orange a multiplié par 16 le nombre d’agrégats, passant à 320 000 agrégats testés, sachant qu’ un agrégat représente par exemple le nombre de contacts entre Orange et le client par mois.

De même, le nombre de coeurs du serveur de prédiction est passé à 32 – contre 1 seul coeur jusqu’alors – pour un temps de calcul ramené à 30 minutes. Les travaux de réglage sont toujours en cours afin de réduire la durée de modélisation du moteur de Machine Learning et de calcul.

Des millions d’agrégats

Dans une troisième phase, Orange procédera pour chaque modèle de prédiction au test de plusieurs millions d’agrégats. Ces agrégats seront calculés à la volée en utilisant les techniques du Big Data et les outils de prédiction de PredicSis.

L’objectif est de valoriser des sources de données brutes jusqu’à présent inutilisées comme les fichiers d’historiques des programmes qui sont regardés à la télévision par un client ou l’historique des performances du réseau.

La TV des enfants

Orange sera alors capable d’étudier, par exemple, ce qui se passe pour chaque client le mercredi après-midi, jour où les enfants n’ont pas école, et d’en déduire de nouveaux scores qui seront utilisés pour créer de nouvelles offres, réaliser du push marketing, ou proposer des tarifs sur les bouquets TV enfants.

Le Big Data accroît l’espace de recherche (et de création d’agrégats) au travers de nouveaux gisements de données.

De nouveaux gisements de données

Lorsqu’on fait du scoring, en général, on utilise quelques dizaines de variables candidates pour un modèle. Actuellement, Orange teste systématiquement 20 000 agrégats prédéfinis lors d’une modélisation.

Claude Riwan appelle cela du Big Data en architecture Small Data, car côté technique un seul serveur mono-cœur est utilisé pour les calculs.

Sept univers d’Orange 

Le directeur est à la tête d’une équipe de cinq personnes. Il utilise des techniques de scoring pour augmenter l’efficacité des actions commerciale et marketing de l’opérateur télécoms, tout en réduisant les coûts.

Il calcule ainsi l’appétence d’un client à une offre concurrente d’Orange ou le score de fragilité d’un client de la fibre optique. Les scores couvrent sept univers clefs d’Orange : Internet, la fibre, 4-play, mobile, fixe, foyers et prospects. Chaque mois, Claude Riwan calcule 413 séries de notes de score, soit environ un total de 1,6 milliard de notes.

Equipement concurrent

Tous les six mois, ce sont 500 autres séries de notes, qualifiées de score qualification ou d’intérêt, qui sont calculées. Orange évalue ainsi pour un client la détention potentielle d’un équipement concurrent (un abonnement mobile chez un autre opérateur, par exemple) ou l’intérêt estimé pour une chaîne de sport.

Le scoring s’appuie sur l’identification et la combinaison de variables qui expliquent statistiquement le phénomène étudié. Elles sont combinées dans une formule de « score » qui modélise le phénomène. On attribue ensuite des notes individuelles de « score » selon la probabilité d’occurrence du phénomène en appliquant la formule.

La fragilité d’un client

Le scoring sert à prédire l’occurrence d’évènements clefs, tels que la souscription à une offre ou son degré de fragilité, et pour estimer les informations manquantes dans le système d’information.

Le scoring exploite par exemple des informations comme l’âge, la composition familiale, la catégorie d’appartenance CSP, la détention d’équipements concurrents ou les centre d’intérêts, dans le but de transmettre des messages personnalités aux clients.

L’appétence 

Les usages du scoring se scindent en deux grandes familles. Il y a d’abord le ciblage proactif qui évalue l’appétence d’un client aux produits d’Orange. Les campagnes marketing effectuent ce ciblage via les canaux de communication tels que le téléphone, le SMS, l’email et la brochure.

En 2014, par exemple, sur l’offre « Broad Band » (haut débit), les scores utilisés par Orange étaient la fragilité du client, l’appétence aux bouquets TV, l’appétence aux vidéos on demand, l’appétence au parrainage, l’appétence à la montée en gamme 4-play, … Au total, 70 scores ont été utilisés en mode proactif, et 10% des campagnes se sont appuyées sur des scores.

Et l’on trouve le marquage réactif qui entraine le re-routage direct des appels entrants des clients évalués « fragiles » à un service client dédié, dénommé prévenance, ou à des services de push en point de vente, sur la TV et le mobile.

Client injoignable

Il existe enfin un dernier usage centré sur la connaissance du client qui concerne la qualification des bases, les scores exploratoires pour des usages analytiques (comme les clients injoignables ou qui utilisent Cineday) et les alimentations des autres scores.

Le scoring est dans tous les cas réalisé en respectant le droit à la vie privé des clients, Orange n’utilisant que les données que le client accepte de partager via une procédure de déclaration volontaire (opt-in).

Le cycle de vie du score

En prenant l’exemple du score prédictif du « churn » (ou le risque de perdre un client), Orange s’appuie sur les données d’avant-hier pour construire une formule qui aurait prédit au mieux le churn d’hier.

Puis les données d’aujourd’hui sont appliquées pour prédire les données de demain. Enfin, la prévision d’avant-hier est rapprochée avec celle d’hier avec le churn effectif d’hier. Et chaque mois, les notes de score sont recalculées et les performances du modèle évalué.

Photo : Claude Riwan, directeur de l’équipe scoring d’Orange, le 21 mai

William El Kaim

William El Kaim est expert reconnu de la transformation digitale. Consultant indépendant, et auteur pour la Revue du Digital, il a exercé les responsabilités de "Marketing Technology Director" dans le domaine du voyage d'affaires. Il a contribué à l'invention de multiples concepts et produits digitaux, ainsi qu'au déploiement réussi d'un réseau social d'entreprise.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *