L’actualité de la transformation

Le Data Scientist du Big Data : un scientifique parlant business, mouton à cinq pattes

Une équipe de Data Scientists chez Criteo 

La technologie de Criteo s’appuie massivement sur le Big Data et la société a constitué sa propre équipe de Data Scientists regroupés dans une entité baptisée « Engine ».  « Ils déterminent les algorithmes pour ‘cruncher’ la donnée » décrit Romain Niccoli.  Cruncher?  C’est le fait de réduire le volume d’informations nécessaire en entrée des serveurs. « Il s’agit de ne pas travailler avec des statistiques naïves » pointe-t-il.

Si l’on appliquait un algorithme de statistiques pur, il faudrait des milliards d’informations (320 milliards d’affichages exactement) afin de prendre une bonne décision. Or les algorithmes de Criteo travaillent avec des jeux de données plus réduits. Les Data Scientists de Criteo définissent dans le même temps les bons algorithmes de calcul prédictif afin de prévoir le comportement des internautes vis-à-vis des bannières publicitaires qu’on leur propose.


Côté entreprises utilisatrices, on identifie également la nécessité des Data Scientists. Valérie Abrell-Duong, en charge des solutions de CRM chez Procter & Gamble, constate “qu’il y a besoin de statisticiens pour créer des algorithmes.” Elle s’exprimait pour sa part lors d’un événement Big Data organisé par Supelec Numérique, le 14 Novembre.

Il y aura toutefois un effort de rapprochement à effectuer du côté des métiers également. “Entre le marketeur et le Data Scientist, il y a un gap énorme. Il faut que les marketeurs pensent out-of-the-box. Ils n’y sont pas du tout” prévient Christine Ballagué, qui anime la chaire de réseaux sociaux à Télécom Ecole de Management. Elle s’exprimait lors de l’événement Big Data organisé par l’Aproged et la Big Data Alliance, le 14 Novembre. “C’est au niveau des études marketing qu’il faut des Data Scientists” préconise en réponse Caroline Faillet, fondatrice du cabinet conseil Bolero.


Former des Data Scientists va prendre du temps

Newsletter La Revue du Digital

Le Data Scientist est encore une denrée rare. L’institut Mines Télécom a débuté cette année sa première formation de Data Scientists dans le cadre d’un Master spécialisé.  Mais la première promotion ne concerne que 30 étudiants. Ce Master a été créé par Stephan Clemençon qui l’a présenté le 14 novembre, lors de l’événement Big Data de l’Aproged et de la Big Data Alliance.

Conscient de l’importance de la demande en matière de Data Scientists,  il annonce qu’il va mettre en place une formation continue et un « certificat de Data Scientist » pour les gens qui sont en poste. « Les problèmes liés au Big Data concernent les infrastructures et les briques à assembler. L’idée est de sortir du carcan disciplinaire, pour être multi-casquettes comme on peut l’être dans une startup. Nous allons former des gens qui sont des Data Scientists ou des  entrepreneurs en employant les outils existants » décrit-il.  Pour les étudiants il s’agit d’acquérir un socle de connaissances techniques, côté informatique et machine-learning,  et business conduisant à l’exercice opérationnel du métier de Data Scientist.

Connaître la programmation, les statistiques et l’algèbre linéaire …

Et vous, qu’en pensez-vous ?

Une idée, une réaction, une question ? Laissez-nous un mot ci-dessous.

Je réagis à cet article

Top lectures en ce moment

L’actualité de la transformation

Dossier

L'IA clé de nos besoins vitaux dans l'eau, l'électricité et le gaz

Dossier exclusif

Marchés de l’eau : l’IA générative arrive dans les réponses aux appels d’offres des collectivités

Saur, spécialiste de la distribution d’eau potable,  fait évoluer son processus de réponse aux appels d’offres des collectivités et des industriels en y injectant de l’IA géné…

Stockage de l’électricité : l’IA générative outil d’accélération clé chez Engie

Le stockage de l’électricité est un enjeu stratégique. Engie s’y attelle et mobilise pour cela l’IA générative de type RAG, c'est-à-dire basée sur le traçage des documents source. …

Nouvelle donne dans le gaz naturel : GRDF s’adapte en utilisant l’IA

GRDF, leader de la distribution du gaz naturel en France, affine sa stratégie d’IA. Il s’appuie sur des serveurs internes pour la confidentialité des données de ses clients. GRDF c…


Vous, qu’en pensez-vous ?

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter