Une équipe de Data Scientists chez Criteo
La technologie de Criteo s’appuie massivement sur le Big Data et la société a constitué sa propre équipe de Data Scientists regroupés dans une entité baptisée « Engine ». « Ils déterminent les algorithmes pour ‘cruncher’ la donnée » décrit Romain Niccoli. Cruncher? C’est le fait de réduire le volume d’informations nécessaire en entrée des serveurs. « Il s’agit de ne pas travailler avec des statistiques naïves » pointe-t-il.
Si l’on appliquait un algorithme de statistiques pur, il faudrait des milliards d’informations (320 milliards d’affichages exactement) afin de prendre une bonne décision. Or les algorithmes de Criteo travaillent avec des jeux de données plus réduits. Les Data Scientists de Criteo définissent dans le même temps les bons algorithmes de calcul prédictif afin de prévoir le comportement des internautes vis-à-vis des bannières publicitaires qu’on leur propose.
Côté entreprises utilisatrices, on identifie également la nécessité des Data Scientists. Valérie Abrell-Duong, en charge des solutions de CRM chez Procter & Gamble, constate “qu’il y a besoin de statisticiens pour créer des algorithmes.” Elle s’exprimait pour sa part lors d’un événement Big Data organisé par Supelec Numérique, le 14 Novembre.
Il y aura toutefois un effort de rapprochement à effectuer du côté des métiers également. “Entre le marketeur et le Data Scientist, il y a un gap énorme. Il faut que les marketeurs pensent out-of-the-box. Ils n’y sont pas du tout” prévient Christine Ballagué, qui anime la chaire de réseaux sociaux à Télécom Ecole de Management. Elle s’exprimait lors de l’événement Big Data organisé par l’Aproged et la Big Data Alliance, le 14 Novembre. “C’est au niveau des études marketing qu’il faut des Data Scientists” préconise en réponse Caroline Faillet, fondatrice du cabinet conseil Bolero.
Former des Data Scientists va prendre du temps
Le Data Scientist est encore une denrée rare. L’institut Mines Télécom a débuté cette année sa première formation de Data Scientists dans le cadre d’un Master spécialisé. Mais la première promotion ne concerne que 30 étudiants. Ce Master a été créé par Stephan Clemençon qui l’a présenté le 14 novembre, lors de l’événement Big Data de l’Aproged et de la Big Data Alliance.
Conscient de l’importance de la demande en matière de Data Scientists, il annonce qu’il va mettre en place une formation continue et un « certificat de Data Scientist » pour les gens qui sont en poste. « Les problèmes liés au Big Data concernent les infrastructures et les briques à assembler. L’idée est de sortir du carcan disciplinaire, pour être multi-casquettes comme on peut l’être dans une startup. Nous allons former des gens qui sont des Data Scientists ou des entrepreneurs en employant les outils existants » décrit-il. Pour les étudiants il s’agit d’acquérir un socle de connaissances techniques, côté informatique et machine-learning, et business conduisant à l’exercice opérationnel du métier de Data Scientist.
Connaître la programmation, les statistiques et l’algèbre linéaire …
Top lectures en ce moment
-
Trois questions auxquelles les retailers doivent répondre face à l’IA agentique
-
Doctolib lance un assistant vocal de gestion des appels des patients
-
La CDP (Customer Data Platform), un projet clé de la transformation Data d’Axa F...
L'IA clé de nos besoins vitaux dans l'eau, l'électricité et le gaz
Marchés de l’eau : l’IA générative arrive dans les réponses aux appels d’offres des collectivités
Saur, spécialiste de la distribution d’eau potable, fait évoluer son processus de réponse aux appels d’offres des collectivités et des industriels en y injectant de l’IA géné…
Stockage de l’électricité : l’IA générative outil d’accélération clé chez Engie
Le stockage de l’électricité est un enjeu stratégique. Engie s’y attelle et mobilise pour cela l’IA générative de type RAG, c'est-à-dire basée sur le traçage des documents source. …
Nouvelle donne dans le gaz naturel : GRDF s’adapte en utilisant l’IA
GRDF, leader de la distribution du gaz naturel en France, affine sa stratégie d’IA. Il s’appuie sur des serveurs internes pour la confidentialité des données de ses clients. GRDF c…














Et vous, qu’en pensez-vous ?
Une idée, une réaction, une question ? Laissez-nous un mot ci-dessous.
Je réagis à cet article