PagesJaunes améliore de 30% la productivité de ses équipes chargées d’optimiser son moteur de recherche via le Big Data et le Machine Learning. C’est ce qu’a présenté Guibert Tchindé, Data Scientist chez PagesJaunes, le 1 avril sur la scène du salon Big Data.
Une plateforme Hadoop
Les données issues des requêtes et des réponses du moteur de recherche sont toutes injectées dans une plateforme Open Source Hadoop. “Hadoop n’est pas cher” souligne Guibert Tchindé. De cette plateforme, on sort les requêtes qu’il est important que les équipes de PagesJaunes examinent de près afin d’améliorer le fonctionnement du moteur de recherche. Il s’agit de détecter les failles du moteur de recherche.
« On détecte quand une réponse n’est pas satisfaisante lorsque la liste de réponses est trop longue, cela signifie que le moteur n’a pas réussi » illustre Guibert Tchindé. « De même, lorsque quelqu’un ne clique pas dans la page, cela signifie qu’aucun choix n’a répondu aux attentes de l’internaute. » De même, les erreurs d’orthographe lors de la saisie par l’utilisateur sont traquées afin de proposer une correction à l’internaute et les résultats associés.
Les outils de mise en forme de Dataiku
La plateforme Hadoop déployée est complétée par des outils de mise en forme des données délivrés par la startup française Dataiku. Son outil Data Science Studio permet de rapidement formater les données. PagesJaunes a procédé à une modélisation algorithmique de la fragilité de la recherche utilisateur. Un système d’apprentissage intégré a été développé autour de Python et de R.

Photo, Guibert Tchindé, Data Scientist chez PagesJaunes.
Top lectures en ce moment
-
Stellantis adopte les agents IA, arcbouté sur une plateforme d’IA bâtie avec Dat...
-
La CDP (Customer Data Platform), un projet clé de la transformation Data d’Axa F...
-
Doctolib lance un assistant vocal de gestion des appels des patients
L'IA clé de nos besoins vitaux dans l'eau, l'électricité et le gaz
Marchés de l’eau : l’IA générative arrive dans les réponses aux appels d’offres des collectivités
Saur, spécialiste de la distribution d’eau potable, fait évoluer son processus de réponse aux appels d’offres des collectivités et des industriels en y injectant de l’IA géné…
Stockage de l’électricité : l’IA générative outil d’accélération clé chez Engie
Le stockage de l’électricité est un enjeu stratégique. Engie s’y attelle et mobilise pour cela l’IA générative de type RAG, c'est-à-dire basée sur le traçage des documents source. …
Nouvelle donne dans le gaz naturel : GRDF s’adapte en utilisant l’IA
GRDF, leader de la distribution du gaz naturel en France, affine sa stratégie d’IA. Il s’appuie sur des serveurs internes pour la confidentialité des données de ses clients. GRDF c…














Et vous, qu’en pensez-vous ?
Une idée, une réaction, une question ? Laissez-nous un mot ci-dessous.
Je réagis à cet article