L’actualité de la transformation

Le segment déjà surpeuplé du Big Data

Lors de l’événement Big Data Expo, le 16 octobre, Gilles Venturi, DG et co-fondateur de Soft.computing a présenté les principaux composants d’une solution Big Data et s’est interrogé : ” le segment de l’offre est-il surpeuplé?” Il faut admettre que par catégorie d’outils ou de services, il existe au moins cinq offres différentes, et que Gilles Venturi identifie huit catégories distinctes : les services Big Data en ligne, les distributions Hadoop, les projets Open Source, la visualisation de données, l’analyse des données, les applications (CRM, marketing, vente, prévention des crimes), les sources de données et les services professionnels.

Au niveau du socle, dans les couches de services Big Data disponibles dans le Cloud, il liste ainsi cinq offres principales : Amazon Web services EMR (Elastic MapReduce), infochimps, Google BigQuery Developpers et 1010data.

En ce qui concerne les distributions Hadoop, il énumère six propositions sur le marché : MAPR Technologies, HDinsight de Microsoft, Couchbase, 10gen, Cloudera et Hortonworks.


Plus précisément dans le cadre des projets Open Source, il liste 5 plateformes : hadoop, cassandra, Apache Hbase, storm et mongoDB. L’écosystème hadoop est lui-même particulièrement fragmenté puisqu’il comprend des solutions de stockage (HBase, HDFS), de traitement (MapReduce), d’ordonnanceur (Oozie), de Web crawling (nutch), de langage SQL( Hive), de chargement (Flume), d’administration (Apache Ambari), d’interface graphique (Hue), d’interface SQL(Sqoop), et d’auto-apprentissage (mahout).

Afin de visualiser les données, Gilles Venturi propose 5 outils : tableau software, goodData, Quid, metalayer et QlikView.  Il glisse au passage que les acteurs historiques de cette catégorie, tels que Microsoft, Business Object ou Cognos, se mettent à niveau en matière de visualisation en suivant des solutions comme celle de tableau software.


Pour l’analyse de ces mêmes données, il identifie six solutions : datameer, dataminr, general sentiment, opera solutions, GNIP OOO et platfora.

Newsletter La Revue du Digital

Côté applications, Gilles Venturi cite cinq fournisseurs : splunk (pour exploiter les fichiers d’historiques de suvi des serveurs physiques ou virtuels), Lattice (pour la gestion des ventes), clickfox (pour la gestion de la relation client), bloomreach (pour le marketing) et predictive policing (pour la prévention du crime).

Gille Venturi identifie également un nouveau type de fournisseurs : les startups sources de données. Ces sociétés mettent à disposition des fichiers de données constitués selon les critères de l’entreprise cliente. il liste Datasift, factual, Inrix et datamarket. « On peut leur demander les twits qui ont été émis en 2012 sur Darty ou des instagram » dit-il. Ces sociétés ont mis en place des aspirateurs à données et stockent l’ensemble des informations sur des infrastructures Big Data.

Il décrit plus précisément les sites de données qu’enregistre en permanence une société comme Datasift : Amazon, flickr, Google+, tumblr, Youtube, vimeo, Wikipedia, reddit, WordPress, twitter, facebook, dailymotion, newsgator, intensedebate, delicious, bitly et topix.

Enfin, dans les services professionnels, il retient : Opera Solutions, Mu Sigma, Anchorman, Axeor, Atilika, Clarity et Cloudwick Technologies.

La société Soft.computing emploie 400 personnes. Elle a réalisé 36 millions d’euros de chiffre d’affaires en 2012. Elle est spécialisée dans la relation client et elle gère les programmes de fidélité de ses clients entreprise. Cela représente des centaines de milliards de transactions par an.

Et vous, qu’en pensez-vous ?

Une idée, une réaction, une question ? Laissez-nous un mot ci-dessous.

Je réagis à cet article

Top lectures en ce moment

L’actualité de la transformation

Dossier

L'IA clé de nos besoins vitaux dans l'eau, l'électricité et le gaz

Dossier exclusif

Marchés de l’eau : l’IA générative arrive dans les réponses aux appels d’offres des collectivités

Saur, spécialiste de la distribution d’eau potable,  fait évoluer son processus de réponse aux appels d’offres des collectivités et des industriels en y injectant de l’IA géné…

Stockage de l’électricité : l’IA générative outil d’accélération clé chez Engie

Le stockage de l’électricité est un enjeu stratégique. Engie s’y attelle et mobilise pour cela l’IA générative de type RAG, c'est-à-dire basée sur le traçage des documents source. …

Nouvelle donne dans le gaz naturel : GRDF s’adapte en utilisant l’IA

GRDF, leader de la distribution du gaz naturel en France, affine sa stratégie d’IA. Il s’appuie sur des serveurs internes pour la confidentialité des données de ses clients. GRDF c…


Newsletter