05/03/2019 Data / IA
Quand les défis du machine learning rencontrent ceux du big data
Les 11 et 12 mars prochains se déroulera le salon Big data au Palais des Congrès de Paris où Romaric Lancien, Lead Consultant chez MFG Labs présentera son retour d’expérience en compagnie d’Aymeric Augustin, SVP Data Canal+ Group.
Cette huitième édition est l’occasion pour les experts de prendre la parole sur les différentes problématiques techniques liées à la data. A l’heure où les données représentent l’or noir des entreprises, tous les secteurs d’activité sont concernés. Amélioration de la compétitivité pour certains, optimisation d’un service pour d’autres, les données sont devenues incontournables pour résoudre des problématiques métiers parfois très complexes. Encore faut-il savoir appréhender la data et en dégager de la valeur pour répondre à des problématiques métiers spécifiques.
C’est dans cette optique que Canal+ a demandé à MFG Labs de se pencher sur la détection d’anomalies sur le player de myCANAL. Au delà du challenge technique que cela représentait, et du nombre considérable de données à analyser, le challenge était de comprendre au mieux la problématique métier du client et de la traduire en solutions techniques, réalistes et industrialisables. Le but ? Rendre l’expérience des utilisateurs plus fluide. Romaric Lancien, Lead consultant chez MFG Labs revient pour nous sur le projet et sur les grandes lignes de sa conférence. Interview :
Est-ce que tu peux d’abord revenir sur la notion de big data ?
Le big data, c’est la possibilité qu’ont les entreprises de pouvoir collecter et exploiter des données diverses en masse pour améliorer le fonctionnement de leur organisation. Cela implique de maîtriser toute la chaîne de donnée : comment ingérer de la donnée en masse ? Comment la stocker ? Comment la traiter ? Comment la préparer, ou encore comment entraîner des modèles d’apprentissage automatique (de machine-learning) ? Il y également tout ce qui concerne la visualisation de la data et la prise de décision basée sur de la donnée.
Est-ce que tu peux nous parler du salon Big Data ?
Le salon big data a lieu tous les ans à Paris et regroupe des entreprises qui font face à des enjeux liés au big data, mais pas seulement. Le salon a été lancé il y a 8 ans dès lors où la notion de big data est arrivée mais aujourd’hui, c’est plus large que ça. C’est l’occasion de voir toutes les nouvelles solutions liées à la gestion des data. On y retrouve les cloud providers, de gros donneurs d’ordre, des annonceurs, des prestataires, de intégrateurs de solutions très spécifiques liés à la data marketing, mais aussi des start-ups qui démarrent sur ces sujets. C’est l’occasion pour les visiteurs de découvrir de nouveaux cas d’usages, et de rencontrer des partenaires pour les accompagner dans leurs réalisations.
Pourquoi MFG Labs a souhaité présenter un retour d’expérience avec Canal + sur le salon ?
Nous avons travaillé de concert avec les équipes de Canal+ pour trouver la meilleure solution au problème de détection d’anomalies pour améliorer leur qualité de service. Nous nous sommes attaqués ensemble à un problème complexe à plusieurs dimensions : des contraintes d’architecture, des problématiques fonctionnelles, des tests de différents algorithmes pour trouver la meilleure implémentation pour répondre au problème. Ce sont toutes ces dimensions et la méthode de travail que nous souhaitons présenter sur le salon.
Qu’est-ce que cas spécifique va nous apprendre ?
Nous avons la chance d’être accompagné par le SVP Data du groupe Canal+ qui abordera le projet sur lequel MFG Labs a travaillé, à savoir la détection d’anomalies sur l’application myCANAL. C’est une chance car sur un sujet aussi complexe que la data, il est important d’avoir des retours d’expérience comme celui-ci et d’avoir la vision d’un CTO qui expose ses problématiques et les solutions associées. Le sujet ? La difficulté inhérente à la détection d’anomalies : traiter un gros volume de données en quasi temps réel pour détecter quelque chose qui n’est pas catégorisable ou connu à l’avance. On y traitera les différentes méthodes mathématiques et expérimentales mises en place. Il faut se rendre compte que nous parlons ici de l’analyse de 140 millions de logs par jour (1 log = 1 personne, 1 action, 1 device) en streaming (les données arrivent en temps réel). L’objectif étant de rendre le player myCANAL plus personnalisé et plus fluide pour les utilisateurs.
Qu’est ce que vous avez apporté au client ?
L’expertise technique, la capacité mathématique à formaliser le problème, l’expertise sur les algorithmes, et aussi la partie data engineering, c’est-à-dire la capacité à manipuler toutes les données et les briques d’AWS pour mettre en oeuvre la solution. Nous avons également apporté la partie conseil; le sujet étant ultra pointu au niveau technique, nous n’avons pas souhaité nous engager sur la production, mais sur la recherche d’une solution. Il s’agissait d’un problème trop complexe, et en tant que société de conseil et de réalisation experte en data, nous avons le devoir d’apporter une vision pragmatique des projets à nos clients. Lorsque nous avons trouvé une solution, nous l’avons testé et validé; et ce n’est qu’à ce moment là, que nous avons pu passer en production.
Un dernier mot ?
Rendez-vous le 12 Mars à 15h40 dans l’amphithéâtre Bleu du Palais des Congrès!
Plus d’infos sur https://www.bigdataparis.com/2019/
A propos de MFG Labs
MFG Labs est une société de conseil et réalisation du Groupe ekino. Experte en data et intelligence artificielle, MFG Labas a été fondée en 2009 par deux mathématiciens, dont l’un a remporté la médaille Fields. MFG Labs aide ses clients à améliorer leurs prises de décision, à automatiser leurs processus et à créer de nouveaux services grâce à l’application de data science, de design, et des technologies les plus avancées. MFG Labs accompagne les entreprises à toutes les étapes de leur transformation data ou AI, de l’initiation d’une stratégie, à la modélisation des problèmes jusqu’à l’implémentation de solutions sur-mesure. Pour plus d’informations, visitez https://mfglabs.com/