Les erreurs de parcours de M6 sur la data

Spread the love
  • Yum

Les erreurs de parcours de M6 sur la data

Les débuts de M6 dans l’univers des données n’ont pas été un long fleuve tranquille. Les ambitions de la direction générale dans ce domaine étaient pourtant au rendez-vous dès 2015.

Mais avant de mettre sur pied une Data Factory d’une trentaine de personnes et un Data Lab de deux data scientists pour le volet innovation, l’entreprise a connu quelques déconvenues.

En 2016, elle constitue la « dream team de la data » composée notamment d’un data scientist de premier plan, et d’un data ingénieur, ex de Criteo et surtout expert du big data et du machine learning. Cory Chaplin, le dernier membre, disposait d’une bonne connaissance de M6 et de sa plateforme de replay 6Play.

publicité

La data n’est pas l’affaire des seuls experts

« On considérait alors que la data était une affaire d’experts. Le management n’y comprenait pratiquement rien et nous avons donc réuni une équipe d’experts. Réunis, ce devait donc être magique. La réalité a été un peu plus compliquée » témoigne le product lead data du groupe audiovisuel.

Cette approche a débouché sur deux visions distinctes avec d’un côté les data scientists et de l’autre les data ingénieurs. Et l’utilisation d’univers technologiques différents n’a pas contribué à les rapprocher.

« Nous avions assez peu de collaboration. Il manquait le leader, une personne capable de nous mettre tous d’accord pour exploiter notre expertise de manière efficace » se souvient encore le spécialiste des données. La dream team venait in fine de se heurter à un des trois grands enjeux de l’industrialisation de la data.

Corriger le tir avec « un même produit et un objectif commun »

Et le premier est donc celui de la collaboration. M6 a donc corrigé le tir depuis en réunissant au sein d’une même équipe ses différents métiers partageant « un même produit et un objectif commun ». C’est le principe de la « squad » dans l’univers agile.

La pluridisciplinarité est un premier levier de collaboration et d’efficacité. Le leadership en est un autre. Chez M6, les produits data font l’objet d’un « leadership partagé », qui prend par exemple la forme d’ateliers permettant l’expression des différents points de vue, précise Margiane Meglouli, product data owner.

Les soft skills aussi importantes que les hard skills

Mais cette approche doit aussi se concrétiser dans les recrutements. « On fait souvent l’erreur, en particulier dans le monde de la tech, de tout miser sur les hard skills. » Le processus reposait ainsi auparavant essentiellement sur des tests techniques. Résultat : des erreurs de casting.

Le recrutement intègre donc désormais plus fortement les soft skills pour mesurer la capacité à travailler efficacement au sein d’une équipe. Une disposition indispensable pour une organisation fonctionnant en agile (Scrum) avec des cycles de développement de deux semaines.

Pour rapprocher data scientists et data engineers, qui tendent à exploiter des langages de développement différents, la Data Factory a testé le « pair programming ». Ces duos le pratiquent désormais une fois par semaine.

« Le data scientist apporte son expertise en mathématiques et en machine learning, tandis que le data engineer apporte son expertise sur les architectures pour parvenir à une architecture stable et solide sur le plan technologique » décrit Margiane Meglouli.

Comprendre les cas d’usage de la data

Le deuxième enjeu est la compréhension des cas d’usage de la data. Et sur cette question, Cory Chaplin met en avant les publications de Cassie Kozyrkov, la Chief Decision Scientist de Google. Avec un grand principe : « la data sert à prendre des décisions ». Les cas d’usage seront ainsi fonction du besoin de prendre ou non une décision (si oui, beaucoup ou pas) grâce aux données.

Le recours à l’analyse descriptive, à l’inférence statistique et au machine learning dépendront dès lors d’une matrice de décision. « Si on cherche de l’inspiration, on a besoin de l’analyse descriptive. Pour prendre peu de décisions, mais importantes, le besoin concerne l’inférence statistique. Et si le nombre de petites décisions est important, ce sera du machine learning » résume le product lead data.

« Le framework de Cassie Kozyrkov nous a énormément structurés et aujourd’hui l’essentiel de nos cas d’usage repose dessus » ajoute-t-il. Cette démarche ne suffit pas néanmoins. L’expert insiste aussi sur la disponibilité d’une plateforme stockant les données, de « pipelines pour ingérer les données » et enfin des tables « lisibles par un maximum de personnes » pour leur permettre de comprendre la donnée.

Des données lisibles, mais également accessibles. Cet accès s’effectue généralement grâce à du SQL. Faut-il dès lors convaincre les métiers, et notamment ceux du marketing, d’apprendre un langage comme le SQL ? La tâche s’annonce compliquée. C’est pourtant ce qu’a décidé M6 en formant plus d’une centaine de personnes de différents métiers au SQL (marketing, product owner, UX manager, éditorial…)

Des données en self-service pour développer la culture data

Tous les métiers ne deviendront cependant pas des habitués du SQL. Pour leur permettre d’accéder aux données, l’équipe data a donc également mis en œuvre un outil de visualisation, Superset, pour un accès dans « une logique self-service ».

Cette notion d’autonomie dans l’accès aux données est d’ailleurs centrale chez M6 puisque les données sont à disposition de l’ensemble des collaborateurs. « Ils cherchent des réponses à des questions. Et ces réponses, ils doivent pouvoir les trouver sans devoir attendre plusieurs semaines que l’équipe d’experts soit disponible » justifie Cory Chaplin.

Cela rejoint d’ailleurs le troisième et dernier enjeu consistant à faire évoluer la culture d’entreprise. Pour le groupe, la démocratisation de l’accès à la data a constitué un « vrai challenge ». L’objectif est d’inscrire l’utilisation des outils data dans le quotidien des métiers et leurs processus de décision. La confiance, c’est-à-dire la qualité des données, est un prérequis pour y parvenir.

« C’est énormément de temps consacré à expliquer, à comprendre leurs problématiques, leurs réticences, à travailler avec les early-adopters, évidemment à construire des outils et à garantir la qualité des données. Mais en réalité, c’est beaucoup de dialogue pour développer cette culture d’entreprise » conclut l’expert.

Leave a Reply

Your email address will not be published. Required fields are marked *