Intern, Machine Learning Engineer Junior (f/m/d) Chez Decathlon
Présentation de l'entreprise
Decathlon est une entreprise française de grande distribution de sport et de loisirs, créée en 1976 par Michel Leclercq.
Description de l'offre
Notre équipe Data Business Capability Platform recherche un·e Machine Learning Engineer basé·e à Paris
L’enjeu d’avoir un pricing plus dynamique et tourné vers nos clients est une priorité pour Decathlon. C’est dans ce contexte que l’équipe Pricing développe des outils pour améliorer les décisions concernant le prix chez Decathlon. Rejoindre nos équipes est vraiment une chance de façonner l'industrie du sport grâce aux données et à l'IA !
L'équipe Price Recommendation Engine, au sein de Decathlon, est l'équipe chargée de concevoir, développer, et maintenir des solutions IA innovantes et industrialisées pour optimiser le prix pour chacun des produits. Pour ce faire, nous travaillons au sein d’équipes agiles qui regroupent Product Manager, Data Scientists, Data Engineers, Machine Learning Engineers et Data Analysts.
L'objectif est de proposer le prix optimal pour chacun de nos produits en prenant plusieurs critères tels que l'élasticité du produit, son impact sur la perception de l'image de Decathlon, la cannibalisation, le prix des concurrents, etc.
Déployer et gérer ce moteur un production est un enjeu clé pour fournir continuellement à ses utilisateurs internes des recommandations précises, fiables et robustes. En parallèle d’optimiser son fonctionnement pour améliorer ses résultats, il est primordial de maîtriser son cycle de vie en production, notamment en mettant en œuvre les bonnes pratiques MLOps.
Cela inclut différentes problématiques telles que le monitoring de la qualité et de l’évolution des données (data drift), la surveillance des performances du modèle, l’orchestration des prédictions, la stratégie de ré-entraînement du modèle… Une bonne maîtrise de ces sujets est essentielle pour pérenniser la valeur créée par le modèle.
Nous recherchons un.e stagiaire Machine Learning Engineer pour nous accompagner dans cette démarche, en étroite collaboration avec les différents profils de l’équipe.
TES RESPONSABILITÉS
Ton rôle sera de participer à chaque étape des projets, du cadrage à la solution finale, et de découvrir les bonnes pratiques de développement. Tu contribueras à la mise à l'échelle des solutions data et d'apprentissage automatique d'un POC à un produit entièrement déployé.
Tu commenceras par une période de formation avant de travailler sur le projet de stage sous la responsabilité d'un référent Data expérimenté. Par exemple, tu auras au démarrage des tâches très concrètes de mise en place de data pipeline sur les solutions AWS & Databricks. Et progressivement tu monteras en compétences pour gagner en autonomie.
Tu contribueras aux projets existants comme tous les membres de l’équipe.
Tu effectueras une revue de l'état de l'art scientifique sur le domaine (ex. classification d’images).
Tu testeras ces nouvelles méthodes sur un cas d'usage réel étudié en ce moment dans notre équipe en appliquant les meilleurs standards Data.
Tu pourras implémenter ces nouvelles fonctionnalités dans nos pipelines et mettre en production ton modèle en utilisant des principes d'ingénierie de qualité.
Tu communiqueras efficacement l'analyse et les résultats par le biais de visualisations, de documents et de présentations aux parties prenantes techniques et business.
Mettre à contribution tes compétences acquises lors de ta formation pour t'adapter rapidement à la stack technique Decathlon : Python - Git - SQL - Spark - Visualisation.
Développer et documenter tes analyses et modèles (data sourcing, hypothèses et méthodes) dans une logique Lean et Agile en respectant les standards appliqués au sein des équipes Decathlon.
Rendre disponible tes résultats via des dashboards simples et user friendly.
Vulgariser l’utilisation de la data et expliquer sa valeur ajoutée.
STACK TECHNIQUE
Execution Engine
Databricks, EKS, Sagemaker
Payload
Python, Spark, Scikit-Learn, Tensorflow, Pyspark
CICD
Github Actions
Serving
Docker, Protobuf, gRPC
Model registry, Model Tracking
MLFlow
Orchestration
Airflow
Documentation / code
Git, Confluence
Data Visualisation
Tableau
Monitoring
Datadog, Giskard
CE QUE TU
FORMULAIRE DE RÉPONSE À L’OFFRE
Attention
- Nous vous conseillons de désactiver les bloqueurs de publicité de type AdBlock pour assurer la bonne validation du formulaire.
- Si vous ne parvenez pas à postuler, utilisez notre formulaire simplifié.
pas encore inscrits ?
Créer un compte candidat vous permet :
- l'enregistrement de vos informations pour ne pas avoir à les resaisir plusieurs fois
- la conservation d'un historique de vos candidatures
- la possibilité d'être contacté directement par plus de 1000 entreprises