ALXDR
Data Scientist NLP MLOps Audio
Expertises
il y a 2 mois
Opportunité exclusive
Publié par un Top Recruteur
Partagez cette opportunité
Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.
Information importante
Type de contrat:
Freelance
Salaire / Taux journalier :
TJM selon profil
Cette offre est à 0% de commission 🎉Localisation :
Paris, France
Date de démarrage :
2 à 4 semaines
Mode de travail :
Hybride
Publié le :
14 janvier 2026
Le besoin
En prestation au sein de l’équipe R&D, le/la Data Scientist interviendra sur des projets autour de l’analyse automatique de contenus audio (en axe majeur) et textuels (en axe secondaire), en lien étroit avec les équipes produit, éditoriales et techniques.
Missions principales
Concevoir et développer des modèles de Machine Learning / Deep Learning pour l’analyse de contenus audio et textuels.
Travailler sur des projets tels que :
Extraction automatique de métadonnées musicales pour les besoins de la Discothèque
Détection de fakes audio et contenus synthétiques pour aider les journalistes, et au delà contribuer à la fiabilité de l'information d'un média public
Extraction de métadonnées à partir des podcasts ou contenus vidéo, comme les émotions, les jingles, le repérage des parties musicales, etc.
Réaliser l’exploration, l’annotation et la structuration de jeux de données audio et texte.
Prototyper, entraîner et évaluer des modèles (POC, benchmarks, analyses comparatives).
Assurer une veille scientifique et technologique (audio ML, speech, NLP).
Compétences techniques clés
Traitement du signal audio : features acoustiques, spectrogrammes, embeddings audio
Machine Learning / Deep Learning : CNN, RNN, Transformers, auto-encodeurs
Speech & Audio ML : classification audio, speech emotion recognition, audio tagging
MLOps : automatisation d’un pipeline de production de données
Python et écosystème data (NumPy, PyTorch / TensorFlow, scikit-learn)
Expérience avec des datasets audio de grande taille et des problématiques bruit / qualité
Atouts appréciés
NLP : modèles de langage, classification de texte, embeddings, Transformers (BERT, Whisper, etc.)
MLOps : GitLab CI, Kubernetes, versioning des modèles
Expérience en recherche appliquée ou projets R&D
Connaissance des problématiques médias, musique ou radio
Sensibilité aux enjeux éthiques (IA générative, deepfakes, biais)
Capacité à vulgariser et présenter des résultats à des publics non techniques
Intérêt pour la qualité du code (code review, bonnes pratiques de développement)
Qualités attendues
Curiosité scientifique et esprit d’innovation
Autonomie et rigueur méthodologique
Goût pour le travail collaboratif et pluridisciplinaire
Intérêt marqué pour les contenus audio et culturels
L’équipe de R&D est constituée de 5 personnes : 1 PO et expert des données, 3 data scientists et 1 alternante data scientist. Elle ne prend pas en charge l’industrialisation des algorithmes qu’elle conçoit.
Aspects primordiaux :
Nous cherchons une personne motivée, curieuse, autonome et bonne communicante pour être à l'aise sur des travaux exploratoires dans une équipe de R&D
La personne doit avoir au moins 4 ans d'expérience en data science, avec une partie importante en audio. Nous préférerons cependant la motivation à la séniorité
Nous privilégions la qualité de l’équipe et du collectif. Le savoir-être et l’adaptabilité constitueront un critère essentiel
D'autres offres idéales pour vous !
Ces entreprises cherchent également d'excellents profils
AlgoviA
Data Scientist - GenAI / NLP / Computer Vision
CDI
Urgent
Lyon, France
Hybride
Expertises
il y a 2 mois
Opportunité exclusive
Raedy
Data Scientist Senior
Freelance
Dans 2 à 4 semaines
Bruxelles, Belgique
Hybride
Expertises
il y a 9 jours
Opportunité exclusive
Tachyan
Data Scientist Recommandation / NLP
450-470
Freelance
Dans 2 à 4 semaines
Lille, France
Hybride
Expertises
il y a 3 jours
Opportunité exclusive