Data Scientist NLP MLOps Audio

Opportunité exclusive

2 à 4 semaines

Hybride

Data Scientist NLP MLOps Audio

ALXDR

Data Scientist NLP MLOps Audio

Expertises

PythonData ScienceNumPyscikit-learnPyTorchTensorFlowNLP / Natural Language ProcessingAudioBERTWhisperMLOps

il y a 2 mois

Opportunité exclusive

Publié par un Top Recruteur

Partagez cette opportunité

Partagez cette opportunité à quelqu’un de votre réseau :
✓ Offrez-lui un boost de visibilité auprès du client.
✓ Aidez vos contacts à trouver leur prochain job.

Information importante

Type de contrat:

Freelance

Salaire / Taux journalier :

TJM selon profil

Cette offre est à 0% de commission 🎉

Localisation :

Paris, France

Date de démarrage :

2 à 4 semaines

Mode de travail :

Hybride

Publié le :

14 janvier 2026

Le besoin

En prestation au sein de l’équipe R&D, le/la Data Scientist interviendra sur des projets autour de l’analyse automatique de contenus audio (en axe majeur) et textuels (en axe secondaire), en lien étroit avec les équipes produit, éditoriales et techniques.

Missions principales

Concevoir et développer des modèles de Machine Learning / Deep Learning pour l’analyse de contenus audio et textuels.
Travailler sur des projets tels que :
- Extraction automatique de métadonnées musicales pour les besoins de la Discothèque
- Détection de fakes audio et contenus synthétiques pour aider les journalistes, et au delà contribuer à la fiabilité de l'information d'un média public
- Extraction de métadonnées à partir des podcasts ou contenus vidéo, comme les émotions, les jingles, le repérage des parties musicales, etc.
Réaliser l’exploration, l’annotation et la structuration de jeux de données audio et texte.
Prototyper, entraîner et évaluer des modèles (POC, benchmarks, analyses comparatives).
Assurer une veille scientifique et technologique (audio ML, speech, NLP).

Compétences techniques clés

Traitement du signal audio : features acoustiques, spectrogrammes, embeddings audio
Machine Learning / Deep Learning : CNN, RNN, Transformers, auto-encodeurs
Speech & Audio ML : classification audio, speech emotion recognition, audio tagging
MLOps : automatisation d’un pipeline de production de données
Python et écosystème data (NumPy, PyTorch / TensorFlow, scikit-learn)
Expérience avec des datasets audio de grande taille et des problématiques bruit / qualité

Atouts appréciés

NLP : modèles de langage, classification de texte, embeddings, Transformers (BERT, Whisper, etc.)
MLOps : GitLab CI, Kubernetes, versioning des modèles
Expérience en recherche appliquée ou projets R&D
Connaissance des problématiques médias, musique ou radio
Sensibilité aux enjeux éthiques (IA générative, deepfakes, biais)
Capacité à vulgariser et présenter des résultats à des publics non techniques
Intérêt pour la qualité du code (code review, bonnes pratiques de développement)

Qualités attendues

Curiosité scientifique et esprit d’innovation
Autonomie et rigueur méthodologique
Goût pour le travail collaboratif et pluridisciplinaire
Intérêt marqué pour les contenus audio et culturels

L’équipe de R&D est constituée de 5 personnes : 1 PO et expert des données, 3 data scientists et 1 alternante data scientist. Elle ne prend pas en charge l’industrialisation des algorithmes qu’elle conçoit.

Aspects primordiaux :

Nous cherchons une personne motivée, curieuse, autonome et bonne communicante pour être à l'aise sur des travaux exploratoires dans une équipe de R&D
La personne doit avoir au moins 4 ans d'expérience en data science, avec une partie importante en audio. Nous préférerons cependant la motivation à la séniorité
Nous privilégions la qualité de l’équipe et du collectif. Le savoir-être et l’adaptabilité constitueront un critère essentiel

D'autres offres idéales pour vous !

Ces entreprises cherchent également d'excellents profils

AlgoviA

Data Scientist - GenAI / NLP / Computer Vision

CDI

Urgent

Lyon, France

Hybride

Expertises

PythonPyTorchNLP / Natural Language ProcessingAzureHugging FaceAzure OpenAILangChaincomputer visionGen AIOCR

il y a 2 mois

Opportunité exclusive

Raedy

Data Scientist Senior

Freelance

Dans 2 à 4 semaines

Bruxelles, Belgique

Hybride

Expertises

Requêtes SQLDeep LearningPythonscikit-learnPyTorchTensorFlowMachine LearningLarge Language Models (LLMs)

il y a 9 jours

Opportunité exclusive

Tachyan

Data Scientist Recommandation / NLP

450-470

Freelance

Dans 2 à 4 semaines

Lille, France

Hybride

Expertises

LLMs / Large language modelsPythonMachine LearningNLP / Natural Language Processing

il y a 3 jours

Opportunité exclusive

Réseau professionnel conçu pour les talents

Freelancers

Créer un profil

Rejoindre un collectif

Solutions et outils

Entreprises

Trouver des profils

Publier une offre

Études de cas

À propos

Contact

Politique de confidentialité

Conditions générales