About this role
Le/la consultant(e) interviendra sur les activités suivantes :
Déploiement et intégration de services IA en environnement de productionMise en œuvre de techniques avancées de prompt engineering (gestion des hallucinations, tuning des paramètres LLM)Implémentation du pattern RAG (Retrieval Augmented Generation) et optimisation de la pertinence des résultats de rechercheDéveloppement et intégration d’AI Agents, MCP Servers et solutions de Hybrid Search (atout)Évaluation des performances des modèles IA (accuracy, reliability, scalability) et mise en place de processus d’optimisation qualitéCollaboration avec des équipes Full Stack pour intégrer les fonctionnalités IA dans les systèmes en productionDéveloppement de pipelines d’inférence et de testing des modèlesSuivi des expérimentations, tracking des performances et benchmarksDocumentation technique et maintien des référentiels d’expériencesGarantie de conformité aux exigences de privacy, sécurité et gouvernance des donnéesContribution aux pipelines de recherche IA/ML (quality optimization, benchmarking, tracking, collaboration avec experts métier)Mise à l’échelle et monitoring des expérimentations en production Formation bac+5 en génie informatique, Data, IA ou équivalent.
7 ans d'éxpérience significative en déploiement de solutions IA / LLM en production.
Expérience en déploiement de services IA en production
Maîtrise du Prompt Engineering (gestion hallucinations, tuning LLM)Compréhension du pattern RAG et optimisation de la search relevancyDéveloppement Python et respect des bonnes pratiquesDéveloppement de pipelines d’inférence et de testingÉvaluation et optimisation de la performance des modèles IAExpérience en tracking d’expériences et benchmarkingCollaboration transverse avec équipes techniques (Full Stack)Connaissance des enjeux sécurité, privacy et data governanceEsprit analytique fort et approche scientifiqueCompétences appréciées (Nice to have)
AI Agents, MCP Servers, Hybrid SearchHugging Face Transformers, vectorisation et librairies associéesLangChain, LlamaIndexExpérience Cloud (Azure, AWS)Expérience en scaling et monitoring d’expérimentations en production
