STAGE - DATA SCIENCE NOUVELLES STRATEGIES D'EMBEDDINGS EN NLP – H/F

Référence de l’offre :

ST028

Domaine :

R&D

Contrat :

Stage, Stage de fin d’études

Durée :

6 mois

Lieu :

Lille, Suresnes (proche Paris), Bordeaux, Aix-en-Provence, Montpellier, Nancy, Paris

Spécialiste du traitement souverain de la donnée, ChapsVision permet aux entreprises et administrations de réussir leur transformation digitale et de créer de la valeur grâce à une suite logicielle axée autour de son système d’exploitation de la donnée massive et hétérogène.

A travers des investissements R&D très importants autour du traitement massif de la data, complétés par une stratégie soutenue d’acquisitions et de développement à l’international, ChapsVision a constitué rapidement un groupe cohérent constitué de deux branches adressant des secteurs à forte empreinte data : l’une dédiée à l’engagement client auprès des entreprises et l’autre offrant des solutions souveraines dédiées à la cyber intelligence et la cybersécurité des marchés de la défense, du renseignement et de la sécurité.


Créée en 2019, ChapsVision compte près de 600 collaborateurs, 600 clients grands comptes, et a réalisé un CA de 100 M€ en 2022.

VOUS ÊTES PASSIONNÉ.E PAR L’IA ET VOUS AVEZ ENVIE DE VOUS INVESTIR DANS UN PROJET AMBITIEUX ?

Vous rejoindrez la nouvelle division ChapsVision AI : le ChapsLab. L’ambition de ChapsLab est de centraliser tous les efforts d’IA du groupe en construisant des services cognitifs de pointe. Ces services seront utilisés à l’interne et offerts indépendamment aux clients externes. Le ChapsLab, qui compte déjà une vingtaine de data scientists, doctorants et ingénieurs logiciels talentueux, est en constante évolution et recherche de nouveaux talents pour renforcer l’équipe et construire les meilleurs produits d’IA du marché.

Nous cherchons à développer un service de référence qui révolutionne l’expérience de recherche de texte en laissant l’utilisateur poser une question et lui proposer en réponse , non pas des documents, mais une synthèse détaillée et argumentée. Cette tâche du NLP est identifiée sous le nom de Question answering avancé.

Pour cela nous utilisons notre stack logicielle de recherche classique par mot clefs , mais également de recherche par similarité d’embeddings ou recherche de correspondance d’embeddings entre question et réponse. Nous utilisons une base vectorielle associée à de la recherche nearest neighbours KNN.

EN TANT QUE STAGIAIRE EN DATA SCIENCE, VOS MISSIONS SERONT LES SUIVANTES :

  • Evaluer de nouvelles méthodes de calcul d’embeddings et leur applicabilité à nos solutions et au français
  • Évaluer des embeddings de correspondance entre question et réponse en contexte multilingue.
  • Rechercher des solutions d’embeddings purement françaises
  • Evaluer les capacités de calcul d’embeddings par Llama 2 ou d’autres LLM on-premises.
  • Intégrer ces nouveaux embeddings à notre base vectorielle existante
  • Evaluer l’apport de base vectorielles alternatives comme celle de LamaIndex. https://github.com/jerryjliu/llama_index

NOUS SOMMES FAITS POUR TRAVAILLER ENSEMBLE SI…

  • Etudiant en dernière année d’une grande école d’ingénieur (BAC+5), vous possédez des connaissances approfondies en NLP.
  • Intelligence Artificielle appliquée aux textes : embeddings , BERT, Grands modèles de langage (LLM).
  • Utilisation des moteurs de recherche et d’indexation.
  • Programmation (Shell, Python …)
  • Des connaissances Lllama 2 seraient un plus.
  • Un savoir d’entrainement de modèles serait le bienvenu, mais pas obligatoire.
  • Vous possédez d’excellentes qualités scientifiques et relationnelles, vous aimez travailler en équipe.
  • Vous aimez partager vos connaissances et disposez d’un bon sens de la communication.
  • La maitrise de l’anglais opérationnel serait appréciée

INTÉRESSÉ.E ? ALORS ON VOUS DÉVOILE LA FORMULE GAGNANTE POUR POSTULER
ET REJOINDRE L’AVENTURE CHAPSVISION :

Envoyez nous votre CV.
Si votre profil est retenu, vous serez contacté.e par notre Talent Acquisition Specialist pour un premier échange visio.

Nous avons hâte d’avoir de vos nouvelles !

Poste en stage, à pourvoir rapidement au sein de nos locaux à Suresnes, Paris ou un de nos autres sites.

Avantages :

  • Carte Swile
  • 50% de remote possible
  • Prise en charge d’une partie des frais de transport
  • Accès à notre parking