STAGE - DATA SCIENCE LLM ET CHAIN TREE OF THOUGHTS – H/F

Référence de l’offre :

ST026

Domaine :

R&D

Contrat :

Stage, Stage de fin d’études

Durée :

6 mois

Lieu :

Lille, Suresnes (proche Paris), Bordeaux, Aix-en-Provence, Montpellier, Nancy, Paris

Spécialiste du traitement souverain de la donnée, ChapsVision permet aux entreprises et administrations de réussir leur transformation digitale et de créer de la valeur grâce à une suite logicielle axée autour de son système d’exploitation de la donnée massive et hétérogène.

A travers des investissements R&D très importants autour du traitement massif de la data, complétés par une stratégie soutenue d’acquisitions et de développement à l’international, ChapsVision a constitué rapidement un groupe cohérent constitué de deux branches adressant des secteurs à forte empreinte data : l’une dédiée à l’engagement client auprès des entreprises et l’autre offrant des solutions souveraines dédiées à la cyber intelligence et la cybersécurité des marchés de la défense, du renseignement et de la sécurité.


Créée en 2019, ChapsVision compte près de 600 collaborateurs, 600 clients grands comptes, et a réalisé un CA de 100 M€ en 2022.

VOUS ÊTES PASSIONNÉ.E PAR L’IA ET VOUS AVEZ ENVIE DE VOUS INVESTIR DANS UN PROJET AMBITIEUX ?

Vous rejoindrez la nouvelle division AI, le ChapsLab, qui centralise tous les efforts d’IA du groupe. Ces services seront utilisés à l’interne et offerts indépendamment aux clients externes. Le ChapsLab, qui compte déjà une vingtaine de data scientists et ingénieurs logiciels talentueux, est en constante évolution et recherche de nouveaux talents pour renforcer l’équipe et construire les meilleurs produits d’IA du marché.

Nous développons un service de référence qui permet de poser des questions sur des documents et d’obtenir une synthèse détaillée de la réponse.

Pour cela nous utilisons notre stack logicielle de recherche par mots clefs et similarité d’embeddings entre question et réponse. Nous souhaitons y ajouter un module d’expansion de requête, qui transforme une question implicite et ambiguë de l’utilisateur en séries de questions explicites et non ambigües. Nous souhaitons pour cela utiliser un équivalent à AgentGPT mais on-premises sur Llama 2, utilisant les technologies de Chain of Thoughts (CoT), Tree of Thoughts (ToT) et Graph of Thoughts (GoT).

EN TANT QUE STAGIAIRE EN DATA SCIENCE, VOS MISSIONS SERONT LES SUIVANTES :

  • Évaluer les méthodes de CoT, ToT et GoT et leur applicabilité à nos solutions
  • Réaliser une maquette d’expansion de requête à base de LlamaIndex. https://github.com/jerryjliu/llama_index
  • Réaliser une maquette d’expansion de requête à base de la solution Graph of thoughts. https://github.com/spcl/graph-of-thoughts
  • Évaluer les résultats des deux maquettes sur un corpus existant dans une infrastructure existante.
  • Définir un plan de développement
  •  

NOUS SOMMES FAITS POUR TRAVAILLER ENSEMBLE SI…

  • Ingénieur grande école, Master 2 data science ou Doctorant, vous possédez des connaissances approfondies en NLP.
  • Intelligence Artificielle appliquée aux textes : embeddings , BERT, Grands modèles de langage (LLM).
  • Utilisation des moteurs de recherche et d’indexation.
  • Programmation (Shell, Python …)
  • Des connaissances Lllama 2 seraient un plus.
  • Vous possédez d’excellentes qualités scientifiques et relationnelles, vous aimez travailler en équipe.
  • Vous aimez partager vos connaissances et disposez d’un bon sens de la communication.
  • La maitrise de l’anglais opérationnel serait appréciée.

INTÉRESSÉ.E ? ALORS ON VOUS DÉVOILE LA FORMULE GAGNANTE POUR POSTULER
ET REJOINDRE L’AVENTURE CHAPSVISION :

Envoyez nous votre CV.
Si votre profil est retenu, vous serez contacté.e par notre Talent Acquisition Specialist pour un premier échange visio.

Nous avons hâte d’avoir de vos nouvelles !

Poste en stage, à pourvoir rapidement au sein de nos locaux à Suresnes, Paris ou un de nos autres sites.

Avantages :

  • Carte Swile
  • 50% de remote possible
  • Prise en charge d’une partie des frais de transport
  • Accès à notre parking