Image de présentation de France Travail

Serving LLM : du benchmark à la recommandation.

Secteur public | Prestation sociale

Au sein d’une équipe IA, phase d’exploration des LLMs open source en vue de leur industrialisation. Contrainte forte sur les ressources GPU (A100 on-prem), multiplicité des déploiements non tracés et besoin de choisir un backend de serving adapté avant mise en production.

Principales réalisations

Apport / résultat

Notre étude a permis la sélection éclairée de vLLM, accompagnée de recommandations d’infrastructure (dimensionnement GPU, choix cloud). Nous avons posé les bases d’une gouvernance des déploiements, permettant d’initier une approche industrialisable et reproductible.

vLLM

TGI

llama.cpp

OpenLLM

Triton

Inference Server

Nous avons posé les bases d'une gouvernance des déploiements, permettant d’initier une approche industrialisable et reproductible.

Notre mission.
Accompagner vos transformations.

IA
AI4IT
Data
Cloud

Parlons de votre projet

Laissez-nous vos coordonnées et un expert Valeuriad vous recontactera sous 24h pour échanger sur vos enjeux.

Adresse 14 Rue François Evellin, 44000 Nantes

Atelier Data, Cloud & Souveraineté

Transformer une idée IA en solution maîtrisée

Une démarche IA utile commence par la donnée, les usages et les décisions à sécuriser. Sans cadrage, les expérimentations se multiplient sans ROI. Sans industrialisation, la dette IA s’accumule. Sans gouvernance, les coûts GPU, les dépendances technologiques et les risques de conformité finissent par bloquer les ambitions. Valeuriad aide à transformer une idée en solution IA adoptée, gouvernée, souveraine, industrialisée et maintenable — en identifiant d’abord les cas d’usage qui méritent réellement d’entrer en production.

Nos dernières actualités

Échangeons pour créer une valeur durable