Skip to content

En-têtes HTTP de Contrôle (LLM Standard v2.0) 🔌

LLM Bastion implémente la spécification ouverte LLM Standard (v2.0). Pour permettre aux développeurs d'adapter dynamiquement le comportement de la passerelle par requête sans modifier les politiques globales dans l'interface d'administration, la passerelle prend en charge un ensemble d'en-têtes HTTP ouverts sous le préfixe X-LLM-*.

> **Compatibilité Ascendante** : Pour garantir la continuité de vos services, LLM Bastion accepte de manière transparente les en-têtes historiques `X-Bastion-*` comme alias équivalents de compatibilité.


🛡️ Sécurité & Conformité

1. En-têtes d'activation des fonctionnalités (X-LLM-Flags)

Le header X-LLM-Flags (ou son alias historique X-Bastion-Flags) prend une liste de drapeaux (flags) séparés par des virgules pour activer des comportements de sécurité :

FlagDescriptionEffet sur la requête
pii-safe / maskingMasquage PII à la voléeRemplace les e-mails, tokens et numéros de cartes par des jetons anonymes.
adversarial-detectionBouclier Anti-InjectionBloque instantanément les requêtes suspectées d'injections de prompt.
force-json / structured-outputSortie StructuréeForce les modèles à retourner un JSON valide conforme au schéma attendu.

Exemple d'Appel (PII Masquage Dynamique) :

bash
curl https://api.llmbastion.fr/v1/chat/completions \
  -H "Authorization: Bearer lb_virtual_key_here" \
  -H "Content-Type: application/json" \
  -H "X-LLM-Flags: pii-safe, adversarial-detection" \
  -d '{
    "model": "gpt-4o",
    "messages": [
      {
        "role": "user",
        "content": "Bonjour, mon adresse email est john.doe@company.com et mon API key est sk-proj-12345."
      }
    ]
  }'

TIP

En ajoutant X-LLM-Flags: pii-safe, LLM Bastion nettoie automatiquement le prompt avant de l'envoyer au fournisseur LLM externe. L'adresse email sera remplacée par [[LLM_REDACTED_EMAIL_...]] et la clé API par [[LLM_REDACTED_KEY_...]].


⚡ Routage Intelligent & Exclusion de Cibles

LLM Bastion calcule dynamiquement la meilleure destination (modèle/fournisseur) pour votre requête. Vous pouvez influencer ou restreindre ce choix à la volée.

1. Exclusion de Fournisseurs, Modèles ou Régions

Si vos politiques internes ou des accords de confidentialité (DPA) interdisent l'envoi de certaines données à des acteurs ou pays spécifiques pour une requête donnée, utilisez les en-têtes d'exclusion standard :

http
X-LLM-Exclude-Providers: openai, google       # Exclut les modèles hébergés chez OpenAI et Google (Alias: X-Bastion-Exclude-...)
X-LLM-Exclude-Models: gpt-4o, claude-3-opus  # Exclut spécifiquement ces variantes de modèles
X-LLM-Exclude-Countries: us, cn              # Exclut toute infrastructure située aux États-Unis ou en Chine
  • Exclusion Régionale / Souveraineté : L'exclusion de pays (X-LLM-Exclude-Countries: us) garantit que votre requête sera uniquement routée vers des fournisseurs disposant d'infrastructures de calcul en Europe (comme Mistral sur serveurs souverains européens).

2. Filtres Financiers & Seuil de Qualité

Vous pouvez définir des exigences strictes en termes de rapport qualité/prix directement dans votre requête. Tout modèle ne répondant pas à ces contraintes sera automatiquement disqualifié du processus de décision :

http
x-llm-max-cost: 0.015            # Coût maximum accepté (en $ pour 1 000 tokens - Alias: x-bastion-max-cost)
x-llm-min-quality: 0.85          # Score de qualité minimal requis (échelle de 0.00 à 1.00 - Alias: x-bastion-min-quality)
x-llm-scoring-method: balanced  # Méthode d'évaluation : cost, latency, quality, ou balanced

Exemple d'Appel (Routage Économique & Souverain) :

bash
curl https://api.llmbastion.fr/v1/chat/completions \
  -H "Authorization: Bearer lb_virtual_key_here" \
  -H "Content-Type: application/json" \
  -H "X-LLM-Exclude-Countries: us" \
  -H "x-llm-max-cost: 0.005" \
  -H "x-llm-scoring-method: cost" \
  -d '{
    "messages": [{"role": "user", "content": "Analyser ce rapport financier européen."}]
  }'

📊 Observabilité, Tags & Billing

Pour simplifier le suivi analytique par équipe ou par environnement et optimiser les performances :

1. Marquage de Workloads (x-llm-tags)

Passez des métadonnées sous forme de tags clés-valeurs. Ces étiquettes seront associées à vos audits et visibles dans le dashboard Pulse pour la refacturation ou l'analyse des coûts (Alias historique : x-bastion-tags) :

http
x-llm-tags: team=data-science, env=production, project=churn-prediction

2. Mode de Facturation (x-llm-billing)

Configurez la manière dont les transactions et quotas de facturation sont calculés :

  • sync (par défaut) : Bloque et garantit l'admission immédiate en vérifiant les quotas de manière synchrone.
  • async : Optimise la vitesse de réponse en repoussant l'analyse fine des coûts et la journalisation en tâche de fond.
http
x-llm-billing: async

3. Traçabilité Complète (X-LLM-Trace)

Activez une journalisation approfondie étape par étape pour cette requête spécifique en ajoutant (Alias historique : X-Bastion-Trace) :

http
X-LLM-Trace: true
  • Réponse enrichie : Le gateway retournera des détails de performance supplémentaires dans les en-têtes HTTP de la réponse, comme X-Bastion-Request-ID et X-Bastion-Routing-Decision permettant de tracer précisément quel canal de secours a été emprunté en cas de panne d'un fournisseur principal.

TIP

Tous ces en-têtes sont facultatifs. S'ils ne sont pas spécifiés, LLM Bastion applique de manière transparente les politiques par défaut rattachées à votre Clé Virtuelle (Virtual Key) et à votre organisation. Pour consulter le standard complet de manière indépendante, vous pouvez vous référer aux spécifications du LLM Standard v2.0.