Skip to content

Best Practices (Scale & Security) 🛡️

Pour tirer le meilleur parti de LLM Bastion, voici les recommandations pour une mise en production réussie.

1. Ségrégation par Virtual Keys

Ne partagez jamais une seule Virtual Key pour toute l'entreprise.

  • Par Projet : Permet de refacturer les coûts précisément.
  • Par Environnement : Séparez dev, staging et prod.
  • Par Équipe : Appliquez des quotas différents (ex: $50/mois pour la R&D, illimité pour le Support Client).

2. Configuration des Guardrails

Ne saturez pas vos requêtes avec trop de guardrails inutiles.

  • Sensitive Data : Activez toujours la détection PII sur les inputs provenant d'utilisateurs externes.
  • Prompt Injection : Crucial pour les agents autonomes qui lisent des sources de données externes (RAG).

3. Optimisation des Coûts

  • TTL du Cache : Pour des assistants de FAQ, un cache de 24h est idéal. Pour du code, 1h suffit.
  • Model Fallback : Configurez vos routes pour essayer d'abord un modèle moins cher (ex: GPT-4o-mini) et ne basculer sur GPT-4o qu'en cas d'échec de validation (ou vice versa).

4. Monitoring & Alertes

Utilisez le Gateway Pulse pour identifier les patterns anormaux :

  • Une explosion soudaine du nombre de tokens.
  • Une augmentation du taux de rejet par les guardrails (signe potentiel d'attaque par injection).

IMPORTANT

Rappelez-vous que LLM Bastion est conçu pour être transparent. Si un guardrail bloque une requête, l'API renverra un code d'erreur standard compatible avec les SDKs OpenAI, facilitant la gestion d'erreurs côté client.