Appearance
API Adapters & Intégrations 🔌
Les Adaptateurs API de LLM Bastion vous permettent d'intégrer le gateway de gouvernance de manière transparente dans vos applications existantes sans modifier votre code métier. En changeant simplement la clé API et l'URL de base de vos clients SDK officiels (OpenAI, Anthropic), vous activez instantanément la sécurité, la résilience et le cache distribué.
🚀 Pourquoi utiliser les Adaptateurs ?
En faisant transiter vos flux via les adaptateurs de LLM Bastion, chaque requête bénéficie automatiquement de :
- 🛡️ Security Guardrails : Désanonymisation/masquage en temps réel des données personnelles (PII) et blocage des injections de prompts.
- 🔄 Multi-Model Failover : Basculement automatique et transparent vers un fournisseur alternatif en cas de panne de l'API principale.
- ⚡ KV Caching (L1/L2) : Cache sémantique et exact ultra-rapide (< 1ms pour le L1) réduisant vos coûts et la latence à $0.
- 💰 Budget Quotas : Limitation automatique du budget et des tokens par clé virtuelle et par projet.
1. Guide d'Intégration : OpenAI SDK
L'adaptateur OpenAI de LLM Bastion est entièrement compatible avec les endpoints /v1/chat/completions et /v1/models.
🐍 Python
python
from openai import OpenAI
# Initialisez le client officiel en pointant vers l'adaptateur de LLM Bastion
client = OpenAI(
api_key="lb_live_votre_virtual_key...",
base_url="https://api.llmbastion.fr/adapters/openai/v1"
)
response = client.chat.completions.create(
model="gpt-4", # Bastion choisira le meilleur modèle ou expert disponible
messages=[
{"role": "user", "content": "Bonjour ! Peux-tu analyser mon code ?"}
]
)
print(response.choices[0].message.content)🟩 Node.js / TypeScript
typescript
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "lb_live_votre_virtual_key...",
baseURL: "https://api.llmbastion.fr/adapters/openai/v1",
});
async function main() {
const chatCompletion = await client.chat.completions.create({
messages: [{ role: "user", content: "Hello via OpenAI adapter !" }],
model: "gpt-4",
});
console.log(chatCompletion.choices[0].message.content);
}
main();2. Guide d'Intégration : Anthropic SDK
L'adaptateur Anthropic supporte l'interface standard unifiée Messages API.
🐍 Python
python
from anthropic import Anthropic
# Configurez le client Anthropic pour utiliser le gateway Bastion
client = Anthropic(
api_key="lb_live_votre_virtual_key...",
base_url="https://api.llmbastion.fr/adapters/anthropic"
)
message = client.messages.create(
model="claude-3-opus",
max_tokens=1024,
messages=[
{"role": "user", "content": "Bonjour Claude !"}
]
)
print(message.content[0].text)3. Direct HTTP Integration (custom apps / cURL)
Si vous développez une application customisée, vous pouvez effectuer des appels HTTP directs vers notre API native.
bash
curl https://api.llmbastion.fr/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer lb_live_votre_virtual_key..." \
-d '{
"model": "gpt-4",
"messages": [{"role": "user", "content": "Hello LLM Bastion !"}]
}'🛡️ Focus Sécurité : Masquage PII en Temps Réel (Test-Validated)
Le gateway de LLM Bastion intègre un pipeline de conformité RGPD/HIPAA haute performance. Avant d'envoyer la requête au fournisseur LLM tiers (OpenAI ou Anthropic), toutes les données sensibles sont interceptées et masquées.
Exemple de comportement (issu de test_pii_redaction_logic) :
1. Votre application envoie le prompt brut :
json
{
"messages": [
{
"role": "user",
"content": "Mon adresse email est secret.account@gmail.com"
}
]
}2. LLM Bastion intercepte, masque et transmet à OpenAI :
json
{
"messages": [
{
"role": "user",
"content": "Mon adresse email est [[LLM_REDACTED_EMAIL_6dcf2b]]"
}
]
}3. Le modèle répond de façon sécurisée, puis Bastion restaure les données anonymisées (de-masking) au retour si votre Virtual Key dispose des privilèges requis.
NOTE
Ce mécanisme de sécurité est validé de bout en bout par nos tests de régression dans guardrails.rs.
🔄 Focus Résilience : Failover Automatique Multi-Modèles
Pour éviter les coupures de service (ex: panne d'OpenAI ou d'Anthropic), LLM Bastion intègre un mécanisme de repli sémantique (Failover & Retry) testé sous conditions extrêmes via test_failover_retry_with_mockito.
sequenceDiagram autonumber Client->>Bastion: POST /v1/chat/completions (model: "auto") Note over Bastion: Tente le Fournisseur A (Prioritaire) Bastion->>Fournisseur A: Envoi de la requête Fournisseur A-->>Bastion: HTTP 500 / Timeout ❌ Note over Bastion: Détection de panne de A Note over Bastion: Basculement vers Fournisseur B (Backup) Bastion->>Fournisseur B: Envoi de la requête de secours Fournisseur B-->>Bastion: HTTP 200 OK ✅ Bastion-->>Client: Réponse fluide sans coupure de service
TIP
En utilisant le modèle générique auto, le gateway sélectionne dynamiquement le fournisseur en ligne le plus performant et le moins cher, tout en assurant une haute disponibilité à 99.99%.
📊 Matrice de compatibilité des adaptateurs
| Adaptateur | Endpoint Local | Statut de Production | SDK Supportés |
|---|---|---|---|
| OpenAI | https://api.llmbastion.fr/adapters/openai/v1 | ✅ Stable / Prod Ready | OpenAI v1+, LangChain, LlamaIndex, LiteLLM |
| Anthropic | https://api.llmbastion.fr/adapters/anthropic | 🛠️ Beta | Anthropic v0.x+, Messages API (Claude 3/3.5) |
| Mistral | https://api.llmbastion.fr/adapters/mistral/v1 | 📅 Planifié | - |
📚 Guides d'Intégration Avancés
Pour configurer vos frameworks favoris avec nos adaptateurs, consultez nos guides dédiés :
- Intégration LangChain (Python & TS) : Configurez vos chaînes et agents LangChain sécurisés en quelques lignes de code.
- Intégration LlamaIndex : Sécurisez et masquez les données sensibles issues de vos bases vectorielles dans vos architectures RAG.
- Intégration LiteLLM : Centralisez vos flux et tirez parti de LLM Bastion au-dessus de LiteLLM.
