Google Gemini 3.5 Flash — fast, cost-efficient multimodal model with strong reasoning and a large context window.

Modèle :
Sampling temperature.
Maximum output tokens.
Estimation USD $0.0205-$0.041 : Le plus grand pack de recharge utilise $1 = 2 000 crédits ; le pack de démarrage utilise $1 = 1 000 crédits.

Historique
Enregistré localement dans ce navigateur
0 en cours · 0 terminées
Entrée
≈ $0.0008-$0.0015
Sortie
≈ $0.005-$0.01
Lecture cache
≈ $0.000075-$0.0001
Contexte
Sortie max.
Instructions API
Appelez ce modèle via une REST API standard. Après authentification par API Key, choisissez un endpoint ci-dessous pour voir ses paramètres et exemples.
Authentification
Chaque requête doit inclure un jeton Bearer dans l’en-tête Authorization. Créez votre API Key dans la console.
Authorization: Bearer YOUR_API_KEYhttps://apiany.ai/v1/chat/completionsParamètres de requête
| Paramètre | Type | Obligatoire | Notes |
|---|---|---|---|
model | chaîne | Obligatoire | L’identifiant du modèle à appeler, en utilisant l’ID de ce modèle. |
messages | tableau | Obligatoire | Historique des messages au format de chat OpenAI (role + content). |
stream | booléen | Optionnel | Si true, la réponse est renvoyée sous forme de flux SSE. |
Exemple de requête
curl "https://apiany.ai/v1/chat/completions" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-flash",
"messages": [
{
"role": "user",
"content": "Présente en trois phrases la capacité d’agrégation multi-canaux d’APIAny.AI et donne une recommandation pour la production."
}
],
"temperature": 0.7,
"max_tokens": 4096
}'Exemple de réponse
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "gemini-3.5-flash",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "Hello! How can I help?"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 12,
"completion_tokens": 18,
"total_tokens": 30
}
}