elevenlabs/v2-multilingual 🔢❓📝 → 🖼️

⭐ Official ▶️ 1.5K runs 📅 Oct 2025 ⚙️ Cog 0.16.8
multilingual text-to-speech

About

Generate multilingual text-to-speech audio in over 30 languages

Example Output

Prompt:

"

Demain, dès l’aube, à l’heure où blanchit la campagne,
Je partirai. Vois-tu, je sais que tu m’attends.
J’irai par la forêt, j’irai par la montagne.
Je ne puis demeurer loin de toi plus longtemps.

Je marcherai les yeux fixés sur mes pensées,
Sans rien voir au dehors, sans entendre aucun bruit,
Seul, inconnu, le dos courbé, les mains croisées,
Triste, et le jour pour moi sera comme la nuit.

Je ne regarderai ni l’or du soir qui tombe,
Ni les voiles au loin descendant vers Harfleur,
Et quand j’arriverai, je mettrai sur ta tombe
Un bouquet de houx vert et de bruyère en fleur.

"

Output

Example output

Performance Metrics

8.43s Prediction Time
8.45s Total Time
All Input Parameters
{
  "speed": 1,
  "style": 0,
  "voice": "Aria",
  "prompt": "Demain, dès l’aube, à l’heure où blanchit la campagne,\nJe partirai. Vois-tu, je sais que tu m’attends.\nJ’irai par la forêt, j’irai par la montagne.\nJe ne puis demeurer loin de toi plus longtemps.\n\nJe marcherai les yeux fixés sur mes pensées,\nSans rien voir au dehors, sans entendre aucun bruit,\nSeul, inconnu, le dos courbé, les mains croisées,\nTriste, et le jour pour moi sera comme la nuit.\n\nJe ne regarderai ni l’or du soir qui tombe,\nNi les voiles au loin descendant vers Harfleur,\nEt quand j’arriverai, je mettrai sur ta tombe\nUn bouquet de houx vert et de bruyère en fleur.",
  "next_text": "",
  "stability": 0.5,
  "language_code": "fr",
  "previous_text": "",
  "similarity_boost": 0.75
}
Input Parameters
speed Type: numberDefault: 1Range: 0.7 - 1.2
Speed of speech (0.25 to 4.0)
style Type: numberDefault: 0Range: 0 - 1
Style exaggeration (0.0 to 1.0)
voice Default: Rachel
Voice choice for speech generation
prompt (required) Type: string
The text to convert to speech
next_text Type: stringDefault:
Next text for context
stability Type: numberDefault: 0.5Range: 0 - 1
Stability setting for voice generation (0.0 to 1.0)
language_code Type: stringDefault: en
Language code (e.g., 'en', 'es', 'fr')
previous_text Type: stringDefault:
Previous text for context
similarity_boost Type: numberDefault: 0.75Range: 0 - 1
Similarity boost setting (0.0 to 1.0)
Output Schema

Output

Type: stringFormat: uri

Example Execution Logs
Generating speech with eleven_multilingual_v2 model...
Generated speech in 8.4sec
Version Details
Version ID
cc1c55e63c927e79a35f5807accbf172051f2b21effe1db532cf8c907cc68d57
Version Created
October 24, 2025
Run on Replicate →