elevenlabs/v2-multilingual 🔢❓📝 → 🖼️

⭐ Official ▶️ 19.5K runs 📅 Oct 2025 ⚙️ Cog 0.16.8

multilingual text-to-speech

Performance

8.4sTypical run time

19.5KTotal runs

About

Generate multilingual text-to-speech audio in over 30 languages

Example Output

Prompt:

Demain, dès l’aube, à l’heure où blanchit la campagne,
Je partirai. Vois-tu, je sais que tu m’attends.
J’irai par la forêt, j’irai par la montagne.
Je ne puis demeurer loin de toi plus longtemps.

Je marcherai les yeux fixés sur mes pensées,
Sans rien voir au dehors, sans entendre aucun bruit,
Seul, inconnu, le dos courbé, les mains croisées,
Triste, et le jour pour moi sera comme la nuit.

Je ne regarderai ni l’or du soir qui tombe,
Ni les voiles au loin descendant vers Harfleur,
Et quand j’arriverai, je mettrai sur ta tombe
Un bouquet de houx vert et de bruyère en fleur.

Output

Performance Metrics

8.43s Prediction Time

8.45s Total Time

All Input Parameters

{
  "speed": 1,
  "style": 0,
  "voice": "Aria",
  "prompt": "Demain, dès l’aube, à l’heure où blanchit la campagne,\nJe partirai. Vois-tu, je sais que tu m’attends.\nJ’irai par la forêt, j’irai par la montagne.\nJe ne puis demeurer loin de toi plus longtemps.\n\nJe marcherai les yeux fixés sur mes pensées,\nSans rien voir au dehors, sans entendre aucun bruit,\nSeul, inconnu, le dos courbé, les mains croisées,\nTriste, et le jour pour moi sera comme la nuit.\n\nJe ne regarderai ni l’or du soir qui tombe,\nNi les voiles au loin descendant vers Harfleur,\nEt quand j’arriverai, je mettrai sur ta tombe\nUn bouquet de houx vert et de bruyère en fleur.",
  "next_text": "",
  "stability": 0.5,
  "language_code": "fr",
  "previous_text": "",
  "similarity_boost": 0.75
}

Input Parameters

speed Type: numberDefault: 1Range: 0.7 - 1.2: Speed of speech (0.25 to 4.0)
style Type: numberDefault: 0Range: 0 - 1: Style exaggeration (0.0 to 1.0)
voice Default: Rachel: Voice choice for speech generation
prompt (required) Type: string: The text to convert to speech
next_text Type: stringDefault:: Next text for context
stability Type: numberDefault: 0.5Range: 0 - 1: Stability setting for voice generation (0.0 to 1.0)
language_code Type: stringDefault: en: Language code (e.g., 'en', 'es', 'fr')
previous_text Type: stringDefault:: Previous text for context
similarity_boost Type: numberDefault: 0.75Range: 0 - 1: Similarity boost setting (0.0 to 1.0)

Output Schema

Output

Type: string • Format: uri

Example Execution Logs

Generating speech with eleven_multilingual_v2 model...
Generated speech in 8.4sec

Version Details

Version ID: cc1c55e63c927e79a35f5807accbf172051f2b21effe1db532cf8c907cc68d57
Version Created: October 24, 2025

Run on Replicate →