fermatresearch/spanish-f5-tts 📝🖼️✓ → 🖼️

▶️ 893 runs 📅 Nov 2024 ⚙️ Cog 0.11.6
spanish text-to-speech voice-cloning

About

A F5-TTS fine-tuned for Spanish

Example Output

Output

Example output

Performance Metrics

12.23s Prediction Time
12.24s Total Time
All Input Parameters
{
  "gen_text": "Utiliza este modelo para convertir texto en una voz clara y natural! Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada. Simplemente introduce tu texto y deja que el modelo haga el resto!",
  "ref_text": "Escoge entre una variedad de voces para crear una historia digna de contar.",
  "ref_audio": "https://replicate.delivery/pbxt/LxDz1AGHQz1mNXJ8Gvbz6GqgTDY0ohGqDtO4m4QAHy7mF2eP/Untitled%20video%20-%20Made%20with%20Clipchamp%20%281%29%20copy.mp4",
  "remove_silence": true,
  "custom_split_words": ""
}
Input Parameters
gen_text (required) Type: string
Text to Generate
ref_text (required) Type: string
Reference Text
ref_audio (required) Type: string
Reference audio for voice cloning
remove_silence Type: booleanDefault: true
Automatically remove silences?
custom_split_words Type: stringDefault:
Custom split words, comma separated
Output Schema

Output

Type: stringFormat: uri

Example Execution Logs
Generating: Utiliza este modelo para convertir texto en una voz clara y natural! Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada. Simplemente introduce tu texto y deja que el modelo haga el resto!
[*] Converting reference audio...
[+] Converted reference audio.
[*] Using custom reference text...
[+] Reference text: Escoge entre una variedad de voces para crear una historia digna de contar.
[*] Forming batches...
[+] Formed batches: 3
------ Batch 1 -------------------
Utiliza este modelo para convertir texto en una voz clara y natural!
--------------------------------------
------ Batch 2 -------------------
Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada.
--------------------------------------
------ Batch 3 -------------------
Simplemente introduce tu texto y deja que el modelo haga el resto!
--------------------------------------
  0%|          | 0/3 [00:00<?, ?it/s]
 33%|███▎      | 1/3 [00:02<00:05,  2.67s/it]
 67%|██████▋   | 2/3 [00:07<00:03,  3.67s/it]
100%|██████████| 3/3 [00:09<00:00,  3.15s/it]
100%|██████████| 3/3 [00:09<00:00,  3.19s/it]
[*] Removing silence...
[+] Removed silence
[*] Saving output.wav...
[+] Saved output.wav
Version Details
Version ID
f26405b801a0b0945679fb3adf9bbca7ab8559c7fd9cf7cd2a68067c3aab83f7
Version Created
November 11, 2024
Run on Replicate →