fermatresearch/spanish-f5-tts 📝🖼️✓ → 🖼️
About
A F5-TTS fine-tuned for Spanish

Example Output
Output
Performance Metrics
12.23s
Prediction Time
12.24s
Total Time
All Input Parameters
{ "gen_text": "Utiliza este modelo para convertir texto en una voz clara y natural! Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada. Simplemente introduce tu texto y deja que el modelo haga el resto!", "ref_text": "Escoge entre una variedad de voces para crear una historia digna de contar.", "ref_audio": "https://replicate.delivery/pbxt/LxDz1AGHQz1mNXJ8Gvbz6GqgTDY0ohGqDtO4m4QAHy7mF2eP/Untitled%20video%20-%20Made%20with%20Clipchamp%20%281%29%20copy.mp4", "remove_silence": true, "custom_split_words": "" }
Input Parameters
- gen_text (required)
- Text to Generate
- ref_text (required)
- Reference Text
- ref_audio (required)
- Reference audio for voice cloning
- remove_silence
- Automatically remove silences?
- custom_split_words
- Custom split words, comma separated
Output Schema
Output
Example Execution Logs
Generating: Utiliza este modelo para convertir texto en una voz clara y natural! Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada. Simplemente introduce tu texto y deja que el modelo haga el resto! [*] Converting reference audio... [+] Converted reference audio. [*] Using custom reference text... [+] Reference text: Escoge entre una variedad de voces para crear una historia digna de contar. [*] Forming batches... [+] Formed batches: 3 ------ Batch 1 ------------------- Utiliza este modelo para convertir texto en una voz clara y natural! -------------------------------------- ------ Batch 2 ------------------- Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada. -------------------------------------- ------ Batch 3 ------------------- Simplemente introduce tu texto y deja que el modelo haga el resto! -------------------------------------- 0%| | 0/3 [00:00<?, ?it/s] 33%|███▎ | 1/3 [00:02<00:05, 2.67s/it] 67%|██████▋ | 2/3 [00:07<00:03, 3.67s/it] 100%|██████████| 3/3 [00:09<00:00, 3.15s/it] 100%|██████████| 3/3 [00:09<00:00, 3.19s/it] [*] Removing silence... [+] Removed silence [*] Saving output.wav... [+] Saved output.wav
Version Details
- Version ID
f26405b801a0b0945679fb3adf9bbca7ab8559c7fd9cf7cd2a68067c3aab83f7
- Version Created
- November 11, 2024