fermatresearch/spanish-f5-tts 📝🖼️✓ → 🖼️

▶️ 1.7K runs 📅 Nov 2024 ⚙️ Cog 0.11.6

spanish text-to-speech voice-cloning

Performance

12.2sTypical run time

1.7KTotal runs

About

A F5-TTS fine-tuned for Spanish

Example Output

Output

Performance Metrics

12.23s Prediction Time

12.24s Total Time

All Input Parameters

{
  "gen_text": "Utiliza este modelo para convertir texto en una voz clara y natural! Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada. Simplemente introduce tu texto y deja que el modelo haga el resto!",
  "ref_text": "Escoge entre una variedad de voces para crear una historia digna de contar.",
  "ref_audio": "https://replicate.delivery/pbxt/LxDz1AGHQz1mNXJ8Gvbz6GqgTDY0ohGqDtO4m4QAHy7mF2eP/Untitled%20video%20-%20Made%20with%20Clipchamp%20%281%29%20copy.mp4",
  "remove_silence": true,
  "custom_split_words": ""
}

Input Parameters

gen_text (required) Type: string: Text to Generate
ref_text (required) Type: string: Reference Text
ref_audio (required) Type: string: Reference audio for voice cloning
remove_silence Type: booleanDefault: true: Automatically remove silences?
custom_split_words Type: stringDefault:: Custom split words, comma separated

Output Schema

Output

Type: string • Format: uri

Example Execution Logs

Generating: Utiliza este modelo para convertir texto en una voz clara y natural! Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada. Simplemente introduce tu texto y deja que el modelo haga el resto!
[*] Converting reference audio...
[+] Converted reference audio.
[*] Using custom reference text...
[+] Reference text: Escoge entre una variedad de voces para crear una historia digna de contar.
[*] Forming batches...
[+] Formed batches: 3
------ Batch 1 -------------------
Utiliza este modelo para convertir texto en una voz clara y natural!
--------------------------------------
------ Batch 2 -------------------
Este sistema está diseñado para ayudarte a crear mensajes de audio efectivos en aplicaciones de asistencia, lectura en voz alta, o cualquier contexto donde se necesite una voz sintetizada.
--------------------------------------
------ Batch 3 -------------------
Simplemente introduce tu texto y deja que el modelo haga el resto!
--------------------------------------
  0%|          | 0/3 [00:00<?, ?it/s]
 33%|███▎      | 1/3 [00:02<00:05,  2.67s/it]
 67%|██████▋   | 2/3 [00:07<00:03,  3.67s/it]
100%|██████████| 3/3 [00:09<00:00,  3.15s/it]
100%|██████████| 3/3 [00:09<00:00,  3.19s/it]
[*] Removing silence...
[+] Removed silence
[*] Saving output.wav...
[+] Saved output.wav

Version Details

Version ID: f26405b801a0b0945679fb3adf9bbca7ab8559c7fd9cf7cd2a68067c3aab83f7
Version Created: November 11, 2024

Run on Replicate →