Voicebox clone une voix en 3 secondes d'audio minimum, sans cloud ni compte, avec 5 moteurs TTS différents (Qwen3 couvre 10 langues, Chatterbox 23 langues, LuxTTS tourne 150x plus vite que le temps réel)
L'app inclut une API REST localhost pour intégrer la synthèse vocale dans vos scripts, automatiser des podcasts ou créer des pipelines custom avec ffmpeg
Codé en Rust/Tauri avec support GPU natif (MLX sur Apple Silicon, CUDA/ROCm/DirectML ailleurs), 8 effets audio inclus (reverb, delay, compression) et éditeur multi-pistes pour composer des conversations