
My user experience with vozo.ai was above and beyond what I expected. I tried to use it to translate and lip-sync a TV commercial ad from Traditional Chinese (Taiwanese Mandarin accent) to English. I'd say it is smarter than HeyGen in some ways and especially the "lip-sync" function is more accurate and appropriate. We tried to adapt the TV commercial with HeyGen first and the results were not that good. One of the features I liked the most about vozo.ai is its capability to adjust and rewrite specific sentences when translating/lipsyncing videos, which it cannot be done with HeyGen. In addition, although vozo.ai's automatic recognition of speakers is slightly off in the case of detecting multiple speakers (the situation with this subject TV commercial), it can be fixed at will with simple clicks. Pricing-wise, Vozo.ai also offers more free credits than HeyGen and it works faster. A smooth and pleasant experience overall.
Vozo Ai is really making my work in our agency, i really recommend the team and harwork which they are putting to make life easier every single day. We were facing few probelsm wgith other aps but this gave us the perfect solution. Appreciate your work VOZO Team
So happy to have this tool. The editing panel is so smooth. But I do have 2 question. 1) How to add a pause in the sentence? I've tried space key, it doesn't work. 2) How can I stop the Lip sync if I touched it by mistake?
Vozo AI is a fantastic tool for smart video editing. I've tried it for personal and agency work, and it's more than good. My only suggestion is to further refine the lip-syncing, which I'm sure is going to be a highly in-demand feature. Hoping for continued innovation!
Esperienza decisamente deludente. Mi ha creato un video di nemmeno 5 minuti a partire dalla foto che avevo caricato, per far parlare una donna raffigurata in primo piano nella foto. La voce è però spesso fuori sincrono con il movimento delle labbra, alcune volte legge male (soprattutto se ci sono segni speciali come "-" o "°") e il tono di voce è piuttosto monotono, anche quando, per gli argomenti trattati, non lo dovrebbe essere. L'avatar che parla fa anche dei movimenti con le mani, gesticolando però in modo forse eccessivo e soprattutto ripetitivo, quasi come avesse dei tic. In più c'è il logo di Vozo che appare in continuazione e cambia anche posizione durante il video, sovrastando pure la persona che parla.
Ciao, grazie per aver condiviso la tua esperienza.
Ci dispiace che il risultato non sia stato all’altezza delle aspettative. I tuoi commenti sono preziosi e ci aiutano a migliorare continuamente.
Per quanto riguarda la pronuncia, non ci è del tutto chiaro cosa sia accaduto con simboli come "-" o "°". Se desideri che vengano letti in modo specifico, puoi eventualmente sostituirli con parole intere (ad esempio, "°" con "gradi"). In ogni caso, per capire meglio se si tratta di un bug, ti invitiamo a contattarci all’indirizzo support@vozo.ai: saremo felici di esaminare il caso con attenzione.
Sull’espressività vocale, nella nostra voice library sono disponibili diverse voci con tonalità ed emozioni differenti. Puoi sceglierne una che si adatti meglio al contenuto desiderato, e cliccare sull’icona di anteprima accanto al testo per ascoltare l’audio prima della generazione. Stiamo anche lavorando per permettere l’anteprima dell’intero audio dopo l’inserimento del testo — una funzione che potrà semplificare il tuo flusso di lavoro.
Per quanto riguarda la gestualità dell’avatar, sappiamo che nella modalità Talking Photo, specialmente su video più lunghi, ci sono ancora limiti da superare. Stiamo già lavorando per rendere i movimenti più naturali e meno ripetitivi.
Infine, se hai altri dubbi o desideri inviarci ulteriori dettagli, non esitare a scriverci a support@vozo.ai — ti risponderemo con piacere.
Grazie ancora per averci aiutato a migliorare!
I recently tried out Vozo for a project that required dubbing, and I have to say, I was pleasantly surprised by the results!
Vozo AI