Será que seria o mesmo tipo de conversão de áudio em texto utilizado pelo Kdenlive, o editor de vídeos do projeto KDE?
O Kdenlive tem uma ferramenta para legendar videos que utiliza o Vosk (ou o Whisper) para fazer o reconhecimento de voz e gerar as legendas nos vídeos, nos moldes do que o Capcut faz, mas agora como um recurso pago.
Não sabia que o kdenlive tinha algo assim,usei poucas vezes e faz anos.
Obrigado demais por isso! Preciso colocar legendas num vídeo e é muito chato ajeitar tudo na linha de comando.
Será que seria o mesmo tipo de conversão de áudio em texto utilizado pelo Kdenlive, o editor de vídeos do projeto KDE?
O Kdenlive tem uma ferramenta para legendar videos que utiliza o Vosk (ou o Whisper) para fazer o reconhecimento de voz e gerar as legendas nos vídeos, nos moldes do que o Capcut faz, mas agora como um recurso pago.
Não sabia que o kdenlive tinha algo assim,usei poucas vezes e faz anos.
Obrigado demais por isso! Preciso colocar legendas num vídeo e é muito chato ajeitar tudo na linha de comando.
A documentação dessa feature no kdenlive tá aqui: https://docs.kdenlive.org/en/effects_and_filters/speech_to_text.html