#1587 qual comando é responsável pela emoção da dublagem?=Windows-10-10.0.22631-SP0version:v3.78frozen:Truelanguage:en

191.6* Posted at: 16 hours ago 👁43

qual comando é responsável pela emoção da dublagem?


=
Windows-10-10.0.22631-SP0
version:v3.78
frozen:True
language:en

23 Replies

The command or setting responsible for controlling the emotion in dubbing is the "Role" selection in the "Dubbing (TTS)" section on the main interface.

  1. In the "Dubbing (TTS)" section (row 4), click the dropdown menu next to "Role".
  2. Select a voice role. The available roles and their inherent emotional characteristics (e.g., friendly, cheerful, sad, empathetic) are determined by the TTS service you choose (like Edge-TTS, Azure TTS, etc.).
  3. For more advanced emotional control, you can use voice cloning services like GPT-SoVITS or F5-TTS, where you can provide a reference audio clip with the desired emotion for the model to imitate.

Currently, there is no separate, direct "emotion" slider or command in the main interface. The emotional tone is primarily defined by the pre-set voice role you select.

eo number of subtitles dubbed simultaneously?

The setting for the number of subtitles dubbed simultaneously is found in the Advanced Options.

To adjust it:

  1. Go to the top menu and select Tools -> Advanced Options.
  2. In the "Dubbing Adjustment" section, look for the parameter "Concurrent dubbing thread count".
  3. The default value is 1. You can increase this number to speed up processing, but be cautious as setting it too high can lead to rate limiting or errors from the TTS service (especially with free services like Edge-TTS).

This setting controls how many subtitle lines are sent for voice synthesis at the same time.

oque o "remove end silence in dubbling" faz?

A opção "Remove end silence in dubbing" (Remover silêncio final na dublagem) faz o seguinte:

Função: Ela remove automaticamente os pequenos períodos de silêncio no final de cada clipe de áudio gerado pela síntese de voz (TTS) antes de serem unidos ao vídeo.

Objetivo: Melhorar a sincronização entre o áudio dublado e o vídeo. Muitos serviços de TTS adicionam uma pequena pausa de silêncio no final de cada frase. Ao remover esse silêncio, a fala dublada se encaixa de forma mais justa e natural com as cenas do vídeo, evitando que o áudio termine cedo demais e deixe um vazio antes da próxima fala ou cena.

Onde encontrar: Esta opção está localizada no menu Ferramentas -> Opções Avançadas, na seção "Ajustes de Dublagem".

É geralmente recomendado manter esta opção ativada para um resultado mais polido.

Mas ela remove a cena que esta em silencio também? porque se tem uma parte que esta em silencio e vem o áudio que se encaixa com ela, se remover o silencio então o áudio vai começa antes da cena que é sincronizada a ela

Não, a opção "Remove end silence in dubbing" NÃO remove cenas do vídeo ou altera o momento em que o áudio dublado começa a tocar.

Ela funciona exclusivamente no áudio gerado pela dublagem (TTS). Aqui está a explicação detalhada:

  1. O que ela faz: Quando o serviço de TTS (como o Edge-TTS) gera o áudio para uma frase, ele frequentemente adiciona alguns milissegundos de silêncio no final desse arquivo de áudio específico. Esta opção corta apenas esse pequeno trecho de silêncio extra que foi adicionado pela síntese de voz.
  2. O que ela NÃO faz:

    • Ela não remove silêncio da trilha sonora original do vídeo.
    • Ela não remove cenas visuais.
    • Ela não altera o início do clipe de áudio dublado. O áudio ainda começará a tocar exatamente no momento de tempo definido pela linha da legenda original.

Para responder sua preocupação específica:

Se há uma cena silenciosa no vídeo e o áudio dublado é sincronizado para começar nela, o áudio vai continuar começando no mesmo momento. A única diferença é que a fala terminará ligeiramente mais cedo, pois o silêncio final foi cortado. Isso pode, na verdade, melhorar a sincronização, evitando que a dublagem "vaze" para a cena ou fala seguinte.

Em resumo, esta opção é um ajuste fino do áudio dublado para um encaixe mais justo, sem interferir no timing de início definido pelas legendas ou no conteúdo visual do vídeo.

oque fazer para acelerar o processo do programa? eu tenho gpu antiga que não esta sendo aceito, existe outro metodo?

Para acelerar o processo quando se tem uma GPU antiga não suportada, você pode usar os seguintes métodos:

1. Configurações de Reconhecimento de Voz (ASR)

  • Use modelos menores: No menu "Voice Recognition", selecione modelos como small ou medium em vez de large-v3
  • Altere o modo de reconhecimento: Use "Batch Inference" em vez de "Overall Recognition"
  • Reduza a precisão: Nas Opções Avançadas, mude:

    • CUDA Data Type para int8
    • Beam Size para 1
    • Best Of para 1
    • Desative "Enable Context Awareness"

2. Configurações de Dublagem (TTS)

  • Use serviços mais rápidos como Edge-TTS
  • Nas Opções Avançadas, aumente "Concurrent dubbing thread count" para 2-3 (mas não muito alto)

3. Configurações Gerais de Processamento

  • Desative recursos opcionais como:

    • "Noise Reduction"
    • "Voice Separation"
    • "Identify Speakers"
  • Use "Embed Soft Subtitles" em vez de "Embed Hard Subtitles"

4. Para GPU Não Suportada

  • Force o uso da CPU: Desmarque "CUDA Acceleration" na linha 6 da interface principal
  • Use OpenVINO (se disponível): Algumas versões suportam Intel GPUs antigas via OpenVINO

5. Processamento em Lote

  • Para múltiplos vídeos, ative "Force Serial in Batch Translation" nas Opções Avançadas para evitar sobrecarga

Essas configurações priorizam velocidade em detrimento da máxima qualidade, mas são eficazes para GPUs antigas.

Mas eu tenho cuda, tenho uma gtx 650 com cuda 10.2 , deveria funcionar

Sua GTX 650 com CUDA 10.2 provavelmente não funcionará com a versão atual do pyVideoTrans, mesmo que você tenha os drivers CUDA instalados. O problema é a incompatibilidade de versão.

Motivo Técnico:
A biblioteca ctranslate2 (que acelera o faster-whisper) na versão 4.x ou superior, usada pelo software, requer CUDA 12.x. Sua GPU é muito antiga e suporta apenas até CUDA 10.2, criando uma incompatibilidade direta.

Soluções Práticas:

  1. Use a CPU (Solução Imediata):

    • Na linha 6 da interface principal, desmarque a opção "CUDA Acceleration".
    • O processo será mais lento, mas funcionará de forma estável.
  2. Tente uma Versão Mais Antiga do Software (Não Garantido):

    • Versões muito antigas do pyVideoTrans (por exemplo, ~v1.x) usavam versões antigas do ctranslate2 que podiam ser compatíveis com CUDA 10.2. No entanto, isso não é recomendado, pois você perderá todos os recursos e correções recentes.

Recomendação:
A solução mais prática e confiável é a primeira: desative a aceleração CUDA e use a CPU. Para otimizar a velocidade nesse modo, aplique todas as outras dicas de aceleração mencionadas anteriormente (usar modelos menores, int8, beam_size=1, etc.).

A atualização para uma GPU mais moderna (com suporte a CUDA 12+) seria a única maneira de habilitar a aceleração por GPU neste software.

mas se algum modelo mais antigo funcionar ru quero porque eu poderia usar so para criar o texto srt , que o caso eo processo mais demorado

Sim, você pode usar um modelo mais antigo do faster-whisper que seja compatível com CUDA 10.2 apenas para criar o arquivo SRT. Esta é uma estratégia inteligente, já que a transcrição é de fato a parte mais demorada.

Como Fazer:

  1. Instale a versão compatível do ctranslate2:

    • Abra o Prompt de Comando ou Terminal.
    • Execute o comando:

      pip install ctranslate2==3.22.0
    • A versão 3.22.0 é a mais recente conhecida por suportar CUDA 10.2.
  2. Use o pyVideoTrans normalmente:

    • Inicie o programa.
    • Na linha 2 ("Voice Recognition"), selecione faster-whisper(local).
    • Escolha um modelo (ex: base, small, medium). Evite large-v2 ou large-v3, pois podem não caber na memória da sua GTX 650 (1GB ou 2GB).
    • Marque a caixa "CUDA Acceleration". Agora ela deve funcionar, usando sua GPU para a transcrição.
  3. Para o Resto do Processo (Tradução e Dublagem):

    • Após gerar o SRT, você pode:

      • Opção 1 (Recomendada): Desmarque "CUDA Acceleration" antes de prosseguir para a tradução e dublagem. Isso evita quaisquer outros conflitos de CUDA nas etapas seguintes.
      • Opção 2: Usar as ferramentas independentes do menu "Ferramentas", como "Transcribe and translate subtitles" ou "Batch translate SRT", para concluir o trabalho.

Resumo da Estratégia:

Use CUDA LIGADO com ctranslate2==3.22.0 apenas para a transcrição (criação do SRT). Para tradução e dublagem, use CPU (CUDA DESLIGADO) ou as ferramentas independentes. Isso maximizará a velocidade na parte mais crítica.

adicionei o pip install ctranslate2==3.22.0, mas ainda não consigo abilitar a opção "enable cuda"

O problema provavelmente persiste porque você instalou o ctranslate2 no ambiente Python global, mas o pyVideoTrans (especialmente a versão congelada/executável do Windows) usa seu próprio ambiente Python embutido.

Para corrigir isso, você precisa instalar a versão compatível dentro do ambiente do pyVideoTrans. Siga estes passos:

  1. Encontre a Pasta do pyVideoTrans: Navegue até a pasta onde você extraiu o pyVideoTrans (por exemplo, D:\videotrans).
  2. Abra o Prompt de Comando nesta Pasta:

    • Na barra de endereços do Explorador de Arquivos, clique e digite cmd, depois pressione Enter. Isso abrirá o Prompt de Comando já na pasta correta.
  3. Instale no Ambiente Correto (USE ESTE COMANDO EXATO):

    • Se você estiver usando a versão executável pré-empacotada (.exe), execute:

      .\python\python.exe -m pip install ctranslate2==3.22.0
    • Se você estiver usando a versão de código-fonte com uv, execute:

      uv add ctranslate2==3.22.0
  4. Reinicie o pyVideoTrans: Feche e abra o sp.exe novamente. A opção "Enable CUDA" agora deve ficar clicável e funcionar para a transcrição de voz.

Importante: Lembre-se de que sua GTX 650 tem VRAM muito limitada (1GB ou 2GB). Use modelos small ou base para evitar erros de memória. A opção de aceleração de CUDA pode ainda não estar disponível para outras partes do processo, como tradução ou TTS, mas deve funcionar para o faster-whisper.

O Windows PowerShell
Copyright (C) Microsoft Corporation. Todos os direitos reservados.

Instale o PowerShell mais recente para obter novos recursos e aprimoramentos! https://aka.ms/PSWindows

PS D:\win-videotrans-v3.78-0821> .\python\python.exe -m pip install ctranslate2==3.22.0
.\python\python.exe : O termo '.\python\python.exe' não é reconhecido como nome de cmdlet, função, arquivo de script
ou programa operável. Verifique a grafia do nome ou, se um caminho tiver sido incluído, veja se o caminho está correto
e tente novamente.
No linha:1 caractere:1

  • .\python\python.exe -m pip install ctranslate2==3.22.0
  •   + CategoryInfo          : ObjectNotFound: (.\python\python.exe:String) [], CommandNotFoundException

O erro indica que o caminho .\python\python.exe não existe na sua instalação. A estrutura de pastas da versão congelada do Windows mudou.

Solução correta:

  1. Encontre o Python correto: Na pasta do pyVideoTrans ( D:\win-videotrans-v3.78-0821 ), procure por um arquivo executável Python. Ele provavelmente se chama python.exe ou python3.exe e está na pasta raiz da instalação, não dentro de uma subpasta python.
  2. Use este comando no PowerShell:

    .\python.exe -m pip install ctranslate2==3.22.0

    ou tente:

    .\python3.exe -m pip install ctranslate2==3.22.0

Se ainda não funcionar, tente esta abordagem alternativa:

  1. Abra o Prompt de Comando tradicional (CMD) em vez do PowerShell. Clique na barra de endereços, digite cmd e pressione Enter.
  2. No CMD, execute:

    python.exe -m pip install ctranslate2==3.22.0

    ou

    python3.exe -m pip install ctranslate2==3.22.0

O importante é encontrar o executável Python correto que está na mesma pasta do sp.exe. Se nenhum deles funcionar, liste os arquivos da pasta usando dir *.exe no CMD para identificar o nome exato do executável Python.

verifiquei e não tem nenhum python.exe e nem python3.exe dentro da pasta win-videotrans-v3.78

Você está certo. Na versão pré-empacotada do Windows, não há um python.exe separado - o Python está embutido no executável principal.

Para instalar o ctranslate2==3.22.0 na versão congelada, você precisa usar um método diferente:

Método 1: Substituir arquivos manualmente (Recomendado)

  1. Baixe o ctranslate2-3.22.0 pré-compilado para Windows + CUDA 10.2:

    • Vá para: https://github.com/OpenNMT/CTranslate2/releases/tag/v3.22.0
    • Baixe ctranslate2-3.22.0-cp310-cp310-win_amd64.whl
  2. Extraia o conteúdo:

    • Renomeie o arquivo .whl para .zip
    • Extraia o conteúdo do zip
  3. Copie para a pasta do pyVideoTrans:

    • Copie a pasta ctranslate2 extraída para D:\win-videotrans-v3.78\python\Lib\site-packages\

Método 2: Usar dependências embutidas
Na pasta D:\win-videotrans-v3.78\python\Lib\site-packages\, verifique se já existe uma pasta ctranslate2. Se existir, renomeie-a para ctranslate2_backup primeiro.

Método 3: Alternativa mais simples
Como sua GPU é muito antiga (GTX 650), pode ser mais prático:

  • Use OpenAI Whisper em vez de Faster-whisper
  • Ou use FunASR para áudios em português
  • Ambos podem funcionar melhor com hardware antigo

Qual método você gostaria de tentar primeiro?

diretório D:\win-videotrans-v3.78\python\Lib\site-packages\ não existe, voce me passou diretorio errado

Você está certo, me desculpe pelo erro. Na versão congelada do Windows, a estrutura é diferente. Vamos verificar a estrutura real:

  1. Abra a pasta D:\win-videotrans-v3.78-0821
  2. Verifique se existe alguma dessas pastas:

    • python
    • lib
    • site-packages
    • PyInstaller
    • _internal

Solução alternativa mais prática:

Como a instalação manual está se mostrando complexa, recomendo esta abordagem:

  1. Use a ferramenta independente de transcrição:

    • No menu principal, clique em "Ferramentas"
    • Selecione "Batch voice to subtitle"
    • Esta ferramenta pode ser mais tolerante com GPUs antigas
  2. Ou use o FunASR para português:

    • Na linha de reconhecimento de voz, selecione "Ali FunASR(local)"
    • É otimizado para chinês mas funciona bem com português
    • Pode funcionar melhor com hardware limitado
  3. Se preferir continuar tentando com faster-whisper:

    • Compartilhe quais pastas você vê na raiz do D:\win-videotrans-v3.78-0821
    • Assim posso identificar onde estão as bibliotecas Python

Qual dessas opções você prefere tentar?

tem o _internal

C:\Users\PCGamer>dir "D:\win-videotrans-v3.78-0821" /s /b /ad
D:\win-videotrans-v3.78-0821\f5-tts
D:\win-videotrans-v3.78-0821\ffmpeg
D:\win-videotrans-v3.78-0821\logs
D:\win-videotrans-v3.78-0821\models
D:\win-videotrans-v3.78-0821\uvr5_weights
D:\win-videotrans-v3.78-0821\videotrans
D:\win-videotrans-v3.78-0821\_internal
D:\win-videotrans-v3.78-0821\uvr5_weights\modelparams
D:\win-videotrans-v3.78-0821\videotrans\language
D:\win-videotrans-v3.78-0821\videotrans\prompts
D:\win-videotrans-v3.78-0821\videotrans\styles
D:\win-videotrans-v3.78-0821\videotrans\prompts\srt
D:\win-videotrans-v3.78-0821\_internal\accelerate-1.7.0.dist-info
D:\win-videotrans-v3.78-0821\_internal\aiohttp
D:\win-videotrans-v3.78-0821\_internal\aliyunsdkcore
D:\win-videotrans-v3.78-0821\_internal\attrs-25.3.0.dist-info
D:\win-videotrans-v3.78-0821\_internal\av
D:\win-videotrans-v3.78-0821\_internal\av.libs
D:\win-videotrans-v3.78-0821\_internal\azure
D:\win-videotrans-v3.78-0821\_internal\azur
......
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Asia
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Atlantic
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Australia
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Brazil
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Canada
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Chile
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Etc
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Europe
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Indian
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Mexico
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\Pacific
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\US
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\America\Argentina
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\America\Indiana
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\America\Kentucky
D:\win-videotrans-v3.78-0821\_internal\tzdata\zoneinfo\America\North_Dakota
D:\win-videotrans-v3.78-0821\_internal\whisper\assets
D:\win-videotrans-v3.78-0821\_internal\whisper\normalizers
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\encoding
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\http1.0
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\msgs
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\opt0.4
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Africa
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\America
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Antarctica
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Arctic
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Asia
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Atlantic
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Australia
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Brazil
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Canada
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Chile
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Etc
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Europe
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Indian
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Mexico
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\Pacific
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\SystemV
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\US
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\America\Argentina
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\America\Indiana
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\America\Kentucky
D:\win-videotrans-v3.78-0821\_internal\_tcl_data\tzdata\America\North_Dakota
D:\win-videotrans-v3.78-0821\_internal\_tk_data\images
D:\win-videotrans-v3.78-0821\_internal\_tk_data\msgs
D:\win-videotrans-v3.78-0821\_internal\_tk_data\ttk

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions