#1695 Como adicionar ollama.ai

191.6* Posted at: 7 days ago 👁86

Como adicionar ollama.ai


=
system:Windows-10-10.0.22631-SP0
version:v3.85
frozen:True
language:en
root_dir:E:/win-pyvideotrans-v3.85

23 Replies

To add Ollama.ai as a translation provider in pyVideoTrans, you need to use the "Local LLM" option. Follow these steps:

  1. In the main interface, go to the Translation section.
  2. Select Local LLM from the dropdown list of translation providers.
  3. Click the Settings button (gear icon) next to the provider selection.
  4. In the settings window that opens:

    • API URL: Enter your Ollama server address. The default is typically http://127.0.0.1:11434/v1.
    • Model Name: Enter the name of the specific model you have pulled and are running with Ollama (e.g., qwen2.5:7b, llama3.2:3b).
    • API Key: This field is usually not required for a local Ollama instance and can be left blank.

Prerequisites:

  • You must have Ollama installed and running on your system.
  • You must have pulled the desired model using ollama pull <model-name> in your terminal/command prompt before starting the translation process.

After configuring, select your source and target languages and proceed with the translation as usual.

eo grok.ai, qual modelo eu coloco?

Para usar o Grok da xAI como provedor de tradução, você deve selecionar a opção "OpenAI" na lista de provedores de tradução.

Configuração:

  1. No menu principal, vá em Ferramentas/Opções -> Configuração da Tradução.
  2. Na seção "OpenAI", cole sua Chave API do Grok no campo correspondente.
  3. No campo URL da API, você deve alterar o endpoint padrão para o endpoint específico do Grok. O URL correto é:
    https://api.x.ai/v1
  4. No campo Modelo, você deve usar o nome do modelo Grok. O modelo principal disponível atualmente é:
    grok-beta

Após preencher esses campos, você pode selecionar "OpenAI" como seu provedor de tradução na interface principal e usá-lo normalmente.

Pré-requisito: Você precisa ter uma conta xAI e gerar uma chave API válida para o Grok.

eu tenho instalado o Libre Translate (local) como adiciono no pyvideotrans?

Para adicionar o LibreTranslate local no pyVideoTrans:

  1. Na interface principal, na seção Tradução, selecione LibreTranslate na lista de provedores.
  2. Clique no botão Configurações (ícone de engrenagem) ao lado da seleção do provedor.
  3. Na janela de configurações que se abre:

    • URL da API: Digite o endereço do seu servidor LibreTranslate local. O padrão é normalmente http://127.0.0.1:5000 ou http://127.0.0.1:8080.
    • Chave da API: Este campo pode ser deixado em branco para uma instância local, a menos que você tenha configurado uma chave.

Pré-requisito: O servidor LibreTranslate deve estar instalado e em execução no seu computador antes de iniciar a tradução no pyVideoTrans.

Após a configuração, selecione os idiomas de origem e destino e prossiga com a tradução normalmente.

no texto srt -
1
00:00:00,066 --> 00:00:06,040
Ao ouvir Mark confessar seu amor por ela, JJ fica emocionada, mas logo percebe que não
2
00:00:06,040 --> 00:00:09,925
quer se precipitar e não tem certeza se seus sentimentos são recíprocos.

como adiciona 00:00:06,040 para 00:00:06,040 um tempo pausa, sem mecher no texto srt?

Para adicionar uma pausa no ponto 00:00:06,040 sem alterar o texto, você precisa dividir a linha do SRT em duas no momento exato da pausa. Isso criará um novo segmento vazio que representa a pausa.

No seu exemplo, a linha 1 atualmente cobre de 00:00:00,066 até 00:00:09,925. Para inserir uma pausa de, digamos, 0.5 segundos a partir de 00:00:06,040, você deve:

  1. Criar uma nova linha vazia para a pausa: Insira uma nova linha entre as linhas 1 e 2 atuais.
  2. Ajustar os tempos:

    • A Linha 1 original agora termina em 00:00:06,040.
    • A nova Linha 2 (pausa) começa em 00:00:06,040 e termina em 00:00:06,540 (adicionando 500ms).
    • A antiga Linha 2 (que se tornará a Linha 3) começa em 00:00:06,540.

Seu arquivo SRT ajustado ficaria assim:

1
00:00:00,066 --> 00:00:06,040
Ao ouvir Mark confessar seu amor por ela, JJ fica emocionada, mas logo percebe que não

2
00:00:06,040 --> 00:00:06,540


3
00:00:06,540 --> 00:00:09,925
quer se precipitar e não tem certeza se seus sentimentos são recíprocos.

Nota: O pyVideoTrans não tem uma função automática para "adicionar pausa" sem modificar o SRT. Você precisa editar manualmente o arquivo de legenda em um editor de texto (como o Bloco de Notas) seguindo a lógica acima, ajustando a duração da pausa conforme necessário.

o fala do 00:00:00,066 --> 00:00:06,040 acaba e ja esta indo para o 00:00:06,040 --> 00:00:06,540 rapido de mais , as falas estão muito coladas

Você está certo. O problema é que a fala original termina em 00:00:06,040 e a pausa começa exatamente no mesmo instante, o que não soa natural. Para criar uma pausa perceptível, você precisa:

  1. Encurtar ligeiramente a duração da fala que termina.
  2. Iniciar a pausa alguns milissegundos depois do fim da fala.

Solução Recomendada:

Ajuste os tempos para que haja um pequeno intervalo entre o fim de uma fala e o início da próxima (ou da pausa). Por exemplo, faça a primeira fala terminar em 00:00:05,940 (100ms antes) e a pausa começar em 00:00:06,040.

Seu SRT editado ficaria assim:

1
00:00:00,066 --> 00:00:05,940
Ao ouvir Mark confessar seu amor por ela, JJ fica emocionada, mas logo percebe que não

2
00:00:06,040 --> 00:00:06,540


3
00:00:06,540 --> 00:00:09,925
quer se precipitar e não tem certeza se seus sentimentos são recíprocos.

Explicação:

  • Linha 1: Termina em 00:00:05,940. Isso cria um intervalo de 100ms (00:00:06,040 - 00:00:05,940) de silêncio natural antes da pausa intencional.
  • Linha 2 (Pausa): Começa em 00:00:06,040 e dura 500ms até 00:00:06,540.
  • Linha 3: Começa em 00:00:06,540, após o fim da pausa.

Essa pequena margem entre as linhas (00:00:05,940 até 00:00:06,040) é crucial para que o áudio não soe "colado" e a pausa seja efetiva. Você pode ajustar esses valores (ex: 50ms, 150ms) conforme a necessidade do ritmo da cena.

qual parte do programa eu adiciona um pequeno tempo de intervalo para proximo texto?

No pyVideoTrans, você pode adicionar um intervalo automático entre as linhas de legenda durante o processo de reformulação/segmentação (re-sentence).

Localização:

  1. Na interface principal, na linha "Reformulação de segmentos" (ao lado da seleção do modelo de reconhecimento de voz).
  2. Selecione "LLM reformulação de segmentos" no menu suspenso.
  3. Clique no botão "Configurações" (ícone de engrenagem) ao lado.

Configuração:
Na janela de configurações do LLM que se abre, procure o parâmetro:

  • "Intervalo entre segmentos (ms)": Aqui você pode definir um tempo em milissegundos (por exemplo, 200 para 200ms) que será automaticamente adicionado como uma pausa entre o fim de um segmento de legenda e o início do próximo após o processo de reformulação.

Importante:

  • Esta função só funciona se você usar "LLM reformulação de segmentos".
  • Ela atua após o reconhecimento de voz original, reorganizando o texto e inserindo os intervalos configurados.
  • Para ajustes finos manuais em um arquivo SRT já existente, você ainda precisará editá-lo manualmente em um editor de texto, conforme explicado anteriormente.

Fluxo recomendado para seu caso:

  1. Faça o reconhecimento de voz (ASR) normalmente.
  2. Na janela de edição de legendas que aparece, se quiser ajustes automáticos, use o botão "Reformulação de segmentos" (com a opção LLM configurada com o intervalo desejado).
  3. Para ajustes pontuais e precisos (como a pausa específica que você mencionou), ignore a reformulação automática e edite manualmente os tempos na própria janela de edição de legendas do pyVideoTrans antes de prosseguir para a tradução.

so tem a opção de marca o "LLM reaphrase" , não tem opção de definir ms não

Você está correto. A opção "LLM rephrase" (Reformulação LLM) no pyVideoTrans não tem um parâmetro configurável para adicionar intervalos em milissegundos.

A função de adicionar um intervalo automático entre segmentos não está disponível na interface gráfica atual do pyVideoTrans v3.85. É uma funcionalidade que pode estar planejada ou em desenvolvimento, mas não está implementada para o usuário configurar.

Para resolver seu problema de falas muito coladas, você tem duas opções práticas:

  1. Edição Manual na Janela de Legendas (Recomendado para precisão):

    • Após o reconhecimento de voz (ASR), o pyVideoTrans abrirá a janela de edição de legendas.
    • Nessa janela, você pode selecionar a linha específica que deseja ajustar e modificar diretamente os campos de tempo de início e fim.
    • Para criar uma pausa, você precisa dividir a linha como explicado anteriormente: encurte o fim da linha anterior e adie o início da linha seguinte.
  2. Usar a Ferramenta "Subtitle Timings Shifter" (Deslocador de Tempos de Legenda):

    • No menu principal, vá para Ferramentas -> Subtitle Timings Shifter.
    • Esta ferramenta permite carregar um arquivo SRT e adicionar um atraso (delay) global ou específico a todas as linhas a partir de um certo ponto.
    • Limitação: Ela adiciona o atraso de forma linear (ex: +200ms para todas as linhas), não cria pausas entre as linhas de forma inteligente.

Conclusão: Para a pausa específica e controlada que você precisa entre 00:00:06,040 e 00:00:06,540, o método 1 (Edição Manual) na janela de legendas do pyVideoTrans é a única maneira direta de fazê-lo dentro do programa. A edição manual dos tempos é a ferramenta de precisão para esse tipo de ajuste.

estou usando Ollama com model phi3:mini , marquei o LLM reaphrase , mas não esta indo

O problema é que a função "LLM rephrase" requer uma configuração específica da API do Ollama, e não funciona apenas com o modelo de tradução configurado.

Para fazer o "LLM rephrase" funcionar com o Ollama, siga estes passos:

  1. Configurar o LLM para Reorganização:

    • No menu principal, vá para Ferramentas/Opções -> Configuração do LLM.
    • Na seção "LLM para reorganização de segmentos", você precisa preencher:

      • URL da API: A mesma do seu Ollama (ex: http://127.0.0.1:11434/v1).
      • Modelo: O nome do modelo que você quer usar para a reformulação. Pode ser o mesmo phi3:mini ou outro.
      • Chave da API: Normalmente pode ficar em branco para Ollama local.
    • Importante: Esta é uma configuração separada da configuração de tradução "Local LLM".
  2. Verificar se o Serviço está Ativo:

    • Certifique-se de que o Ollama está rodando em segundo plano. Você pode verificar abrindo o terminal e digitando ollama list para ver se os modelos estão carregados.
  3. Usar a Função:

    • Após o reconhecimento de voz, na janela de edição de legendas que aparece, clique no botão "Reformulação de segmentos" (não apenas marcar a caixa na tela inicial).
    • O programa então usará o modelo configurado no passo 1 para reestruturar as frases.

Se ainda não funcionar, verifique os logs:

  • Os arquivos de log estão na pasta logs dentro do diretório do pyVideoTrans.
  • Procure por erros relacionados a "rephrase" ou "LLM" no log mais recente. Isso mostrará a mensagem de erro exata do Ollama.

Resumo: A caixa "LLM rephrase" na tela principal só ativa a função. Você precisa configurar os detalhes da API do LLM em Ferramentas/Opções -> Configuração do LLM para que ela funcione.

LLM esta dando erro , esta pedindo Api , mas o ollama não precisa de api

O erro ocorre porque o pyVideoTrans, ao se conectar a um endpoint no formato da API OpenAI (que o Ollama simula), espera que um campo api_key seja enviado, mesmo que o servidor não o exija. Este é um comportamento padrão da biblioteca de cliente OpenAI que o software utiliza.

Solução: Use uma "Chave API" fictícia (placeholder).

  1. Vá para Ferramentas/Opções -> Configuração do LLM.
  2. Na seção "LLM para reorganização de segmentos", preencha:

    • URL da API: http://127.0.0.1:11434/v1
    • Modelo: phi3:mini (ou o nome exato do modelo que você está executando)
    • Chave da API: Digite qualquer texto, como ollama ou 123456. Este campo não pode ficar em branco. O Ollama ignorará este valor, mas o cliente da API o enviará e evitará o erro.
  3. Clique em Salvar.

Teste:
Após o reconhecimento de voz, na janela de edição de legendas, clique no botão "Reformulação de segmentos". Deve funcionar agora.

Se persistir o erro:
Verifique o arquivo de log em E:/win-pyvideotrans-v3.85/logs/ para ver a mensagem de erro exata e confirme se o Ollama está rodando (ollama serve).

agora esta gerando um novo aquivo chamado en.srt-noautofix , oque é?

O arquivo en.srt-noautofix é um arquivo de legenda de segurança gerado pelo pyVideoTrans.

O que é:
É uma cópia exata das legendas originais (geradas pelo reconhecimento de voz) antes de qualquer tentativa de correção automática de tempo ou reformulação pelo LLM.

Por que ele é criado:
Quando você clica no botão "Reformulação de segmentos" (LLM rephrase), o programa:

  1. Primeiro salva uma cópia de segurança do SRT original com o sufixo -noautofix.
  2. Em seguida, tenta processar e modificar o arquivo principal (normalmente en.srt).

Qual a sua finalidade:
É um backup de segurança. Se o processo de reformulação do LLM falhar completamente, corromper o arquivo ou produzir um resultado indesejado, você tem este arquivo original intacto para:

  • Renomeá-lo (removendo o -noautofix) e usá-lo no lugar do arquivo que deu problema.
  • Comparar com o resultado processado.

O que fazer com ele:

  • Se a reformulação funcionou bem: Você pode ignorar ou excluir o arquivo en.srt-noautofix. O arquivo principal en.srt é o que foi modificado e será usado nas etapas seguintes (tradução, dublagem).
  • Se a reformulação falhou ou estragou as legendas: Feche a janela de edição de legendas, vá para a pasta de saída, exclua o en.srt (o ruim) e renomeie o en.srt-noautofix para en.srt. Depois, reabra o projeto ou continue manualmente.

Em resumo, é um mecanismo de proteção do programa para evitar que você perca seu trabalho original se algo der errado durante a reformulação por IA.

na ultima versão , aparece uma tela para poder corrigir os textos, é possível desativar isso?

Sim, é possível desativar a janela de edição de legendas que aparece após o reconhecimento de voz (ASR).Como desativar:Vá para o menu principal: Ferramentas/Opções -> Configurações Gerais.Procure a opção: "Após a conclusão do reconhecimento de voz, exibir janela de edição de legendas".Desmarque esta caixa de seleção.Clique em Salvar.Efeito:Com esta opção desativada, o processo será totalmente automático:O reconhecimento de voz será executado.Os resultados serão salvos diretamente no arquivo de legenda (ex: en.srt).O programa prosseguirá automaticamente para a próxima etapa (tradução) sem pausar para revisão manual.Nota importante: Se você estiver usando "LLM rephrase" (Reformulação LLM), essa função requer que a janela de edição esteja aberta, pois o botão "Reformulação de segmentos" está dentro dela. Portanto, ao desativar a janela de edição, você também desativa a capacidade de usar a reformulação por LLM. O fluxo será puramente o resultado do ASR.

não encontrei essa opção

qual e o melhor trans channel google(free) ou Microsoft (Free)?

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions