Criar transcrição de um áudio ou vídeo

Além da transcrição, também é realizado o processo de diarização, que é um termo específico em processamento de áudio e refere-se ao processo de identificar e separar as vozes de diferentes pessoas em um áudio ou vídeo. Atualmente a separação ocorre entre atendente (attendant) ou cliente (customer).

Instruções para o recebimento da diarização

Sobre o tamanho do arquivo:

  • Por padrão, realizamos um tratamento do áudio, incluindo extração do áudio em caso de arquivos de vídeo, conversão para o formato .wav e compressão para adequar o arquivo aos níveis necessários de configuração. No entanto, recomendamos arquivos com tamanho máximo de 25 MB para um processamento mais eficiente e com melhor qualidade.
  • O tamanho máximo permitido para os arquivos enviados é de até 500 MB. No entanto, tenha em mente que a tentativa de comprimir o arquivo para menos de 25 MB pode resultar em perda de qualidade na faixa de áudio, o que pode comprometer o processamento da diarização ou até causar erros.

Processamento realizado com sucesso:

  • Ao final do processamento do áudio ou vídeo, quando a diarização (diálogo) for gerada, ela será enviada para a URL fornecida no campo "on_success" através do método POST. Portanto, é importante que a API esteja pronta para receber os dados no formato abaixo.
{
  "dialog": [
    {
      "speaker": "attendant",
      "text": "Olá, aqui é o Sérgio da empresa NUVIDIO, como posso ajudar você hoje?"
    },
    {
      "speaker": "customer",
      "text": "Oi Sérgio, eu me chamo Caio e eu recebi a proposta por e-mail, mas estou com algumas dúvidas."
    }
  ],
  "diarizationId": "d17d1461-d896-407e-85bc-e7ea825b1482",
  "transcription": "Olá, aqui é o Sérgio da empresa NUVIDIO, como posso ajudar você hoje? Oi Sérgio, eu me chamo Caio e eu recebi a proposta por e-mail, mas estou com algumas dúvidas."
}

Erro no processamento:

  • Se ocorrer um erro no download do arquivo pela URL fornecida (no campo "file_url") ou durante o processamento do arquivo baixado, uma mensagem de erro será enviada para a URL indicada no campo "on_error" via método POST. Portanto, é importante que a API esteja preparada para receber os dados no formato abaixo.
{
    "description": "error description here",
    "error": "error to generate diarization",
    "diarizationId": "d17d1461-d896-407e-85bc-e7ea825b1482" 
}

Orientações sobre o endpoint de callback:

Uma vez que o papel da Conversify é simplesmente devolver os dados. o que o receptor fará com esses dados e como os tratará não é relevante do ponto de vista da Conversify, portanto, recomendamos que ao receber os dados, realize o tratamento em background e em primeiro momento já retorne um código de sucesso (como 200, ou 204).

Language
Credentials
OAuth2
Click Try It! to start a request and see the response here!