post https://apigw.nuvidio.com/conversify/api/v1/speech/diarization
Além da transcrição, também é realizado o processo de diarização, que é um termo específico em processamento de áudio e refere-se ao processo de identificar e separar as vozes de diferentes pessoas em um áudio ou vídeo. Atualmente a separação ocorre entre atendente (attendant) ou cliente (customer).
Instruções para o recebimento da diarização
Sobre o tamanho do arquivo:
- Por padrão, realizamos um tratamento do áudio, incluindo extração do áudio em caso de arquivos de vídeo, conversão para o formato .wav e compressão para adequar o arquivo aos níveis necessários de configuração. No entanto, recomendamos arquivos com tamanho máximo de 25 MB para um processamento mais eficiente e com melhor qualidade.
- O tamanho máximo permitido para os arquivos enviados é de até 500 MB. No entanto, tenha em mente que a tentativa de comprimir o arquivo para menos de 25 MB pode resultar em perda de qualidade na faixa de áudio, o que pode comprometer o processamento da diarização ou até causar erros.
Processamento realizado com sucesso:
- Ao final do processamento do áudio ou vídeo, quando a diarização (diálogo) for gerada, ela será enviada para a URL fornecida no campo "on_success" através do método POST. Portanto, é importante que a API esteja pronta para receber os dados no formato abaixo.
{
"dialog": [
{
"speaker": "attendant",
"text": "Olá, aqui é o Sérgio da empresa NUVIDIO, como posso ajudar você hoje?"
},
{
"speaker": "customer",
"text": "Oi Sérgio, eu me chamo Caio e eu recebi a proposta por e-mail, mas estou com algumas dúvidas."
}
],
"diarizationId": "d17d1461-d896-407e-85bc-e7ea825b1482",
"transcription": "Olá, aqui é o Sérgio da empresa NUVIDIO, como posso ajudar você hoje? Oi Sérgio, eu me chamo Caio e eu recebi a proposta por e-mail, mas estou com algumas dúvidas."
}
Erro no processamento:
- Se ocorrer um erro no download do arquivo pela URL fornecida (no campo "file_url") ou durante o processamento do arquivo baixado, uma mensagem de erro será enviada para a URL indicada no campo "on_error" via método POST. Portanto, é importante que a API esteja preparada para receber os dados no formato abaixo.
{
"description": "error description here",
"error": "error to generate diarization",
"diarizationId": "d17d1461-d896-407e-85bc-e7ea825b1482"
}
Orientações sobre o endpoint de callback:
Uma vez que o papel da Conversify é simplesmente devolver os dados. o que o receptor fará com esses dados e como os tratará não é relevante do ponto de vista da Conversify, portanto, recomendamos que ao receber os dados, realize o tratamento em background e em primeiro momento já retorne um código de sucesso (como 200, ou 204).