A API de Análise de Fala converte com precisão áudio em texto, oferecendo integração perfeita em várias aplicações. Ela utiliza reconhecimento de fala avançado e IA para fornecer transcrições precisas para diversas indústrias e casos de uso. Seja processando fala ao vivo ou arquivos de áudio pré-gravados, esta API garante conversão confiável e com erro minimizado Uma característica destacada desta API é seu suporte multilíngue, permitindo transcrição de alta precisão em múltiplos idiomas. Isso a torna uma ferramenta essencial para usuários que necessitam de transcrições em diferentes contextos linguísticos
{"success":true,"audio_file":"https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6371/speech+analysis+api/9136/obtain+text?url=https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
A API de Análise de Fala retorna texto transcrito a partir de entrada de áudio O output inclui a fala reconhecida em formato de texto que pode ser utilizado para várias aplicações como legendas documentação ou análise
Os campos principais nos dados de resposta geralmente incluem "transcrição" para o texto convertido "idioma" indicando o idioma detectado e "confiança" refletindo a precisão da transcrição
O parâmetro principal para o endpoint POST Obter Texto é o "audio_url" que especifica a URL do arquivo de áudio a ser transcrito Parâmetros adicionais podem incluir "language" para especificar o idioma desejado para a transcrição
Os dados de resposta estão organizados em um formato JSON, contendo pares de chave-valor. A estrutura principal inclui campos para a transcrição, idioma e pontuação de confiança, permitindo uma fácil interpretação e integração em aplicações
Casos de uso típicos incluem a geração de legendas para vídeos a criação de transcrições para reuniões ou entrevistas a melhoria da acessibilidade para usuários com deficiência auditiva e a análise de conteúdo falado em busca de insights em diversas indústrias
A precisão dos dados é mantida através de algoritmos avançados de reconhecimento de voz e treinamento contínuo em conjuntos de dados diversos A API também emprega verificações de qualidade para minimizar erros e melhorar a confiabilidade da transcrição
Os usuários podem personalizar suas solicitações especificando o parâmetro "idioma" para direcionar idiomas específicos para transcrição Isso permite resultados personalizados com base no contexto linguístico do conteúdo de áudio
Padrões de dados padrão incluem frases coerentes com pontuação e capitalização apropriadas Os usuários podem esperar variações na precisão com base na qualidade do áudio nos sotaques dos falantes e nos níveis de ruído de fundo
Nível de serviço:
100%
Tempo de resposta:
448ms
Nível de serviço:
100%
Tempo de resposta:
2.202ms
Nível de serviço:
100%
Tempo de resposta:
372ms
Nível de serviço:
100%
Tempo de resposta:
606ms
Nível de serviço:
100%
Tempo de resposta:
28ms
Nível de serviço:
100%
Tempo de resposta:
172ms
Nível de serviço:
100%
Tempo de resposta:
312ms
Nível de serviço:
100%
Tempo de resposta:
2.216ms
Nível de serviço:
100%
Tempo de resposta:
368ms
Nível de serviço:
100%
Tempo de resposta:
434ms