Do not speak Portuguese? Translate this site with Google or Bing Translator
Transcribe AWS

Posted on: June 29, 2020 05:21 PM

Posted by: Renato

Categories: aws Transcribe

Views: 953

Conversão de áudio para texto usando o AWS Transcribe and Sentiment Analysis usando a API Comprehend

É um serviço de reconhecimento automático de fala (SAR) da Amazon.
é capaz de reconhecer fala de
arquivos de áudio ou vídeo existentes ou de um fluxo de conteúdo de áudio ou vídeo e também de uma
entrada de áudio diretamente do microfone do seu computador.

O Amazon Transcribe usa tecnologias avançadas de aprendizado de máquina para reconhecer a fala em arquivos de áudio e transcrevê-las para o texto. Você pode usar o Amazon Transcribe para converter áudio em texto e criar aplicativos que incorporem o conteúdo de arquivos de áudio. Por exemplo, você pode transcrever a faixa de áudio. de uma gravação de vídeo para criar legendas ocultas para o vídeo.

Caso de uso da AWS

Que tipo de serviço é?

É um serviço de aplicativo totalmente gerenciado na pilha de aprendizado de máquina, você não precisa provisionar nenhum servidor ou gerenciar qualquer infraestrutura, basta fornecer o arquivo de origem através de um bucket S3 e obterá a saída transcrita do mesmo modo ou um balde diferente ou poderia estar em um balde que está sendo "de propriedade da amazon".

1. Amazon Transcribe

14 idiomas suportados para transcrição

  1. Árabe padrão moderno (ar SA) adicionado à lista de suporte recentemente em 28 de maio de 2019
  2. Inglês Australiano (en AU)
  3. Inglês Britânico (en GB)
  4. Inglês indiano (en IN) adicionado à lista de suporte recentemente em 15 de maio de 2019
  5. Inglês dos EUA (en EUA)
  6. Francês (fr FR)
  7. Francês canadense (fr CA)
  8. Alemão (de DE)
  9. Hindi indiano (hi IN) adicionado à lista de suporte recentemente em 15 de maio de 2019
  10. Italiano (IT)
  11. Coreano (ko KR)
  12. Português do Brasil (pt BR)
  13. Espanhol (es ES) adicionado recentemente à lista de suporte em 19 de abril de 2019
  14. US espanhol (es US)

"); background-size:1px 1px; background-position:0px calc(1em + 1px)" target="_blank">https://docs.aws.amazon.com/transcribe/?id=docs_gateway

11 Regiões suportadas

É suportado em 11 regiões para aqueles que não sabem o que é uma região da AWS, é basicamente um limite geográfico definido pela AWS e contém várias zonas de disponibilidade (conhecidas como data centers). Fornecer tolerância a falhas e recursos de balanceamento de carga para os serviços da AWS nessa região ou em várias regiões simultaneamente. sendo dito que nem todos os serviços lançados pela AWS foram disponibilizados em todas as regiões.

  1. Ásia-Pacífico (Sydney)
  2. Ásia-Pacífico (Cingapura)
  3. Ásia-Pacífico (Mumbai)
  4. Canadá (Central)
  5. UE (Irlanda)
  6. UE (Londres)
  7. UE (Paris)
  8. Leste dos EUA (Virgínia do Norte)
  9. Leste dos EUA (Ohio)
  10. Oeste dos EUA (Oregon)
  11. Oeste dos EUA (Califórnia)

Características principais

Especificação técnica de entrada de fala

Formatos suportados: • FLAC, MP3, MP4 ou WAV
Duração e tamanho suportados:
• Menos de 4 horas de duração ou menos de 2 Gb de dados de áudio
Você deve especificar o idioma e o formato do arquivo de entrada.
Para obter melhores resultados:
• Use um formato sem perdas, como FLAC ou WAV, com codificação PCM de 16 bits.
• Use uma taxa de amostragem de 8000 Hz para o áudio do telefone.

Você pode especificar que o Amazon Transcribe identifique entre 2 a 10 alto-falantes no clipe de áudio.

Especificação técnica de vocabulário personalizado

Um vocabulário personalizado é uma lista de palavras específicas que você deseja que o Amazon Transcribe reconheça na sua entrada de áudio. Geralmente, são palavras e frases específicas do domínio, palavras que o Amazon Transcribe não está reconhecendo ou nomes próprios.
Você pode ter até 100 vocabulários em sua conta. O limite de tamanho para um vocabulário personalizado é de 50 Kb. Você pode defini-lo em um formato de lista ou de tabela.

 Referencia completa: https://medium.com/analytics-vidhya/converting-audio-to-text-using-aws-transcribe-and-finding-sentiment-using-comprehend-api-from-d692862e77d4

 Referencia completa: https://github.com/federalst/Teste-pratico


0

Share
About Author

Renato

Developer

Add a Comment
Comments 4 Comments
  • AndreSoada
    AndreSoada - há 1 ano
    Legit bitcoin doubler site 2021: Double Your Bitcoin Instantly. If you want to double your bitcoin instantly, or looking for a legit bitcoin doubler site in 2021 to earn crypto, check this out. Click : https://bitdouble.net
  • Williamphymn
    Williamphymn - há 1 ano
    ✨Premium Seller - 8 years old Twitter Account With less than 100 Followers For Just $31✨ dig this https://sellaccs.net PM Skype & Telegram : congmmo ICQ : @652720497 Email : [email protected] .com THX!
  • TwitterCo-tah
    TwitterCo-tah - há 2 anos
    Bán Account Twitter cổ từ 2007 đến 2017 random follower dưới 100 giá 23k/accs. Giá có thể thay đổi theo thời điểm. http://accs.vn Liên hệ: Zalo : 0934670123 [email protected] Thank you!
  • Geraldadmig
    Geraldadmig - há 2 anos
    2010 ??<HQ> AGED TWITTER ACCOUNT (2008-2019) ORIGINAL EMAIL INCLUDED INSTANT DELIVERY ?? Go At this site https://accstores.com Contact Skype & Telegram : congmmo ICQ : @652720497 Email : [email protected] .com Thanks You

Blog Search


Categories

OUTROS (12) Variados (109) PHP (111) Laravel (119) Black Hat (3) front-end (26) linux (95) postgresql (35) Docker (17) rest (4) soap (1) webservice (6) October (1) CMS (2) node (7) backend (11) ubuntu (48) devops (23) nodejs (5) npm (2) nvm (1) git (5) firefox (1) react (6) reactnative (5) collections (1) javascript (5) reactjs (7) yarn (0) adb (1) solid (0) blade (2) models (1) controllers (0) log (0) html (2) hardware (2) aws (14) Transcribe (2) transcription (1) google (3) ibm (1) nuance (1) PHP Swoole (4) mysql (23) macox (4) flutter (1) symfony (1) cor (1) colors (2) homeOffice (2) jobs (2) imagick (2) ec2 (1) sw (1) websocket (1) markdown (1) ckeditor (1) tecnologia (13) faceapp (1) eloquent (11) query (2) sql (35) ddd (3) nginx (6) apache (4) certbot (1) lets-encrypt (2) debian (10) liquid (1) magento (2) ruby (1) LETSENCRYPT (1) Fibonacci (1) wine (1) transaction (1) pendrive (1) boot (1) usb (1) prf (1) policia (2) federal (1) lucena (1) mongodb (4) paypal (1) payment (1) zend (1) vim (3) ciencia (6) js (1) nosql (1) java (1) JasperReports (1) phpjasper (1) covid19 (1) saude (1) athena (1) cinnamon (1) phpunit (1) binaural (1) mysqli (3) database (33) windows (4) vala (1) json (2) oracle (1) mariadb (2) dev (12) webdev (24) s3 (4) storage (1) kitematic (1) gnome (2) web (2) intel (3) piada (1) cron (2) dba (13) lumen (1) ffmpeg (2) android (2) aplicativo (1) fedora (2) shell (3) bash (2) script (3) lider (1) htm (1) csv (1) dropbox (1) db (3) combustivel (2) haru (1) presenter (1) gasolina (1) MeioAmbiente (1) Grunt (0) biologia (1) programming (20) performance (2) brain (1) smartphones (1) telefonia (1) privacidade (1) opensource (3) microg (1) iode (1) ssh (1) zsh (1) terminal (1) dracula (1) spaceship (1) mac (2) idiomas (1) laptop (2) developer (27) api (1) data (1) matematica (1) seguranca (2) 100DaysOfCode (6) hotfix (1) documentation (1) laravel (2) RabbitMQ (1) Elasticsearch (1) redis (2) Raspberry (3) Padrao de design (4) JQuery (1) angularjs (3) Dicas (15) kubenetes (1) vscode (1) backup (1) angular (2) servers (2) pipelines (1) AppSec (1) DevSecOps (2) rust (1) RustLang (1) Mozilla (1) algoritimo (1) sqlite (1) Passport (1) jwt (2) security (1) translate (1) kube (1) iot (1) politica (2) bolsonaro (1) flow (1) podcast (1) Brasil (1) containers (2) traefik (1) networking (1) host (1) POO (1) microservices (1) bug (1) cqrs (1) arquitetura (1) Architecture (1) sail (1) militar (1) artigo (1) economia (1) forcas armadas (1) ffaa (1) autenticacao (1) autorizacao (1) authentication (1) authorization (1) NoCookies (1) wsl (1) memcached (1) macos (2) unix (1) kali-linux (1) linux-tools (1) apple (1) noticias (2)

New Articles



Get Latest Updates by Email