Session

O impacto da IA na evolução o reconhecimento e síntese de voz

O Google Chrome incorpora a funcionalidade de transcrição de fala (speech-to-text) desde a sua versão 25. No entanto, é somente agora que dispomos de APIs e ferramentas robustas para integrar inteligência artificial, reconhecimento de intenções e serviços de LLM, abrindo novas possibilidades para o desenvolvimento de serviços inteligentes, tanto dentro do navegador quanto em outros canais de comunicação.

Nesta palestra, conduziremos uma jornada prática que abrange desde a utilização das funcionalidades de speech-to-text e text-to-speech (TTS) no navegador até a integração destas capacidades em plataformas na nuvem, proporcionando uma experiência mais ampla e aprofundada.

A ideia é apresentar sobre a evolução das APIs e ferramentas para reconhecimento de voz com exemplos práticos, desde o webspeech API residente no Chrome e disponível em outros navegadores e demonstrar outros casos de uso, passando por outros serviços de transcrição como o Whisper da OpenAI, Google Speech to Text, entre outros e apresentar soluções de síntese de voz, como Elevenlabs, Google TTS, etc que já fazem uso de IA Generativa.

Luís Leão

Desenvolvedor Evangelista na Twilio e Google Developer Expert de Firebase

São Paulo, Brazil

Actions

Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.

Jump to top