A Meta revelou nesta sexta-feira (16) o Voicebox, mais novo avanço da dona do Facebook em inteligência artificial generativa. A tecnologia é capaz de converter texto em fala, realizando um trabalho semelhante ao que o Dall-E faz com a descrição textual e as imagens.
Treinado com mais de 50 mil horas de áudio, incluindo falas gravadas e transcrições de audiolivros de domínio público, o mecanismo pode “produzir clipes de áudio de alta qualidade”, de acordo com a big tech. Mutilíngue, o modelo gera falas em seis idiomas, entre os quais o português.