Olá!
Me surgiu uma dúvida com relação ao Blip Speech.
O usuário manda um áudio que é convertido em texto para ser analisado e encaminhar o cliente para sua resposta. Como é essa resposta para o cliente? em texto ou em áudio? Porque como a ferramenta é STT, acredito que não tenha a resposta em áudio que necessitaria do TTS, estou enganada?

