•x.ai•
5 visualizações
xAI lança API Grok Voice Agent para habilitar capacidades de voz para todos os desenvolvedores - x.ai
A xAI anunciou o lançamento da beta pública da Grok Voice Agent API em 31 de outubro de 2024. A API permite que desenvolvedores criem agentes de voz sofisticados alimentados pelo Grok. O Voice Mode, antes disponível apenas no xAI Playground, agora é acessível via API. Principais recursos incluem conversas naturais e fluidas com baixa latência (~150ms fim a fim), manuseio de interrupções e turn-taking, e múltiplas vozes disponíveis. Em breve: suporte a visão, vozes customizadas e mais vozes. Preços: entrada $0.05 por minuto de áudio, saída $0.15 por minuto de áudio, mais precificação padrão de tokens de texto para modelos Grok. Gere uma chave API em console.x.ai, consulte a documentação em docs.x.ai/docs/voice e veja exemplos no GitHub: github.com/xai-org/grok-voice-api.