Hume
Hume AI — платформа для создания «эмпатичных» голосовых интерфейсов. Флагманский EVI 3 понимает нюансы голоса пользователя (просодию, тембр, эмоциональные модальности) и в реальном времени отвечает собственной речью, управляя содержанием и тоном через «speech-language» модель; также возможно подмешивание ответов внешнего LLM по вашему API-ключу.
Помимо разговорного стека, доступен Octave TTS (создание и клонирование голосов) и Expression Measurement API — измерение выражений в голосе, лице и тексте. Доступны веб-playground, SDK и стриминговый WebSocket-интерфейс. Планы — помесячные с включёнными лимитами и почасово-минутным биллингом за использование (usage-based), отдельная тарификация для EVI 3 и TTS. Версии EVI 1/2 официально выведены из эксплуатации; поддерживается миграция на EVI 3.
- Speech-to-speech (EVI 3), real-time, WebSocket API
- Поддержка внешних LLM (передача собственного API-ключа)
- Octave TTS: генерация, настройка и клонирование голосов
- Expression Measurement: voice/face/language
Документация сервиса · EVI 3 · Expression Measurement · Цены
Записей не найдено.