Hume

Hume AI — платформа для создания «эмпатичных» голосовых интерфейсов. Флагманский EVI 3 понимает нюансы голоса пользователя (просодию, тембр, эмоциональные модальности) и в реальном времени отвечает собственной речью, управляя содержанием и тоном через «speech-language» модель; также возможно подмешивание ответов внешнего LLM по вашему API-ключу.

Помимо разговорного стека, доступен Octave TTS (создание и клонирование голосов) и Expression Measurement API — измерение выражений в голосе, лице и тексте. Доступны веб-playground, SDK и стриминговый WebSocket-интерфейс. Планы — помесячные с включёнными лимитами и почасово-минутным биллингом за использование (usage-based), отдельная тарификация для EVI 3 и TTS. Версии EVI 1/2 официально выведены из эксплуатации; поддерживается миграция на EVI 3.

  • Speech-to-speech (EVI 3), real-time, WebSocket API
  • Поддержка внешних LLM (передача собственного API-ключа)
  • Octave TTS: генерация, настройка и клонирование голосов
  • Expression Measurement: voice/face/language

Документация сервиса · EVI 3 · Expression Measurement · Цены

Записей не найдено.