Hunyuan

Hunyuan — комплексная экосистема AI-моделей от Tencent, включающая мощные LLM, системы генерации видео, 3D-моделей и изображений. Hunyuan охватывает несколько продуктов: Hunyuan-Large (52B параметров с MoE архитектурой, поддержка 256K контекста), Hunyuan Video (13B параметров, генерация видео до 16 секунд), Hunyuan 3D (генерация 3D-моделей из текста и изображений), Hunyuan Image 3.0 (генерация высокачественных изображений) и HunyuanVideo-Avatar (генерация видео с аватарами, управляемое аудио и эмоциями).

Hunyuan-Large демонстрирует превосходную производительность на бенчмарках MMLU (89.9%), CMMLU (90.4%) и других, превосходя Llama 3.1 405B и DeepSeek V2.5. Платформа предоставляет открытый исходный код, поддержку мультиязычности (китайский и английский) и интеграцию с популярными фреймворками (Hugging Face, GitHub).

Особенности:

  • Hunyuan-Large: 52B параметров MoE LLM, контекст до 256K, SOTA производительность на MMLU/CMMLU.
  • Hunyuan Video: генерация видео с 13B параметров, до 16 секунд, высокое качество и стабильность.
  • Hunyuan 3D/3.0: текст-в-3D и изображение-в-3D, PBR-текстуры, быстрая генерация (10-25 сек).
  • Hunyuan Image 3.0: высокого разрешения текст-в-изображение, двойной кодировщик, RLHF оптимизация.
  • HunyuanVideo-Avatar: аудио-управляемая генерация видео аватаров, контроль эмоций, мультисимвольная поддержка.
  • KV Cache Compression: оптимизация памяти и пропускной способности через GQA и CLA.
  • Открытый исходный код и доступность на Hugging Face, GitHub и API-интеграция.
  • Поддержка коммерческого использования и интеграции в инструменты (Blender, Unity, Unreal Engine).

Ссылки:

Новости

Мультимодальная модель Tencent Hunyuan-Large-Vision возглавила рейтинг китайских ИИ

Модель Hunyuan-Large-Vision от Tencent возглавила рейтинг китайских мультимодальных ИИ, уступая лишь GPT-5 и Gemini 2.5 Pro. При 389 млрд параметров она доступна только через облачный API.