Оглавление

Cerebras.ai пишет о новом подходе к созданию безопасных и воспроизводимых сред для работы с кодом, генерируемым искусственным интеллектом. Теперь разработчики могут запускать Cerebras inference внутри Docker-контейнеров, развертываемых с помощью Docker Compose.

Скорость Cerebras встречает безопасность Docker

Cerebras демонстрирует самую быструю в мире скорость вывода ИИ — инструмент генерирует код со скоростью более 2500 токенов в секунду.

График производительности Cerebras Inference, показывающий достижение 3000 транзакций в секунду
Источник: www.cerebras.ai

Практичный способ работы с кодом Cerebras — использование Docker Compose. Этот инструмент упрощает запуск сложных многоконтейнерных приложений, таких как агентские системы, объединяющие циклы агентов, инструменты и вспомогательные сервисы. Одна команда и единый файл конфигурации позволяют запускать все сервисы продукта без зависимости от специфических деталей фреймворка.

Диаграмма интеграции платформы Cerebras и инструмента Docker Compose
Источник: www.cerebras.ai

Разработчики могут сочетать легковесные локальные модели типа Qwen3 4B Q4_K_XL для общения с Cerebras для масштабной генерации в одной установке. Такая структура упрощает балансировку скорости, стоимости и безопасности в повседневной разработке.

Вместе Docker и Cerebras формируют рабочий процесс, который ускоряет разработку, сохраняя среды чистыми и согласованными. Разработчики могут генерировать код с высокой скоростью вывода и выполнять его внутри изолированных контейнеров, которые можно запускать и останавливать по требованию.

Обзор архитектуры мультиагентной системы разработки DevDuck
Источник: www.cerebras.ai

Представляем DevDuck

Компания создала DevDuck для демонстрации практического применения этого подхода. DevDuck — это мультиагентная система на adk-python, использующая генерацию кода Cerebras и исполнение с Docker Compose для оркестрации компонентов.

Система включает трех агентов: локального агента для запуска моделей на устройстве, агента-координатора и агента на основе Cerebras. Эти агенты сотрудничают для генерации и ревью кода, маршрутизируя запросы между собой. Перед исполнением инициализируются Docker-контейнеры для песочницы всего созданного кода, обеспечивая изоляцию и воспроизводимость.

Сочетание сверхбыстрого инференса Cerebras с контейнеризацией Docker — это именно тот тип инженерных решений, который действительно меняет практику разработки. Вместо бесконечных настроек окружения разработчики получают готовую среду «все включено» для экспериментов с ИИ-генерацией кода. Особенно ценно, что это работает не только в идеальных условиях лаборатории, но и в реальных продакшен-средах.

Попробуйте сами: инструкции

DevDuck легко испытать самостоятельно. Сначала убедитесь, что у вас установлен Docker, который можно скачать с официального сайта.

Далее откройте терминал и выполните команды:

git clone https://github.com/shelajev/docker-cerebras-demo

После клонирования репозитория осталось настроить окружение. DevDuck использует две модели: одну локальную и одну модель вывода Cerebras. Для использования системы введите свой API-ключ Cerebras в файл .env, который можно получить на платформе Cerebras.

Осталось только запустить программу:

docker compose up --build

Настройка compose запускает наших агентов и шлюз MCP Docker, который в этом примере управляет инструментами MCP для работы с контейнерами песочницы node.