Архивы Qwen3 30B A3B

Новый метод M-GRPO позволяет обучать команды ИИ-агентов с четким разделением ролей, улучшая координацию в сложных многоэтапных задачах на 10%.

Qwen3 30B A3B