Разработка

Новости о нейросетях для программирование с AI, кодинг-ассистенты, AI для разработчиков, инструменты и фреймворки

OpenAI нанимает узких специалистов

OpenAI нанимает узких специалистов для обучения ChatGPT тонкостям фермерства и пилотирования

OpenAI привлекает тысячи экспертов для обучения ChatGPT профессиональным навыкам в сельском хозяйстве, медицине и авиации.

методика полуформальное рассуждение

Новая методика промптинга «полуформальное рассуждение» повысила точность ИИ-анализа кода до 93%

Исследователи из Meta* представили новую технику работы с искусственным интеллектом под названием «полуформальное рассуждение», которая позволяет большим языковым моделям проводить глубокий аудит кода без его реального запуска. Этот метод значительно повышает точность проверки патчей, сокращая при этом инфраструктурные затраты на тестирование.

Codex работает поверх Claude code

В ассистенте Codex от OpenAI исправлены две уязвимости, а его плагин теперь работает с Claude Code

OpenAI представила плагин Codex, который позволяет запускать возможности их кодинг-ассистента внутри конкурирующей среды Claude Code. Это решение упрощает рабочий процесс разработчиков, предлагая стандартную проверку кода, глубокий «состязательный анализ» и возможность передачи фоновых задач модели Codex.

Контекстный ИИ фундамент для агентов

Контекстный ИИ в корпоративном сегменте может стать фундаментом для перехода к агентам

Анализ перехода от простых корреляционных моделей ИИ к контекстно-зависимым системам и роли качественных данных в развитии автономных агентов.

Google представила алгоритм TurboQuant

Google представила алгоритм TurboQuant, сокращающий объем KV-кэша без потери точности

Исследователи Google разработали TurboQuant — новый алгоритм квантования, который радикально сокращает объем KV-кэша и ускоряет работу языковых моделей.

бенчмарк BullshitBench

Новый бенчмарк BullshitBench проверяет способность ИИ распознавать абсурдные задачи

Бенчмарк BullshitBench выявил неспособность ведущих ИИ-моделей распознавать абсурдные и логически противоречивые запросы, заставляя их галлюцинировать.