Вышла FLUX.2 — open source-конкурент Nano Banana
1 мин
11K
Искусственный интеллектМашинное обучение*
Black Forest Labs представила семейство моделей FLUX.2, которое обеспечивает генерацию изображений на уровне Google Nano Banana, но включает версию с открытыми весами. Новинка основана на связке двух моделей: за глубокое понимание контекста отвечает Vision-Language модель Mistral-3 на 24 млрд параметров, которая сначала выстраивает логически непротиворечивую сцену, а уже затем передает управление трансформеру с архитектурой Rectified Flow для финальной отрисовки.
Такая структура позволяет модели реально «понимать» физику света, перспективу и пространственные связи объектов. Модель принимает до 10 входных изображений, что позволяет удерживать лицо персонажа, стиль бренда или дизайн товара неизменными в десятках генераций без необходимости сложной настройки. Поддерживается разрешение до 4 мегапиксилей, разные соотношения сторон, а также корректное отображение текста и элементов интерфейса.
Линейка сегментирована следующим образом: самые мощные версии [pro] и [flex], а для локального запуска предназначена FLUX.2 [dev]. Все модели обходят конкурентов в лице Seed Dream 4 и Nano Banana и лишь немного уступают Nano Banana Pro при меньшей цене генерации.
Полная версия FLUX.2 [dev] насчитывает 32 миллиарда параметров, и в стоковом состоянии для ее запуска требуется около 90 ГБ VRAM. Хорошая новость в том, что NVIDIA совместно с BFL уже выпустили оптимизированные FP8-квантизации, снижающие потребление памяти примерно на 40%. Это делает локальный запуск FLUX.2 [dev] реальностью на топовых картах RTX 4090 и 5090, а поддержка модели уже внедряется в свежие обновления ComfyUI и Diffusers.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.



Black Forest Labs
Ответить с цитированием



