Нейросеть Kandinsky 2.1

Новая генеративная модель Сбера Kandinsky 2.1, как сообщает портал IT Week, позволяет генерировать изображения по их текстовому описанию на естественном языке. Она умеет смешивать рисунки, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Модель понимает запросы на 101 языке (включая русский и английский) и подстраивается под выбранный стиль.

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Новая модель Kandinsky 2.1 унаследовала веса предыдущей версии, обученной на 1 млрд пар «текст — изображение», и была дополнительно обучена на 170 млн пар «текст — изображение» высокого разрешения. Затем она дообучалась на отдельно собранном датасете из 2 млн пар качественных изображений. В данный сет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей.

Продукт усовершенствован за счёт новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0. Кроме того, Kandinsky 2.1 использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подаёт его на вход основной генеративной модели.

Ряд технических подробностей о том, как работает нейросеть представлен на Хабре. Мы же со своей стороны продемонстрируем художественные навыки Kandinsky 2.1. Чебурашка в стиле Малевича выглядит так:

Да, такую Чебурашку нарисовал искусственный интеллект. Надеюсь, после увиденного вам не приснятся кошмары.

И еще несколько рисунков, сгенерированных на портале Fusion Brain. Впечатляет…

Loading

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x