В начале апреля 2023 года российский банк Сбер выпустил нейросеть Kandinsky 2.1 — это генеративная модель, которая создает картинки по описанию. В отличие от западных аналогов, доступ к Kandinsky 2.1 свободный — её бесплатно может попробовать каждый с помощью соответствующего телеграм-бота или на сайте Fusion Brain.
Однако это не единственное отличие от иностранных генеративных моделей. Еще один важный нюанс — Kandinsky 2.1 обучалась на русском языке, а потому более корректно воспринимает запросы на нем, нежели конкуренты. Кроме того, её функционал заключается не только в создании изображений по текстовому описанию. С помощью модели от Сбера можно также смешать два изображения, добавить на картинку детали с помощью текстового описания или и вовсе попросить нейросеть рисовать в режиме бесконечного полотна.
Подобный широкий функционал будет востребован не только у массового потребителя для развлечений, но и у представителей различных, в первую очередь, креативных специальностей. Например, возможности Kandinsky 2.1 обязательно подойдут дизайнерам, маркетологам, писателям — они могут почерпнуть вдохновение из тех красивых артов, которые рисует нейросеть. Впрочем, и сами изображения могут быть задействованы в профессиональной деятельности. К примеру, у издателей или даже в медицине — для иллюстрации обучающего материала для студентов.
Всего модель может рисовать более чем в 10 стилях, основные: artstation, anime и 4K. Также она поддерживает запросы на 101 языке мира, включая русский и английский.
На фоне таких возможностей, а также благодаря бесплатному доступу, аудитория нейросети росла крайне стремительно. Уже через четыре дня после запуска модель от Сбера набрала 1 млн уникальных пользователей. Американскому ChatGPT, например, для той же цели потребовалось пять дней.
Ажиотаж вокруг нейросети не мог остаться незамеченным зарубежными рейтинговыми агентствами. Уже вскоре выяснилось, что Kandinsky 2.1 вошла в топ-5 трендовых мировых репозиториев по версии GitHub.
Наша редакция также решила проверить возможности Kandinsky 2.1. Для этого мы попросили нейросеть сгенерировать картинки по нескольким запросам. Первым был «Ташкент, технологии, закат». Стиль выбрали «4К». Вот, как модель с ним справилась:
Далее решили немного усложнить задачу и попросили Kandinsky 2.1 нарисовать гуманоидного робота в национальной одежде Узбекистана. Стиль — «artstation».
В целом можно отметить, что модель действительно понимает пользователя и выдает изображения, которые соответствуют запросу. Примечательно, что итоговые картинки — исключительно в высоком качестве.
Не секрет, что искусственный интеллект — это крайне перспективная сфера, развитие которой важно не только в масштабах страны и даже региона, но в масштабах всего мира. Вот почему важно, что один из лидеров в этой области находится совсем рядом, в России. Это дает дополнительную мотивацию нашим, отечественным разработчикам, что уже позитивно сказывается на ИИ-технологиях в Узбекистане.