Нейросети-творцы: друг, враг или так?
Уже не первый месяц интернет потрясают всё новые и новые разработки в области искусственного интеллекта. Обработка и генерация фото, иллюстраций и даже музыки. Нейросети постоянно учатся, а темп их развития растёт в геометрической прогрессии. Но далеко не все этому рады. Неужели противостояние машин и людей уже началось? Об успехах, конфликтах и перспективах ИИ поговорим сегодня.
Вдохновение по-нейронски
Как и во многих технических разработках, для алгоритмов работы искусственного интеллекта учёные взяли за основу саму природу. Всё начинается с огромного потока текста, собранного на просторах сети. К нему в придачу — миллионы изображений, содержащих ключевые понятия. Затем описательные слова группируют в логическую паутину. На основе смежности смысла строится ассоциативный ряд программы, прямо как у нас в голове. Рядом, например, с жирафом будут «саванны», «Африка», другие животные и т.д.
Те, кто уже успел поиграться с нейросетями, знают: ввод данных похож на запрос в Гугле. Чёткое описание или даже просто отдельные слова-теги. ИИ делает «набросок» из контрастных, «мыльных» пятен. Затем по пикселю детализирует изображение до тех пор, пока не достигнет уровня «референсов».
«Они поглощают множество примеров, выдавая на их основе нечто новое, — говорит нейробиолог и профессор Стэндфордского университета Дэвид Иглман, — Прямо как творческие люди, которые познают мир, «миксуют» увиденное и создают своё». Однако, по мнению учёного, весомое отличие заключается в том, что алгоритму нет разницы, что «творить». Они не «пропускают через себя», не вкладывают в работы никакого подтекста, глубинных смыслов.
Такие картины и музыкальные произведения не наполнены эмоциями, переживаниями автора. Оно и понятно. Пока эмоции — это исключительно наша прерогатива. «Чтобы фильтровать на основе человеческих критериев, сначала нужно понять, что значит быть человеком», — считает Иглман.
Первый «бум»
Изучение и развитие искусственного интеллекта ведётся не первый десяток лет. Однако настоящую шумиху в соцсетях подняла Dall-E — нейросеть, созданная компанией Илона Маска OpenAI. В название, кажется, вложили отсылку к главному герою мультфильма Wall-E и к художнику-сюрреалисту Сальвадору Дали. Основу Dall-E представлял текстовый генератор GPT-3, который компания представила в 2020 году. Уже через год разработчики объединили текст и изображения, запустив первый подобный проект.
По словам авторов, программа, на их удивление, научилась немалому: создание антропоморфных версий животных и объектов, правдоподобное объединение несвязанных явлений, «рендеринг» текста и обработка изображений в разных стилях. Соцсети «завалили» шуточные иллюстрации, а также вариации картин известных художников.
Только дай волю
Однако доступ обычных пользователей к Dall-E довольно ограничен. Для ознакомления вышла упрощённая версия Dall-E Mini. Как развлечение в самый раз, но для детальных экспериментов, конечно, не подойдёт. Именно поэтому на её фоне ещё большой популярностью обзавелась Midjourney.
«Пощупать» разработку можно в официальном сообществе одноимённой компании в Discord. Авторы подключили к ряду открытых чатов «бота», с помощью которого участники могут ввести свой запрос и получить изображение. Достаточно вставить команду «/imagine» и сформулировать свою идею на английском.
В режиме реального времени программа создаст коллаж из четырёх картинок. Наиболее удачную можно скачать бесплатно, но только 25 штук для одного пользователя. Тем не менее этого хватило, чтобы «скрестить» «Гарри Поттера» с аниме Хаяо Миядзаки, отправить «Папиных дочек» в мрачный мир Bloodborne и т.д.
Взгляд в будущее
Ещё одно место под солнцем завоевала StableDiffusion. В то время как другие нейросети впечатляли своим видением арт-эволюции, она наглядно показала эволюцию жизни на земле. Бельгийский цифровой художник Ксандер Стенбрюгге с помощью программы создал видеоролик, набравший на YouTube около 200 тысяч просмотров.
Из бескрайних космических пейзажей формируется рельеф нашей планеты. Зарождаются первые микроорганизмы, морские ящеры, огромные динозавры, грызуны и наконец человекоподобные обезьяны. Затем образы стремительно набирают обороты: пещерные люди, общины, города, мегаполисы и снова космические просторы и, видимо, роботы, заменившие человека. «ИИ точно что-то знает», — пишут в комментариях.
Мы их или они нас
Однако подобные успехи искусственного интеллекта не остались незамеченными «живыми» художниками. На прошедший год пришёлся наплыв негативных прогнозов относительно развития технологий, онлайн-протест и даже иск в суд.
Одну из крупнейших профессиональных платформ ArtStation заполнили публикации с перечёркнутым знаком «ИИ», пишет «Код Дурова». Подписи гласили: «Нет изображениям, созданным искусственным интеллектом». Так своё недовольство высказали авторы, не поддерживающие использование сгенерированных изображений наравне с «реальными». «Мне нравится играться с Midjourney, как и любому другому, но размещать что-то, что было создано по текстовому описанию рядом с работами, на которые ушли сотни часов и годы опыта, крайне неуважительно», — пишет один из художников.
А автор кто?
Новизна технологии становится поводом не только для морально-этических споров, но и вызывает вопросы на законодательном уровне. Обычно разработчики ссылаются на добросовестное использование контента, но каждый подобный случай пока не имеет универсального решения. Так в правомерности деятельности ИИ усомнились трое художников, организовавших коллективный иск.
Сара Андерсен, Келли МакКернан и Карла Ортис обвинили Midjourney, StableDiffusion и платформу для публикаций портфолио DeviantArt. Последняя недавно создала собственный генератор с искусственным интеллектом DreamUp. Об этой ситуации написало издание The Verge. По мнению истцов, нейросети нарушают закон, поскольку обучены на базе изображений, взятых из интернета без согласия самих авторов иллюстраций. «Люди вносят свою человечность в искусство, ведь искусство — глубоко личное. ИИ просто стёр из него человечность, сведя работу всей моей жизни к алгоритму», — рассказывает художница.
Держимся подальше
Обходит стороной результаты работы ИИ-авторов и сервис Getty Images. Банк изображений запретил публикацию и продажу работ, созданных с помощью Dall-E, Midjourney и других нейросетей. К подобному решению пришли также сервисы Newgrounds, PurplePort и FurAffinity, пишет The Verge.
Генеральный директор Getty Images Крейг Питерс рассказал изданию, что запрет был вызван опасениями по поводу законности контента и желанием защитить клиентов сайта. Но на практике Питерс признаётся, что контролировать поток будет непросто. «Getty Images полагается на пользователей, чтобы идентифицировать такие изображения и сообщать о них». Но и о поиске новых решений генеральный директор не забывает. Один из главных конкурентов компании, Shutterstock, тоже ограничил поиск контента с искусственным интеллектом, но ещё не ввёл конкретных правил.
Мир, дружба, жвачка
Пока одни выступают категорически против, другие смело задумываются о «сотрудничестве» с нейросетями (например, мы). Англоязычная редакция «Кода Дурова» поговорила с Покрасом Лампасом, чтобы узнать его мнение о перспективах нейросетей в искусстве. Художник уверен, что искусственный интеллект будет работать вместе с авторами над «творческими задачами, но не заменит их и оригинальные работы». Он солидарен с теми, кто считает происходящее нарушением законов об авторском праве. Однако выступает за конструктивное решение конфликта, а не полную отмену технологии.
Объединение для более эффективной работы вполне возможно, поскольку искусственный интеллект готов «делиться». Алгоритмы могут брать на себя механические, повторяющиеся процессы, которые не задействуют творческое начало. Например, одна из утилит на базе ИИ отлично справляется с градиентной заливкой рисунков в несколько кликов мыши. Особенно это актуально для иллюстраторов японских комиксов — манги, которую часто анимируют в полноценный сериал. Так художники останутся при своём и получат в «подмастерья» автоматизированных помощников.
Таисия Сариева
Фото: Dall-E, StableDiffusion, Midjourney, Artbreeder