Shawn Shan признан одним из Инноваторов до 35 лет 2024 года по версии MIT Technology Review.
Когда в начале 2022 года на рынок вышли модели генерации изображений, такие как DALL-E 2, Midjourney и Stable Diffusion, художники начали замечать странные сходства между изображениями, сгенерированными ИИ, и их собственными работами. Многие обнаружили, что их работы были скопированы в огромные наборы данных и использованы для обучения ИИ, который затем создавал подделки в их стиле. В результате многие потеряли заказы, так как потенциальные клиенты начали использовать ИИ для создания изображений, вместо того чтобы нанимать художников. Некоторые художники были вынуждены использовать ИИ сами, что привело к снижению их гонораров.
Теперь художники сражаются за свои права, и одним из главных защитников стал Шон Шан, 26-летний аспирант факультета компьютерных наук Чикагского университета и Инноватор года 2024 по версии MIT Technology Review.
Шан начал заниматься вопросами безопасности и конфиденциальности ИИ еще в студенческие годы и участвовал в проекте создания Fawkes, инструмента для защиты лиц от технологий распознавания. Однако именно общение с художниками, пострадавшими от бума генеративного ИИ, привело его в центр одной из самых крупных битв в этой области. Вскоре после того, как он узнал о последствиях для художников, Шан и его наставники, Бен Чжао и Хизер Женг, решили создать инструмент для помощи. Они собрали отзывы более тысячи художников, чтобы понять, что им нужно и как они будут использовать защитные технологии.
Шан разработал алгоритм для Glaze, инструмента, который позволяет художникам скрывать свой стиль от имитации ИИ. Glaze появился в начале 2023 года, а в октябре того же года Шан и его команда представили еще один инструмент, Nightshade. Этот инструмент добавляет невидимый слой «яда» к изображениям, что мешает моделям генерации изображений включать эти изображения в свои наборы данных. Если в обучающие данные модели ИИ попадет достаточно «яда», это может навсегда сломать модели и сделать их выходы непредсказуемыми. Оба алгоритма работают, добавляя невидимые изменения в пиксели изображений, что разрушает интерпретацию моделей машинного обучения.
Реакция на Glaze была «ошеломляющей и напряженной», по словам Шана. Команда столкнулась с негативной реакцией сторонников генеративного ИИ в социальных сетях и несколько раз проект пытались взломать.
Однако художники были в восторге. Glaze был скачан почти 3,5 миллиона раз, а Nightshade — более 700 000 раз. Инструмент также был интегрирован в новую популярную платформу для искусства Cara, что позволяет художникам встраивать его защиту в свои работы при загрузке изображений. Glaze получил награду за отличную статью и приз Интернет-защиты на симпозиуме Usenix Security, одной из ведущих конференций по компьютерной безопасности.
Как отмечает художник Карла Ортиз, которая сотрудничала с Шаном и его командой по созданию Glaze и является участником коллективного иска против компаний, использующих генеративный ИИ, работа Шана позволила художникам снова быть творческими в интернете.
«Они делают это, потому что страстно любят сообщество, которое было обмануто и эксплуатировано, и искренне в это вовлечены», — говорит Ортиз.
По словам Чжао, Шан был первым, кто понял, какие виды защиты нужны художникам, и осознал, что работа, которую они выполняли вместе над Fawkes, может помочь создать Glaze. Чжао описывает технические способности Шана как одни из самых сильных, которые он когда-либо видел, но то, что действительно отличает его, — это его способность связывать дисциплины. «Эти вещи действительно нельзя научить», — добавляет Чжао.
Шан заявляет, что хочет изменить баланс сил от крупных корпораций к людям.
«Сейчас мощности ИИ находятся в руках частных компаний, их задача — не защищать людей и общество, а делать акционеров счастливыми», — говорит он. — «Я стремлюсь показать, что компании, занимающиеся ИИ, могут сотрудничать с художниками и помогать им извлекать выгоду от ИИ или предоставлять возможность отказаться. Некоторые компании уже изучают, как они могут использовать инструменты для защиты своей интеллектуальной собственности.»
В будущем Шан планирует создавать инструменты для проверки моделей ИИ регуляторами и обеспечения соблюдения законов. Он также хочет развивать Glaze и Nightshade, чтобы их можно было применять в других отраслях, таких как игры, музыка или журналистика. «Я буду заниматься этим проектом всю жизнь», — утверждает он.
Посмотрите интервью с Шаном о его ближайших планах в последнем разговоре с Эми Нордрум, исполнительным редактором MIT Technology Review.
Эта история была обновлена.