Deep Mine AI создает новое царство животных
Новый проект от Google DeepMind, использует пару систем искусственного интеллекта, изображения животных и целую массу вычислительной мощности, чтобы смешав все это вместе, получить серию воображаемых животных, придуманных одним из AIs.
Взгляд через исследовательскую работу о проекте—или это откройте Google папку с картинками—скорее всего, вы согласитесь, что результаты представляют собой смесь из впечатляющих и совершенно жуткое. Но жуткий фактор не означает, что проект не должен считаться успешным и шагом вперед для будущего использования ИИ.
От Гана до Биггана Команда проекта состоит из Эндрю Брока, аспиранта Эдинбургского Центра робототехники, и стажера DeepMind, исследователя Джеффа Донахью и Карен Симонян. Они использовали так называемую генеративную состязательную сеть (GAN) для создания образов. В GAN две системы ИИ взаимодействуют в игровой форме.
Один ИИ создает изображения объекта или существа. Человеческий эквивалент будет рисовать изображения, например, собаки, не обязательно зная, как именно выглядит собака. Затем эти изображения показываются второму AI, который уже "накормлен" изображениями собак. Затем второй ИИ сообщает первому, насколько далеки были его усилия от цели.
Первый использует эту информацию для улучшения своих изображений. Оба идут взад и вперед в итеративном процессе, и цель состоит в том, чтобы первый ИИ стал настолько хорош в создании изображений собак, что второй не может отличить свои творения от фактических изображений собак. Команда смогла использовать обширные хранилища вычислительной мощности Google для создания качественных и реалистичных изображений, которые были выше всего, что было раньше.
Отчасти это было достигнуто путем подачи в GAN большего количества изображений, чем обычно. Согласно IFLScience, стандартом является подача в GAN около 64 изображений на объект. В этом случае исследовательская группа загрузила около 2000 изображений на объект в систему, что привело к его прозвищу BigGAN.
Их результаты показали, что подача в систему большего количества изображений и использование массы необработанной компьютерной мощности заметно увеличили точность GAN и способность создавать реалистичные представления предметов, которые он обучался воспроизводить.
"Главное, что нужно этим моделям-не алгоритмические улучшения, а вычислительные. [...] Когда вы увеличиваете емкость модели и увеличиваете количество изображений, которые вы показываете на каждом шаге, вы получаете этот двойной комбинированный эффект”, - сказал Эндрю Брок Fast Company.
Команда использовала 512 единиц обработки тензора Google, ориентированных на искусственный интеллект (TPU), для создания 512-пиксельных изображений. Каждый эксперимент занял от 24 до 48 часов.
Такая вычислительная мощность требует много электричества. Как сказал в Twitter художник и новатор в Библиотеке Конгресса Джер Торп: "хорошая новость заключается в том, что теперь ИИ может дать вам более правдоподобное изображение тарелки спагетти. Плохая новость заключается в том, что он использовал достаточно энергии, чтобы обеспечить Кливленд во второй половине дня”
Торп добавил, что для получения изображений потребуется около 27 000 квадратных футов солнечных панелей, чтобы иметь достаточную мощность.
Однако образы все еще не совершенны. Количество ног на данном существе-один из примеров того, где Бигган, казалось, встречал затруднения. Система была хороша в признании того, что что-то вроде паука имеет много ног, но, казалось, не в состоянии решить, сколько "много" должно было быть. То же самое относится и к собакам, особенно если изображения должны были показывать указанных собак в движении.
Эти жуткие изображения контрастируют с другими представлениями, которые показывают такие реалистичные качества, что человеческому разуму трудно идентифицировать их как подделку.
Будущие варианты использования
Сети GAN были впервые введены в 2014 году, и, учитывая их относительную молодость, исследователи и компании все еще заняты опробованием возможных вариантов использования.
Одно возможное применение—коррекция- более точное оформление изображений. Это не только поможет вашему будущему празднику, но и может быть применено в таких отраслях, как освоение космоса. Команда из Мичиганского университета и Института Макса Планка разработала метод GAN networks для создания изображений из текстовых описаний. В Беркли исследовательская группа использовала GAN для создания интерфейса, который позволяет пользователям изменять форму, размер и дизайн объектов, включая сумочку.
Для тех, кто видел фильм, как Wag the Dog или читал 1984, такие возможности вызывают тревогу. Другими словами, Gan мог бы сделать фэйковые новости более реальными, чем когда-либо прежде.
На данный момент кажется, что, хотя не все сети Gan требуют вычислительной и электрической мощности BigGAN, все еще есть способ достичь этих потенциальных вариантов использования. Однако, есть один вывод из закона Мура, это то, что сегодняшний технический блокпост быстро становится завтрашней второстепенной проблемой по мере развития технологии.