Фейковые изображения всегда были проблемой, но с появлением новых технологий машинного обучения задача стала еще более доступной для любого желающего. Генераторы изображений, такие как Midjourney, Microsoft Designer и DALL-E 3, делают возможным создание реалистичных картинок всего за мгновение. Понятно, как такие изображения могут легко обманывать и вводить в заблуждение массы людей, распространяя дезинформацию. Но есть хотя бы капля надежды: есть несколько стратегий, которые мы можем использовать, чтобы распознать изображения, порожденные искусственным интеллектом.
Как распознать изображение, созданное ИИ
Генераторы изображений ИИ объединяют в себе две передовые технологии: большие языковые модели и модели диффузии. Вероятно, вы уже слышали о больших языковых моделях, таких как GPT-4, которые способны понимать тонкости человеческого языка. С другой стороны, модели диффузии обучены на миллионах изображений и могут воссоздавать реалистичные сцены из случайного шума.
Генераторы изображений ИИ используют обе эти технологии для создания убедительных картинок. Они могут начать с нескольких слов и постепенно формировать реалистичное изображение. Тем не менее, к счастью для нас, этот процесс не идеален, и часто оставляет за собой тонкие признаки, которые мы можем заметить. Вот на что стоит обращать внимание (в произвольном порядке):
1. Анатомические особенности
Модели ИИ обучаются на огромных объемах реальных данных изображений, что помогает им изучать сложные детали окружающей среды. Благодаря этому они могут создавать новые изображения по запросу. Но это не означает, что они способны идеально воспроизводить все мелочи. Особенно это относится к частям тела.
Недавно я наткнулся на картинку, на которой два человека сидели со скрещенными ногами, и что-то в ней показалось мне странным. При ближайшем рассмотрении я обнаружил, что у одного из них была третья нога. В ходе обучения ИИ изучал тысячи людей, но ситуации, когда они сидят так, встречались не так часто. То же самое касается и пальцев. Простые генераторы изображений ИИ часто либо добавляют лишние пальцы, либо упускают детали, такие как суставы и другие анатомические особенности.
Например, посмотрите внимательно на изображение Папы Франциска, созданное искусственным интеллектом. Он держит что-то в руке, но если посмотреть на его пальцы, то становится ясно, что ИИ их как бы «слил» вместе, создавая неестественный облик.
2. Неестественные волосы
Если анатомия проверена, можно перейти к более детальным аспектам, таким как мех и волосы. Ведь волосы бывают разной толщины и текстуры. Для искусственного интеллекта понять, как свет взаимодействует с каждой отдельной прядью и как они реально падают и двигаются, может быть сложной задачей.
Важно обращать внимание на детали причесок, особенно там, где волосы контактируют с другими объектами. Например, генератор изображений Imagine AI от Meta лучше справился с передачей естественного состояния волос на приведенных примерах. В отличие от этого, на изображении DALL-E 3 волосы имеют гладкую текстуру, похожую на одну сплошную массу. Они не обрамляют плечи женщины, и мы ожидали бы увидеть несколько пучков, свободно развевающихся в области шеи.
3. Искаженный или сбойный текст.
Хотя современные инструменты искусственного интеллекта могут обнаруживать и генерировать шаблоны, генераторам изображений трудно имитировать текст. Особенно это заметно при попытке воспроизвести рукописный ввод. Найдите убедительное изображение, созданное искусственным интеллектом, которое содержит много идеально напечатанного текста — это задача не из легких. Еще одним характерным признаком является общее послание, передаваемое текстом. Искусственный интеллект может точно размещать отдельные слова, но пока ему трудно формировать полные предложения.
Первым шагом стоит найти текст, который выглядит размытым или пиксельным, в то время как остальная часть изображения выглядит четкой. После этого внимательно изучите каждый символ на предмет бессмысленных символов или букв. Наконец, спросите себя, имеет ли текст смысл в контексте изображения. Например, если изображение содержит текст на английском языке в азиатском стиле, это может вызвать подозрения.
Посмотрите на изображение выше, где Midjourney пытается сгенерировать текст внизу. Предполагается, что ИИ пытался имитировать водяной знак, который он узнал во время обучения. Плохой результат говорит сам за себя.
4. Тени, освещение и отражения
Если вы когда-либо углублялись в фотографию, то знаете, что освещение сцены может значительно повлиять на окончательный облик изображения. Особенно тени и отражения могут выглядеть по-разному в зависимости от времени суток и источника света.
Искусственный интеллект может испытывать трудности с созданием реалистичных отражений, поэтому стоит обращать внимание на несоответствия в том, как свет отражается от поверхностей, таких как вода или стекло. То же самое относится и к теням. Задайте себе вопросы: все ли объекты на изображении отбрасывают тени в одном направлении, и какой характер имеют тени — мягкие или резкие? Наконец, отличается ли размер или форма тени от объекта, который она представляет?
5. Гладкая или восковая кожа и поверхности.
Хотя в последней версии Midjourney почти не заметны все те недочеты, о которых мы говорили до этого, она все еще имеет проблемы в одном аспекте: текстуре поверхности. Генераторы изображений искусственного интеллекта не в состоянии точно воспроизвести тонкие детали объектов реального мира, особенно в органических материалах, таких как кожа. Что это значит? Получаем изображения, которые выглядят почти как фотографии, но с явными признаками неестественности, такими как восковая кожа и идеально гладкие лица. В конечном итоге результат часто напоминает снимки, сделанные на ранние бюджетные смартфоны с хорошей камерой с включенным режимом улучшения красоты.
Если на изображении изображен человек, обратите внимание на кожу, которая выглядит слишком безупречной, без каких-либо пятен, пор или морщин. Фактически, весь облик человека может выглядеть почти как пластик или воск, что на первый взгляд может показаться странным и натянутым, особенно как только вы начнете это замечать.
6. Фон не в фокусе
Глубина резкости или область, на которую фокусируется изображение, обычно используется в профессиональной фотографии, чтобы привлечь внимание к объекту. Но в некоторых случаях это может выглядеть неестественно. Например, в ранних версиях портретного режима на смартфонах использовалось равномерное размытие заднего плана без учета расстояния или плавного перехода.
Точно так же можно заметить излишне размытый фон на изображениях, созданных искусственным интеллектом. Обычно глубина резкости соответствует естественному градиенту, известному как падение резкости, при котором удаленные объекты постепенно размываются по мере удаления от фокусируемого объекта. Если изображение кажется несогласованным в этом аспекте, то это может быть признаком того, что у вас перед глазами сгенерированное искусственным интеллектом изображение.
7. Бонусный совет: используйте службу обнаружения изображений с помощью искусственного интеллекта.
Если нет явных водяных знаков или отпечатков пальцев, то нам нужно обращаться к компьютерам, чтобы определить, был ли генератор изображений задействован. Просто загрузите изображение в WasItAI или AI or Not, и они помогут определить его подлинность.
Хотя ни один из этих сервисов не гарантирует абсолютную точность в каждом случае, они всё же являются надежным инструментом для проверки, особенно если у вас есть сомнения.
8. Попробуйте обратный поиск изображений
В 2023 году Google представил новый инструмент, который определяет, когда изображение было впервые проиндексировано поисковой системой. Кроме того, он способен обнаруживать варианты одного и того же изображения, так что простое обрезание или редактирование не обойдется ему незамеченным. Чтобы воспользоваться этой функцией, просто разверните изображение в поиске картинок Google и нажмите «Об этом изображении». Иногда потребуется открыть дополнительное меню, обозначенное тремя точками.
Вы также можете загрузить свои фотографии и включить инструмент для поиска потенциальных совпадений. Для этого перейдите на images.google.com, нажмите на значок камеры и загрузите свое изображение. В верхней части экрана появится кнопка «Найти источник изображения». Если Google не может найти совпадений, но изображение связано с известной исторической фигурой или событием, вероятно, оно было создано искусственным интеллектом.