Содержание статьи
Как создавать собственные картинки на iPhone с помощью нейросети Apple Intelligence
Нейросеть на Айфоне
Помните, что Айфоны для рынка Китая и ЕС Apple Intelligence не поддерживают из-за особенностей законодательства. Так что если в вашем iPhone вместо пункта “Apple Intelligence & Siri” есть только Siri, то ничего с этим сделать пока что не получится. Активация Apple Intelligence проходит примерно в течение часа, поэтому не ждите, что вашу заявку одобрят за пять минут.
Кто пропустил, Stable Diffusion (SD) – лидирующая и самая продвинутая полностью бесплатная нейросеть, способная работать без интернета на современных устройствах. Чаще всего её используют для создания изображений. Согласен, что этим сегодня сложно удивить, особенно при доступности всяческих Имаджинариумов, популяризации Midjourney и ещё десятка аналогов от других компаний.
Скармливаете Image Playground фотку, которая будет считаться точкой отсчета, и дополняете ее текстовыми атрибутами. Например, добавить улыбку и другие элементы. На выходе получаете прикольное изображение, которое можно использовать по вашему усмотрению. Кстати, вы не ограничены только своими фотографиями. Можно загрузить в Image Playground изображение какой-нибудь достопримечательности, наложить какую-нибудь тему из предложенных, и на выходе получите картинку, основанную на первоначальном фото.
Думаю, что на M2 Max или M3 Max получится добиться 7-8 секунд. Если вам это кажется медленным, напомню: изображение генерируется вашим устройством, а не супер-пупер дорогими серверами в интернете. Поэтому это без преувеличения крутой результат, который останется вашим навсегда. А метод будет работать вечно, даже если завтра все онлайн-сервисы в мире закроются (или введут платные подписки, лимиты и прочие условия использования).
Главное преимущество SD по сравнению с остальными заключается в возможности 100% локального использования. В случае со всеми другими способами вы арендуете чьи-то вычислительные мощности в сети и имеете ограниченный контроль над ними, расплачиваясь либо личными данными, либо деньгами (и личными данными). А с SD вы можете скачать всё необходимое разом и создавать изображения полностью на своём девайсе. Никакого интернета, запросов на сервера, сливов данных непонятно куда, помесячной оплаты и тому подобных ограничений.
Самый простой способ попробовать SDXL Turbo – установить программу Draw Things. Это лучшее приложение для локальной (без серверов и интернета) генерации изображений на мощностях вашего устройства Apple. У него нет ни одного аналога, а разработчик принципиально не просит за это денег и не добавляет никакой монетизации.
Нейросеть рисует по словам
После того как доступ будет открыт в Image Playground, вы можете создавать различные картинки, и здесь все зависит исключительно от вашей фантазии. В нижней части экрана отображается строка для ввода текста. Именно в нее и вы и будете вводить текстовый запрос для того, чтобы нейросеть начала рисовать. Самое крутое состоит в том, что если вы создаете запрос с несколькими составными частями, например хотите нарисовать красное надкусанное яблоко с зеленым листом в футуристичном здании, то система разобьет его на отдельные детали, каждую из которых вы можете отдельно выключить и посмотреть, как изменится изображение.
Новая версия SD, SDXL Turbo, многократно ускоряет процесс генерации картинок в высоком качестве. Вместо 20-40 так называемых «шагов» (steps) теперь достаточно 1, максимум 4 шага. Качество и точность при этом не сильно хуже, чем на обычном SDXL, просто скорость намного выше.
Apple продолжает постепенное развертывание нейросети Apple Intelligence. Все заявленные на WWDC 2024 возможности будут более-менее равномерно распределены между различными версиями iOS 18. Так, в iOS 18.1 появилась возможность работать с текстом на английском языке, а в iOS 18.2 вы сможете создавать собственные изображения по текстовому запросу. Достаточно лишь описать словами, что вы хотите увидеть, и ваш смартфон создаст нужную картинку.
Естественно, как и любая нейросеть, которая рисует по словам, Image Playground не обходится без фейлов. Например, у нее стабильно возникают трудности с надписями по типу дорожных указателей и различных баннеров. Обратите внимание на еще один очень важный момент. Если вы хотите получить изображение на основе вашей фотографии или просто по текстовому запросу, то максимум, на что вы можете рассчитывать, это портретная картинка, на которой не будет нижней части тела.
Неделю назад создатели бесплатной нейросети Stable Diffusion выпустили её многократно ускоренную версию – SDXL Turbo. На быстрых компьютерах с мощной видеокартой она позволяет генерировать высококачественные изображения с той же скоростью, как вы пишете запрос – то есть практически в реальном времени, за считанные секунды.
Возьмём программу Draw Things для iOS и macOS. В ней генерация изображения через SDXL (не Tubro) в 1024×1024 на iPad с процессором M1 занимает от 65 до 100 секунд. С учётом всех факторов, от разрешения картинки до мощности железа, это очень хороший результат. Был.