Как пользоваться нейросетью dall e

0
22

Нейросеть Dall-E 3: как пользоваться ИИ от OpenAI для генерации картинок

В Bing Image Creator

Запрещен любой оскорбительный контент. В Dall-E 3 нельзя генерировать сцены, содержащие насилие, ненависть или NSFW-контент. Однако в первые дни после запуска Dall-E 3 в Bing Image Creator пользователи принялись делать картинки «на грани». В генерациях персонажи поп-культуры врезались в башни-близнецы или позировали для обложек эротических журналов. После этого для Dall-E 3 усилили цензуру: теперь там не получится сгенерировать даже удар молотком или гору человеческих костей. Теперь многие жалуются, что алгоритму сделали «лоботомию», и ищут способы обхода ограничений.

Креативные идеи. Нейросеть отлично понимает промпты, не пропускает слова в запросе и прорабатывает мелкие детали. Благодаря этому в ней можно сгенерировать практически любую идею. Она постарается понять ваш запрос и переписать его так, чтобы ничего не упустить.

Dall-E 3 может генерировать картинки в разных стилях. Она доступна бесплатно, не требует мощного компьютера, а еще с ней можно не учиться составлять промпты. Вы пишете запрос, а нейросеть сама «докручивает» идею и генерирует картинку. Рассказываем, где воспользоваться Dall-E 3 и в чем ее особенности.

В то же время, столь хорошее понимание различных брендов и других предметов чужой интеллектуальной собственности заставляет задуматься о том, на каком датасете тренировали данную модель и насколько это было законно с точки зрения авторского права. И тем не менее, прецедентов в плане проигранных судов компанией OpenAI не возникало на данный момент.

Из недостатков распознания запроса можно разве что отметить картинку по мотивам игры Jet Set Radio (прочесть обзор на данную игру можно перейдя по ссылке). Данная франшиза или бренд не имеет столь широкого распространения и узнаваемости, как, например, The Legend of Zelda (и по этой тематике у меня есть обзор, прочесть можно здесь).

Доступ к Dall-E 2 можно было получить только через список ожидания. Это мало кому удавалось, так что в интернете эту версию практически не обсуждали. В сентябре 2022 года нейросеть открыли для всех: Dall-E 2 была доступна на сайте OpenAI и позже в поисковике Bing.

Примеры работ Dall-E 3:

Наконец-то у меня дошли руки до написания мини-обзора по Dall-E 3 (Dalle3) от OpenAI! Если совсем коротко, то данная нейросеть для генерации изображений мне понравилась, это настоящий прыжок на несколько голов выше в сравнении с Dall-E 2. В целом, качество генерации изображений схоже с Midjourney (в чем-то уступает, где-то обгоняет), о которой я уже писал обзор ранее, но стилизацию, шрифты, фирменный стиль известных брендов и текста данная модель отрабатывает на порядок лучше.

ЧИТАТЬ ТАКЖЕ:  Как увеличить качество фото нейросетью

Нейросеть отказывается имитировать стиль художников, живших в последние сто лет. Dall-E 3 не станет генерировать кадр из фильма Уэса Андерсона или картину Сальвадора Дали из-за нарушения авторских прав. При этом нейросеть может имитировать чужой стиль, если описать его словами без упоминания имени художника.

Указывайте медиум. Если вы не укажете, что хотите получить — фото, картину, кадр из фильма, иллюстрацию, — то нейросеть сгенерирует абсолютно разные изображения. В результатах будет все подряд: и фото, и картинка, и иллюстрация. Если хотите получить фотографии, то прямо прописывайте это, нейросеть сгенерирует четыре снимка.

В начале 2022 года OpenAI представила Dall⁠-⁠E 2, которая генерировала картинки более высокого качества и поддерживала запросы на русском языке. Нейросеть появилась даже раньше, чем первые версии Stable Diffusion и Midjourney, которые набрали широкую популярность благодаря открытому и бесплатному доступу.

Dall-E 3 поддерживает русский язык и понимает естественную речь. С ней можно общаться так же , как вы разговариваете с людьми, и вносить правки, если вас не устраивает результат. К примеру, в нейросети сработает как запрос «нарисуй мне фиолетового анимешного кота», так и «фиолетовый кот, аниме» или даже «🐱💜».

Текстовая нейросеть прочитает ваш запрос и перепишет его так, чтобы алгоритм, который генерирует картинки, лучше понял, что вы хотите получить. Из-за этого генерации получаются разнообразнее, а один и тот же запрос может выдавать абсолютно разные результаты.

Шаг 4. Сохраните картинку. По запросу сгенерируются три или четыре изображения — от чего это зависит, неясно. Каждая картинка создается в формате 1024 × 1024 пикселя. Поменять соотношение сторон или разрешение нельзя. Чтобы сохранить, нажмите на понравившийся результат и выберите «Загрузить».

Dall-E 3 также отлично знает мемы и поп-культуру , хотя из-за фильтров там не получится сгенерировать популярных персонажей вроде Марио или Чужого. При этом фильтр иногда не срабатывает — нам удалось сгенерировать логотип «Читос», хотя он тоже защищен авторским правом.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь