Содержание статьи
Как пользоваться нейросетью Google Gemini и получить к ней доступ в России
Что умеет Gemini 1.5 Pro
У Gemini есть большое ограничение: она временно не может создавать изображения людей. Его ввели после того, как пользователи принялись генерировать исторических личностей, например отцов-основателей США, а нейросеть выдавала темнокожих людей. Это привело к обвинениям, что в Gemini вообще невозможно сгенерировать белых, даже когда это обусловлено контекстом.
🎓 В Google также предлагают использовать нейросеть для самообразования. Я попросила объяснить разницу между временами в английском языке Past Perfect и Past Perfect Continuous. Gemini подробно рассказала правило, привела примеры и даже нарисовала табличку, которую можно скопировать себе в гугл-документ .
Распознавать изображения. Gemini может искать по картинкам в интернете и описывать фотографии, которые вы отправляете в чат. С простыми задачами справляется, а вот более специфические, например найти тигра на картинке с несколькими животными, ему не под силу.
Как сгенерировать картинку и текст одновременно. Нейросеть мультимодальна — то есть может обрабатывать текст и изображения в рамках одного запроса. Это означает, что Gemini можно попросить сочинить историю и сгенерировать иллюстрации к ней
Google обещает, что разницу можно заметить при решении более сложных задач: составлении пошаговых инструкций, учебе, генерации креативных постов. Я сгенерировала HTML-код , объяснение правил английского языка и контент-план для кулинарного канала. Отличия от базовой версии Gemini есть, но они минимальные: Advanced просто рассказывает чуть подробнее.
Сервис официально работает в 180 странах, среди которых нет России, поэтому в обоих случаях — через сайт или приложение — нужно заходить с иностранным IP-адресом . Иначе появится заглушка с надписью «Gemini пока не поддерживается в вашей стране. Мы сообщим, когда это изменится».
Вы можете сформулировать запрос на русском, попросить нейросеть его перевести на английский и потом отправить этот же текст в чат. Если Gemini поняла ваш запрос, через несколько секунд она предложит одно или несколько изображений на выбор. От чего зависит количество — неизвестно.
Нейросеть также доступна в приложении Google для iOS. Чтобы перейти к Gemini, на главном экране нажмите на иконку с синей звездой — откроется чат с ботом. Будьте внимательны: отдельного приложения Gemini на iOS нет. Но в App Store множество сервисов с таким же названием выдают себя за нейросеть.
Что в итоге
Как исправить картинку. Если результат не понравился, можно создать новые варианты с помощью кнопки «Сгенерировать еще». Нейросеть выдаст еще две картинки по тому же самому запросу. Нажимать на кнопку можно неограниченное количество раз — по крайней мере, после десяти перегенераций до лимита я не дошла.
Генерировать тексты. Нейросеть отвечает на простые вопросы и объясняет сложные термины на уровне бесплатной версии ChatGPT. У Gemini также есть доступ к актуальной информации, поэтому она может выходить в интернет и давать ссылки на источники.
Кратко пересказывать. Gemini может прочитать текст по ссылке и проанализировать его. Со времен Bard функция стала работать лучше. Нейросеть действительно пытается пересказать текст, а не выдает случайные факты по теме и не отказывается выполнять задание вообще, как это было раньше.
Gemini Advanced — продвинутая версия Gemini, доступная по платной подписке и работающая на основе модели 1.0 Ultra . После покупки подписки чат автоматически изменит тему на черную, но в настройках можно вернуть белую. Переключаться между бесплатной и платной версиями можно с помощью кнопки Gemini / Gemini Advanced.
Обрабатывать большой объем данных. Я загрузила в чат pdf-файл с книгой «Гарри Поттер и философский камень» и попросила нейросеть кратко пересказать ее. Модель выдала верный ответ на английском языке, я попросила перевести его на русский. Gemini 1.5 Pro также ответила без ошибок на два вопроса по содержанию книги.
🤑 Платный апгрейд — Gemini 1.0 Ultra. Может то же самое, что и Gemini 1.0 Pro , но еще лучше — по крайней мере, так говорят в Google. На этой модели работает платный чат-бот Gemini Advanced. Он должен гораздо лучше справляться со сложными запросами: писать код, рассуждать, выполнять детальные инструкции и помогать в креативных задачах.
Как создать первую картинку. На первый взгляд непонятно, что Gemini умеет генерировать изображения, потому что на главном экране нет соответствующей подсказки. Если ввести запрос на русском, нейросеть ответит, что не может помочь, потому что пока не умеет создавать изображения. Но это неправда. Она поймет запрос, но только на английском языке.
😌 Для повседневных задач — Gemini 1.0 Pro . На ее основе работает чат-бот Gemini, ранее известный как Bard. Он может написать инструкцию по рисованию акварелью, объяснить суть теории относительности, сгенерировать пост для соцсетей с рецептами шоколадных десертов, дать определение когнитивной нейронауке, помочь с кодом, сценарием для видео или планом для статьи.