Содержание статьи
Стратегии по промтингу: как эффективно ставить задачи ИИ
Проблема 1: ИИ «эксплуатирует» человека, а не наоборот
Второе препятствие на пути к успешному применению ChatGPT — мы пытаемся ставить чат-боту задачи «в лоб». Нам сказали, что ChatGPT может отвечать на вопросы и создавать / улучшать / переводить / резюмировать тексты… и именно этот шаблон использования AI мы пытаемся «натянуть» на все наши потребности. Тогда как интеллектуальный чат-бот может задавать вопросы нам, формулировать требования к задаче вместе с нами, критиковать свои же тексты вместо нас и многое другое.
Давайте приведем примеры для каждой части формулы. Образ результата – это тот вид, в котором вы хотите получить ответ: скульптура, фото, картина. Субъект – это основной объект, что мы рисуем. Например, собаку. В стиле какого художника нарисовать – можно писать как нескольких, так и одного. Большинство моделей указывают, каких художников они могут реплицировать. Например, Пикассо. Далее идет описание деталей, это самая большая часть. Например, не просто собака, а корги на берегу моря жмурится на фоне закатного солнца, снято на пленку. Последняя часть – это выбор ресурса, где выкладываются фотографии. Таких ресурсов очень много, у них у всех прослеживается своя стилистика. Поэтому если вы знаете, где бы могла быть размещена нужная вам фотография, то можете здесь указать «trending on» и название ресурса.
Получается, что в таких случаях ChatGPT выполняет интересную творческую работу, а человек, наоборот, рутинную… Причем человек тратит на это примерно столько же времени, сколько раньше. Тогда как цель ИИ должна быть обратной — не только сократить затраты времени, но и освободить людей именно от рутины, а не от творчества.
Да, если ваша работа не столь рутинная, как создание типовых текстов или общение с клиентами по типовым вопросам, то сделать ИИ своим помощником действительно непросто. Однако и для задач экспертного уровня вы можете сделать вполне конкретные шаги, чтобы работа с ИИ экономила ваше время и давала крутые результаты.
Какой бы у вас ни был прекрасный подробный промт, модели склонны делать ошибки. Особенно хорошо это видно на людях: лишние пальцы / руки / ноги, разные глаза (как по форме, так и по цвету), полная симметрия (эффект зловещей долины), неверная дорисовка аксессуаров (очки, серьги, ожерелья). Здесь на помощь приходит негативный промт, то есть перечисление того, что не должно быть на картинке. Например, вы задаете промт «фотография левой руки» (попробуйте, скорее всего у вас будет очень странный результат), а в негативный промт прописываете «плохая анатомия, размытый, нечеткий, лишние руки, лишние пальцы, плохо прорисованные руки, деформированный» и так далее. Но даже негативный промт не гарантирует анатомически верную картинку руки. Поэтому общая рекомендация – генерировать людей в таких позах, где особо не видно руки и ноги.
Причина в том, что хороший ответ с точки зрения ИИ — это наиболее вероятный ответ. А вероятность определяется по огромному числу открытых источников, которые в большинстве своем неглубокие и нередко фиксируют заблуждения, распространенные среди не-экспертов.
Для генерации текстов необходимы совсем другие стратегии. Важно отметить, что сейчас ИИ может стать помощником, избавить вас от боязни чистого листа, составить план, обобщить информацию, но полноценно написать за вас качественный текст пока вызывает трудности.
Искусственный интеллект с нами уже давно, термин появился еще в 1956 году, но почему только сейчас мы стали активно пользоваться им в повседневной жизни? Все дело в качестве моделей и вычислительных мощностей, которые позволили ученым создать те сервисы, которыми многие из нас пользуются ежедневно.
Стратегии промтов для создания текста
А техника «ход мысли» (chain-of-thought) будет полезна, например, начинающим программистам. У программистов есть такой метод утёнка – это когда вы ставите на стол резинового утенка, открываете код, который не работает, и объясняете строчку за строчкой своему утенку. В момент, когда вы пытаетесь объяснить логику решений, вы сами находите нестыковки и ошибки. Искусственный интеллект можно использовать в таком формате, можно поменяться ролями. Вы передаете свой код ИИ, он объясняет каждую строчку, а вы как утенок слушаете и ищете ошибки.
Это утверждение относится к любым инструментам, но к новомодным чат-ботам на основе генеративного искусственному интеллекта — в особенности. ChatGPT и ему подобные чаты с ИИ сейчас пробуют применять чуть ли не во всех задачах, однако процент успешного применения невелик. Главной причиной этого я считаю «забивание гвоздей микроскопом».
Быстро выяснилось, что общаться с искусственным интеллектом – это целая работа. Наше восприятие ИИ сильно искажено благодаря поп-культуре. Вспомните любой фильм, в котором есть искусственный интеллект. В лучшем случае он решает все проблемы человечества, в худшем – порабощает его. Поэтому нам кажется, что скоро нас заменят на работе и все за нас будет делать этот сверхумный интеллект. На самом деле, нам еще невероятно далеко до такого сценария, если его вообще возможно воплотить в жизнь.
Вторая проблема – это лень. Была гипотеза, что если мы модели будем тренировать на еще большем объеме данных, то они будут точнее. Оказалось, наоборот, они стали ленивее. Например, вы можете попросить самые большие модели составить для вас таблицу 20 строк и 20 столбцов с информацией о вузах. Модель может ответить «Из-за большого объема данных составление такой таблицы заняло бы много времени. Я могу предоставить файл с одной строкой для шаблона, а вы заполните остальные данные по мере необходимости». Или, например, модель написала за вас программный код, он не работает, вы просите найти ошибки и исправить их. Модель отвечает «Странно. А у меня все работает». И дальше вы пытаетесь в этом диалоге заставить модель найти ошибки, чаще всего это безуспешно.
Вроде бы GPT хорошо умеет писать красивые выжимки из документов (например, из интервью), применять к тексту нужный стиль (который можно было бы взять со старой страницы) и структурировать большие таблицы. Но ИИ «не владеет контекстом компании» и потому не понимает, что именно вам действительно важно в этих текстах, таблицах и тем более списках клиентов. Вам придется долго и нудно просить ChatGPT переписать текст, заменив «то» на «это». Я уже не говорю о том, что ИИ даст просто текст, а превращать его в ТЗ для веб-дизайнера придется вам (или вашим подчиненным).
А здесь вы можете посмотреть пример ответа, не совсем корректного с точки зрения эксперта. Хотя Gemini 1.5 Pro дает очень конкретные ответы (из современных моделей лишь GPT-4o может писать более конкретно), ИИ следует типичному заблуждению и рекомендует Scrum-мастеру самому проводить встречи Daily Scrum вместо того, чтобы показывать команде проблемы с этими встречами и (в сложных случаях) подсказывать возможные пути их решения.