Содержание статьи
HSE Daily
Как генерировать видео в Kling
✅ Пишите в промпте то, что должно быть, а не чего не должно. Нейросети плохо понимают отрицания, поэтому для негативного промпта есть отдельное поле. Но и оно не всегда обрабатывается точно. В запросе лучше написать «светло, начинается закат», чем «еще не стемнело».
👌 Формулируйте четко и конкретно. Чем точнее вы опишете желаемую сцену, тем лучше будет результат. Используйте простые и понятные фразы, избегайте двусмысленности. Например, вместо «женщина в длинном платье» лучше написать «женщина в длинном вечернем платье идет по пляжу на закате».
На сегодняшний день уже существует несколько разработок, которые призваны помочь преподавателю индивидуализировать процесс обучения. Самые последние разработки IBM предполагают, что на создание 1 часа академического материала для персонализированного обучения разработчик урока должен потратить порядка 40–45 часов на настройку системы.
Платная подписка стоит от 10 $ ( 850 ₽) в месяц. Она дает возможность генерировать видео более высокого качества в Professional Mode, создавать ролики продолжительностью до трех минут без водяного знака, более гибко управлять движением камеры. Российской картой оплатить подписку нельзя.
Пилотная модель EduChat уже запущена в 18 школах Шанхая с суммарным охватом в 1887 студентов. И это только начало, начало нового направления не только для образования, но и для разработчиков языковых моделей как таковых. За индивидуализированным обучением при помощи искусственного интеллекта — будущее, заключил Бо Цзян.
Китайский философ Конфуций за 500 лет до нашей эры заявлял: «Мы должны индивидуализировать обучение согласно каждым интересам личности». Персонализированное обучение, продолжил Бо Цзян, позволяет студентам достигать самых высоких результатов: по данным последних исследований, отметки у студентов, занимающихся с преподавателем индивидуально, в среднем вдвое лучше, чем у студентов, обучающихся по классической лекционной модели. При этом Бо Цзян отмечает зависимость эффективности персонализированного обучения от возраста студента: «Когда ученик становится старше, эффективность персонализированного обучения снижается».
🖼 Используйте визуальные подсказки. Видео будет более связным, если в каждом кадре есть какой-то условно неподвижный элемент, вокруг которого нейросеть может выстроить сцену. Например, приборная панель автомобиля — а активное движение происходит за окном, здание — и какой-то экшен возле него. Переход между абсолютно разными кадрами получается не очень качественным.
Искусственный интеллект EduChat обучили и составлению вопросов с множественным выбором так, чтобы они были максимально приближены к тем вопросам, которые формулирует человек. Именно по этому показателю EduChat показывает наилучшие результаты по сравнению с другими нейросетями, опережая в том числе передовую модель GPT-4.
Письма о технологиях и интернете
Индивидуализированный подход к обучению — залог эффективной подготовки перспективных студентов. Но как быть, если преподавателей и их возможностей не хватает? На помощь человеку приходит искусственный интеллект. Об опыте создания образовательной модели EduChat и его применении для подготовки студентов в Шанхае рассказал заместитель декана факультета компьютерных наук Восточно-Китайского педагогического университета Бо Цзян в ходе экспертного семинара, организованного Институтом образования НИУ ВШЭ.
1️⃣ Генерируйте одно действие за раз. Kling, как и другие нейросети для генерации видео, пока плохо отрабатывает два разных сюжета или объекта в одной сцене. Одно действие — одна генерация. Потом фрагменты по пять или 10 секунд можно будет собрать в более сложный ролик в любом видеоредакторе. Например, не стоит одним промптом прописывать, как корги едет на мотоцикле, а на трассу вдруг выскакивает Гэндальф и сообщает, что дальше не пройти. Лучше разбить сюжет на две-три сцены и сгенерировать каждую отдельно.
Компания ByteDance, которой принадлежит TikTok, запустила новую нейросеть Jimeng AI, работающую на базе ИИ. С её помощью пользователи могут создавать картинки и короткие видео по текстовому запросу. Приложение Jimeng AI недавно появилось в AppStore, а также доступно в Google Play, правда пока только в Китае. Веб-сайт Jimeng AI открывается в России, на главной странице можно посмотреть примеры видео, созданных нейросетью.
Хорошая новость в том, что современные технологии, в частности развитие языковых моделей искусственного интеллекта, позволяют нам решить проблему необходимости тратить десятки часов на разработку персонализированного урока. В Китае поняли важность момента и своевременно занялись разработкой собственной языковой модели EduChat, которая обучалась на большом числе образовательных книг и 4 миллионах различных образовательных материалов. После получения фундаментальных знаний модель искусственного интеллекта донастраивалась на основании 500 тысяч методичек для преподавателей по таким темам, как сократический диалог, алгоритм оценивания эссе и эмоциональная поддержка.
🤪 Избегайте сложных идиом и образных выражений. Нейросеть может неправильно интерпретировать сложные фразы, сравнения, слова в переносном смысле. Лучше писать прямо и просто. «Человек идет по пустыне во время заката, вокруг только песок и редкие кусты» — хороший пример. «Человек блуждает по пустыне, как потерянная душа в море времени» — неудачный. Нейросеть может попытаться изобразить и человека, и пустыню, и море, и время, и душу.
Кроме того, модель EduChat позволяет значительно упростить процесс обучения математике для китайских студентов, для которых, по заявлению спикера, это, вероятно, самый трудный предмет в школе. В игровой форме любой ученик может практиковаться по ключевым математическим темам, а весь его путь обучения, выстроенный на основании лучших методичек для преподавателей, сопровождается возможностью разобрать любую тему по методу сократического диалога. Таким образом, через постоянные наводящие вопросы от искусственного интеллекта студент со временем сам доходит до решения изначальной задачи, закрепляя полученные по теме навыки.
Как начать пользоваться Kling
🎨 Экспериментируйте с уровнем креативности. Установка ползунка на средний уровень — около 0,5 — дает сбалансированный результат. Нейросеть соблюдает указания, но при этом добавляет собственную интерпретацию запроса. Если хотите, чтобы Kling строго следовал промпту, установите креативность на минимум.
Всё это короткие видеоклипы (большинство из них длится менее 5 секунд) на основе текстовых подсказок. Здесь же показан текст из которого сервис сгенерировал видео. Кроме того, как заявлено на сайте, Jimeng AI позволит создавать короткие истории. То есть можно будет покадрово расписать, что должно происходить в ролике и сделать видео по сценарию. Если данная функция действительно будет реализована, то это будет сильным преимуществом относительно моделей, просто создающих анимацию в кадре. Логотип Jimeng AI — это волчок в градиентом цвете: Ещё одна фишка Jimeng AI, это формат соцсети, как у Шедеврум. Пользователи могут делиться своими работами, есть лента просмотра контента, работающая на основе рекомендаций, можно ставить лайки, писать комментарии, а также копировать чужие промпты. Получается Тик-Ток из роликов, созданных искусственным интеллектом. Протестировать нейросеть пока не удалось. Если интерфейс сайта можно перевести в браузере, то доступ открывается только после авторизации через Douyin. Таким образом ByteDance вступает в гонку нейросетей для генерации видео. Главный конкурент — Sora AI от OpenAI, которая была запущена в феврале. Также запуск Jimeng AI ещё раз продемонстрировал растущий интерес китайских компаний к генеративным возможностям ИИ. Kuaishou, китайская видеоплатформа, запустила нейросеть Kling AI в конце прошлого месяца. Китайский стартап в области искусственного интеллекта Zhipu AI также представил модель Ying, а стартап Shengshu запустил приложение Vidu. Ещё один возможный шаг ByteDance, это интеграция функций Jimeng AI в TikTok. TikTok уже работает над интеграцией ряда генеративных ИИ-функций, включая чат-ботов, инструменты поиска, опции создания музыки и цифровые аватары. И создание видео из текста может стать ещё одной популярной опцией. Ранее OpenAI сообщила, что разработала текстовые «водяные знаки» для распознавания текста, сгенерированного ChatGPT.