Содержание статьи
OpenAI представила новую модель o1: нейросеть, которая думает и решает в 6 раз лучше GPT-4o
Katteb
GPT-4 — четвертая версия большой языковой нейросетевой модели от компании Open AI. Несмотря на то, что GPT-4 самая мощная и совершенная версия искусственного интеллекта, ее презентация вызвала не только восторг специалистов по работе с данными, но и вопросы к Open AI.
Нейросетевой помощник, работающий на базе Notion — онлайн-сервиса для создания интерактивных документов. Умеет генерировать любой контент по запросу: текст, картинки, диаграммы, таблицы — всё что угодно. Просто скажите Notion AI, что вы хотите получить, и он сделает всё, что нужно.
Это нейросеть-напарник для разработчика. Она анализирует код, который пишет пользователь, и генерирует его продолжение — новые строки или функции. Автодополнение можно подключить, либо начав писать код, либо набрав комментарий на английском, описывающий, какую функцию, класс или скрипт хочет получить разработчик.
Мощная нейронка для создания презентаций: просто загрузите в неё всю информацию по теме, а она сама разобьёт её по слайдам, структурирует, добавит стиль, диаграммы и другие визуальные элементы. Чтобы начать работать с сервисом, достаточно установить плагин для «Google Презентаций».
Ещё один генератор изображений по текстовому запросу. В отличие от многих конкурентов, имеет своё мобильное приложение — для Android и iOS. Картинки генерируются в вертикальной ориентации, поэтому их удобно использовать в качестве обоев для смартфона. Можно выбрать стиль изображения, хотя большинство предлагаемых стилей платные.
12 сентября 2024 года OpenAI представила новую модель OpenAI o1, которая способна буквально «думать» как человек. Эта модель не просто генерирует текст на основе данных, а строит логические рассуждения, анализирует задачи и улучшает ответы, что делает ее в 5–6 раз производительнее предыдущей модели GPT-4o. IT-World уже сообщал о работе OpenAI над новой технологией под кодовым названием «Strawberry», которая позволит моделям ИИ не только генерировать ответы, но и планировать действия в Интернете автономно, выполняя «глубокие исследования». Основные показатели новой модели говорят сами за себя. На квалификационном экзамене Международной математической олимпиады (IMO) GPT-4o решила только 13% задач, в то время как OpenAI o1 справилась с 83%, что соответствует уровню 500 лучших студентов США. В программировании результаты не менее впечатляющие: на платформе Codeforces o1 заняла 89-й процентиль, продемонстрировав способность решать сложные задачи на уровне ведущих участников соревнований.
WavTool
Еще одна возможная причина, по которой в OpenAI скрывают детали создания GPT-4 — это юридическая ответственность. Языковые модели ИИ обучаются на огромных наборах текстовых данных, при этом извлекают информацию из интернета — источника, который, включает материалы, защищенные авторским правом. Генераторы изображений ИИ, также обучаемые на контенте из интернета, столкнулись с юридическими проблемами именно по этой причине: несколько фирм в настоящее время предъявили иски цифровым художникам и сайту стоковых фотографий Getty Images.
Ещё одна нейросеть, которая создаёт текст на основе заданных параметров. Онлайн-сервис предлагает несколько вариантов генерации с разным стилем: тексты для блога, презентации, сопроводительные письма, контент для соцсетей, статьи в формате «вопрос — ответ» и многое другое.
Еще совсем недавно от западных облачных сервисов зависело 30% крупных российских компаний. Их отключение, порой внезапное, должно было поставить рынок перед сложными вызовами. Но оказалось, что российские облака готовы предложить рынку вполне зрелые решения. Это и многое другое обсудили участники круглого стола IT-World «Импортозамещение в облаках».
Закрытый подход является самым заметным за последнее годы изменением политики OpenAI, которая была основана в 2015 году небольшой группой экспертов и бизнесменов, и в которую входили нынешний генеральный директор Сэм Альтман, генеральный директор Tesla Илон Маск (ушел из совета директоров в 2018 году) и исследователь ИИ Илья Суцкевер. Изначально OpenAI позиционировалась, как некоммерческая организация, но позже стала «компанией с ограниченной прибылью». Это было сделано для того чтобы обеспечить миллиардные инвестиции от Microsoft, с которой было заключено эксклюзивное партнерство. На вопрос издания The Verge, почему OpenAI изменила свой подход к публикации своих исследований, главный научный сотрудник и соучредитель OpenAI Суцкевер ответил: » Если вы, как и мы, верите, что в какой-то момент ИИ — станет чрезвычайно, невероятно мощным, тогда в открытом исходном коде просто нет смысла. Это плохая идея… Я полностью ожидаю, что через несколько лет всем станет совершенно очевидно, что ИИ с открытым исходным кодом просто неразумен».
Это нейросеть, которая автоматически создаёт дизайн интерьеров с использованием искусственного интеллекта. Она позволяет быстро разработать варианты интерьеров для разных помещений, используя автоматическую генерацию макетов и 3D-визуализацию. Можно загружать фотографии своих помещений и подбирать для них цвет стен, мебель и аксессуары.
Пользователь импортирует на сайт фрагмент кода или даёт ссылку на репозиторий на GitHub, а затем в чате отправляет запрос ИИ. Запрос можно делать не только на английском, но и на русском языке. Нейросеть может объяснить, что делает этот код, найти в нём ошибки и предложить исправления.
Codeium
Ещё одна нейросеть, которая с помощью ИИ создаёт статьи в блогах, сообщения в социальных сетях, описания товаров и другие виды контента. Она рерайтит и дописывает тексты, а также умеет проводить несложный фактчекинг — то есть проверять информацию, использующуюся в тексте.
Сервис для генерации контента для брендов. Можно создавать изображения товара для рекламы, сайтов, соцсетей или карточек на маркетплейсах. Для этого нужно загрузить фотографию товара, а затем выбрать готовый шаблон фона или ввести его текстовое описание. Искусственный интеллект сгенерирует картинку, которую затем можно загрузить на устройство.
Мощная программа для преобразования аудио в текст на устройствах с macOS. Работает на базе продвинутой нейросети Whisper от компании OpenAI, разработчика ChatGPT. Поможет расшифровать многочасовые записи лекций, интервью или конференций — и всё это за несколько секунд и без доступа к интернету. Поддерживает более 100 языков, в том числе и русский.
Нейросеть генерирует видеоролики на основе статей, постов в блогах и собственных сценариев. К визуальной части можно добавить автоматическую озвучку. Все сгенерированные элементы редактируются: можно настроить фон, выбрать видео и музыку, добавить стоковые изображение и подписи.
Генерируют музыкальную композицию на основе текстового описания. Отлично подходит для создания простых фоновых мелодий для торговых центров, лифтов или презентаций. Кстати, под капотом у нейронки лежит языковая модель GPT-4, которая используется в небезызвестном ChatGPT.
Одновременно OpenAI усиливает меры безопасности, совершенствуя внутренние протоколы и взаимодействие с федеральными правительствами, чтобы соответствовать этическим нормам и минимизировать риски. По данным компании, новый подход к обучению и интеграции цепочки рассуждений в поведение модели способствует лучшему обучению модели человеческим ценностям и принципам. У ChatGPT уже есть приложения для Android и iOS, и десктопная версия для MacOS. Тем не менее для пользователей из России доступ к ChatGPT ограничен. IT-World ранее разбирался какие нейросети доступны в России, как к ним подключиться и использовать. Пока OpenAI o1 остается дорогим решением: стоимость использования через API составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов, что в 3-4 раза дороже по сравнению с GPT-4o. Но компания уверена, что эта инвестиция окупится за счет повышения качества решений и скорости работы в критически важных задачах. На данный момент OpenAI предоставляет доступ к o1 в виде превью-версии для пользователей ChatGPT Plus и Team, а также API-доступ. Разработчики также анонсировали более доступную версию o1-mini, которая будет дешевле на 80% и также подойдет для программирования и других задач, требующих высокого уровня анализа. Полноценная версия модели обещана к релизу в ближайшее время.
Нейросеть для преобразования текста в аудио. Подходит для голосового воспроизведения текста статей на сайте, озвучивания видеороликов, героев игр и другого видеоконтента. SteosVoice имеет более 50 голосов озвучки. Онлайн-сервис поддерживает русский и английский язык.
Это онлайн-сервис для создания статей и маркетинговых материалов на основе нескольких ключевых слов. Hypotenuse AI пишет рекламные тексты, посты в социальных сетях, слоганы и заголовки, описания продуктов по фотографиям. Ещё она генерирует записи в блогах и создаёт изображения по описаниям.