Содержание статьи
Данные и будущее: чего нам ожидать от искусственного интеллекта
Выжимка из отчетов Databricks и State of AI за 2023 год
Информации в мире становится больше. Чтобы обрабатывать и анализировать ее, уже сейчас требуются мощные ресурсы, техника и системы хранения данных. Руководители IT-компаний всех уровней, стараясь соответствовать тенденции, удваивают свои инвестиции в данные и искусственный интеллект.
Это крайне важный шаг, поскольку 60 % респондентов, принимающих участие в опросе от Databricks, считают, что единая модель управления данными и ИИ очень важна . Также большинство опрошенных призналось, что безопасность и конфиденциальность данных являются основными опасениями, связанными с использованием генеративного ИИ.
Мы не можем сейчас прекратить внедрять ИИ и передовые технологии обработки данных. Мы просто должны быть последовательными и структурированными в отношении наших инвестиций. Это время, когда каждой компании придется выбирать, какие проекты развивать, так как ресурсы не бесконечны.
В феврале 2023 года Meta AI выпустила свою большую языковую модель LLaMA (Large Language Model Meta AI). Она была обучена на широком спектре источников данных и поддерживает 20 языков с латинским и кириллическим алфавитами. Вдобавок LLaMA доступна для использования бесплатно, в то время как GPT-4 работает только по подписке.
Сегодня никто не может усомниться в развитии ИИ и его глобальном влиянии на все сферы жизни. Отчеты Databricks и State of AI основываются на данных с секторов финансовых услуг, здравоохранения и биологических наук, розничной торговли и потребительских товаров, производства, средств массовой информации и развлечений, а также членов правительственного сектора. Все перечисленные сферы так или иначе уже подверглись значительным изменением вследствие внедрения ИИ, а далее ожидается только ускорение и масштабирование данного процесса.
Претендентов на звание наиболее продвинутого ИИ много, но лидер очевиден — это ChatGPT, один из самых быстрорастущих интернет-продуктов за всю историю. В декабре 2022 года он громко заявил о себе, пройдя тест Тьюринга. ChatGPT стал вторым чат-ботом в мире, который сумел успешно выполнить эту задачу.
Сферы применения ИИ
Точное определение AGI еще не сложилось, но большинство экспертов определяет его, как ИИ, который соответствует или превосходит человеческие возможности в широком спектре когнитивных задач. Именно это, по мнению директора управления экспериментальных систем машинного обучения SberDevices Сергея Маркова, отличает AGI от существующих сегодня нейросетевых моделей. «Пчела найдет оптимальный маршрут в улей быстрее и лучше, чем это сделал бы человек, хотя в ее нервной системе несколько сотен тысяч нейронов, а у человека восемьдесят шесть миллиардов. Шахматная программа или даже калькулятор в решении конкретной задачи тоже превосходит человека. Уже сегодня можем сейчас взять почти любую простою задачу и сделать систему, которая будет лучше человека в ее решении. А вот AGI или общий искусственный интеллект — это универсальная система, которая сможет решать неизвестные ей ранее задачи. Сила человеческого интеллекта именно в том, что мы умеем решать задачи, с которыми ранее не сталкивались. И к созданию таких систем мы сейчас только приближаемся» , — отметил Марков в своем выступлении на конференции Turbo ML Conf.
С ростом интереса к продуктам, в которых интегрированы системы машинного обучения, растет и востребованность соответствующих специалистов по сбору и обработке информации. Компании вынуждены вкладываться в обучение и развитие сотрудников. Очень нужны специалисты по компьютерному зрению, робототехнике, машинному обучению и также по этике ИИ, причем около 40 % компаний признались, что готовы инвестировать в таланты .
В мае 2021 года Databricks запустила реестр моделей машинного обучения MLflow, который показал реальные темпы продвижения ИИ и рост цифровизации в целом. После очередной тренировки каждая модель тщательно проверялась на предмет определения точности и полноты работы (процент правильно предсказанных случаев).
Например, ИИ, управляя автомобилем в беспилотном режиме, оказывается перед выбором, когда неизбежно столкновение с несколькими пешеходами. В этом случае компьютерное устройство обязано принять решение, кого спасти. Такой выбор является сложным и неоднозначным даже для человека.
Языковые модели нового поколения обучаются на узкоспециализированных наборах данных. Также популярным является обучение LLM на основе обработки естественного языка. Таким образом разработчикам удается добиться большей точности и эффективности в решении задач. LLM отлично зарекомендовали себя в науках о жизни, делая значительные шаги вперед как в молекулярной биологии, так и в разработке лекарств.
В ходе регистрации и анализа данных реестра было выявлено, что буквально каждая третья модель получила оценку, свидетельствующую о «зрелости» проекта. Кроме того, аккуратность новых моделей растет от версии к версии. Согласно отчету, только за последние 12 месяцев их эффективность выросла на 20 %.
Сегодня рынок искусственного интеллекта является самым быстрорастущим в мире. Согласно прогнозам исследовательской компании Statista, c 2024 по 2030 год мировой рынок ИИ будет расти со скоростью 28,46% в год. А по мнению заместителя председателя правительства Российской Федерации Дмитрия Чернышенко, экономический эффект от внедрения искусственного интеллекта увеличит ВВП России к 2030 году на 11 трлн руб.
Ценность больших данных постоянно растет, а компании, которые не внедрят в свою работу искусственный интеллект и машинное обучение, рискуют за короткое время отстать от конкурентов. Многие организации инвестируют большие деньги в свои базы машинного обучения, создавая более инновационные решения и улучшая собственные позиции на рынке. В 2022 году объем инвестиций в ИИ составил $77,6 млрд, что на 24 % больше, чем в 2021-м. Ожидается, что эта тенденция сохранится и в 2023 году, достигнув отметки $100 млрд.