Содержание статьи
Что такое нейронная сеть
В чем заключается важность нейронных сетей?
Нейронная сеть – это метод в искусственном интеллекте (ИИ), который учит компьютеры обрабатывать данные таким же способом, как и человеческий мозг. Это тип процесса машинного обучения, называемый глубоким обучением, который использует взаимосвязанные узлы или нейроны в слоистой структуре, напоминающей человеческий мозг. Он создает адаптивную систему, с помощью которой компьютеры учатся на своих ошибках и постоянно совершенствуются. Таким образом, искусственные нейронные сети пытаются решать сложные задачи, такие как резюмирование документов или распознавание лиц, с более высокой точностью.
Обучение нейронной сети — это процесс обучения нейронной сети выполнению задачи. Нейронные сети обучаются путем первичной обработки нескольких больших наборов размеченных или неразмеченных данных. На основе этих примеров сети могут более точно обрабатывать неизвестные входные данные.
На входной слой искусственных нейронов поступает информация, с которой в дальнейшем будет работать нейросеть. Посредством синапсов она передаётся следующему слою, при этом каждый синапс имеет свой коэффициент веса, а каждый следующий нейрон может иметь несколько входящих синапсов. В итоге информация, полученная следующим нейроном, представляет собой сумму всех данных, перемноженных на свой коэффициент веса.
Нейронные сети прямого распространения обрабатывают данные в одном направлении, от входного узла к выходному узлу. Каждый узел одного слоя связан с каждым узлом следующего слоя. Нейронные сети прямого распространения используют процесс обратной связи для улучшения прогнозов с течением времени.
Например, логистической компании нужно построить самые быстрые маршруты. Если в качестве исходных данных будет использована информация о маршрутах, которые строили сами водители, нет смысла подключать нейросеть. При выборе они будут опираться на другие факторы. Если использование нейросетей всё же уместно, то для решения основной задачи может использоваться не одна нейросеть, а сразу несколько. В этом случае большая задача разбивается на много мелких.
Поднаправление искусственного интеллекта, которое занимается работой с изображениями и видеопотоком, получило название Computer Vision или компьютерное зрение. Это направление является наиболее перспективным в медицинской диагностике и скрининге патологий.
Нейронная сеть — это программа для анализа данных, чаще всего разработанная для оптимизации того или иного рутинного процесса. Многие ассоциируют термины «искусственный интеллект» и «нейронная сеть» с работой человеческого мозга. Однако нейронная сеть — это в первую очередь софт, несмотря на некоторую схожесть процессов «обучения» нейронной сети и обучения человека.
Когда человек учится читать, он огромное количество раз сталкивается с каким-либо символом (буквой), учится складывать их в слоги, а слоги — в предложения. И лишь пройдя тысячи таких итераций, человек научится читать. Процесс обучения нейронной сети тоже невозможен без исходных данных: именно на них она учится решать ту или иную задачу.
Нейронные сети прямого распространения
При контролируемом обучении специалисты по работе с данными предлагают искусственным нейронным сетям помеченные наборы данных, которые заранее дают правильный ответ. Например, сеть глубокого обучения, обучающаяся распознаванию лиц, обрабатывает сотни тысяч изображений человеческих лиц с различными терминами, связанными с этническим происхождением, страной или эмоциями, описывающими каждое изображение.
Нейронные сети помогают компьютерам принимать разумные решения с ограниченным участием человека. Они могут изучать и моделировать отношения между нелинейными и сложными входными и выходными данными. Например, нейронные сети могут выполнять следующие задачи.
DSP-1181 является агонистом 5-HT1A рецептора серотонина и предназначен для лечения пациентов с обсессивно-компульсивным расстройством (ОКР). Обычно на разработку таких лекарств (этап Drug discovery) у исследователей уходит около пяти лет. Искусственный интеллект справился с этой задачей всего за год.
Нейронные сети могут отслеживать действия пользователей для разработки персонализированных рекомендаций. Они также могут анализировать все действия пользователей и обнаруживать новые продукты или услуги, которые интересуют конкретного потребителя. Например, стартап из Филадельфии Curalate помогает брендам конвертировать сообщения в социальных сетях в продажи. Бренды используют службу интеллектуальной маркировки продуктов (IPT) Curalate для автоматизации сбора и обработки контента пользователей социальных сетей. IPT использует нейронные сети для автоматического поиска и рекомендации продуктов, соответствующих активности пользователя в социальных сетях. Потребителям не нужно рыться в онлайн-каталогах, чтобы найти конкретный продукт по изображению в социальных сетях. Вместо этого они могут использовать автоматическую маркировку Curalate, чтобы с легкостью приобрести продукт [4] .
Технологии машинного обучения могут применяться при работе с различными видами информации. Наиболее широкое распространение нейросети в медицине получили именно в области работы с изображениями. Рабочие процессы медицинских учреждений неразрывно связаны со сбором, обработкой и анализом различных медицинских изображений: рентген, КТ, цифровые гистологические исследования и так далее.
Полученное значение подставляется в функцию активации, а она уже будет представлять собой выходную информацию, которая отправится дальше по слоям нейронной сети, пока не дойдет до выхода. Первая эпоха никогда не заканчивается успехом, для достижения достаточных метрик требуется их большее количество, которое зависит как от вида задачи, так и от данных и их качества
История
Сервисы глубокого обучения AWS используют возможности облачных вычислений, чтобы вы могли масштабировать свои нейронные сети глубокого обучения с меньшими затратами и оптимизировать их для повышения скорости. Вы также можете использовать подобные сервисы AWS для полного управления конкретными приложениями глубокого обучения:
Нейронные сети могут отслеживать действия пользователей для разработки персонализированных рекомендаций. Они также могут анализировать все действия пользователей и обнаруживать новые продукты или услуги, которые интересуют конкретного потребителя. Например, стартап из Филадельфии Curalate помогает брендам конвертировать сообщения в социальных сетях в продажи. Бренды используют службу интеллектуальной маркировки продуктов (IPT) Curalate для автоматизации сбора и обработки контента пользователей социальных сетей. IPT использует нейронные сети для автоматического поиска и рекомендации продуктов, соответствующих активности пользователя в социальных сетях. Потребителям не нужно рыться в онлайн-каталогах, чтобы найти конкретный продукт по изображению в социальных сетях. Вместо этого они могут использовать автоматическую маркировку Curalate, чтобы с легкостью приобрести продукт.
В 1980-х годах, когда появились более мощные компьютеры для вычислений, исследователи смогли разработать нейросети с двумя и тремя уровнями обучения. Однако возрождение интереса к нейронным сетям и революция в глубоком обучении произошли лишь в последние годы благодаря индустрии компьютерных игр. Современные игры требуют сложных вычислений для обработки большого числа операций. В итоге производители начали выпускать графические процессоры (GPU), которые объединяют тысячи относительно простых вычислительных ядер на одном чипе. Исследователи вскоре поняли, что архитектура графического процессора очень похожа на архитектуру нейросети.
Глубокие нейронные сети или сети глубокого обучения имеют несколько скрытых слоев с миллионами связанных друг с другом искусственных нейронов. Число, называемое весом, указывает на связи одного узла с другими. Вес является положительным числом, если один узел возбуждает другой, или отрицательным, если один узел подавляет другой. Узлы с более высокими значениями веса имеют большее влияние на другие узлы.
Теоретически глубокие нейронные сети могут сопоставлять любой тип ввода с любым типом вывода. Однако стоит учитывать, что им требуется гораздо более сложное обучение, чем другим методам машинного обучения. Таким узлам нужны миллионы примеров обучающих данных, а не сотни или тысячи, как в случае с простыми сетями.
Рассмотрим подробнее, чем именно полезны сервисы с применением технологии компьютерного зрения, на примере системы для анализа медицинских изображений Цельс. На данный момент сервис работает по четырём направлениям диагностики — маммография, флюорография, компьютерной томография лёгких и гистология. Работа врача с системой происходит следующим образом:
Анализ ДНК — ещё одно перспективное и активно развивающееся направление применения нейросетей. Например, инструмент, разработанный Университетом штата Мичиган, осуществляет генетические исследования и позволяет по геному человека установить его рост с точностью до трёх сантиметров, спрогнозировать развитие у него таких серьёзных заболеваний как рак, инсульт и инфаркт, выявить мутации, влияющие на плотность костной ткани, и даже предсказать уровень образования, которого может достичь человек.
Например, чтобы научить нейросеть управлять беспилотным автомобилем, нужно смоделировать поведение человека-водителя, который во время движения должен распознавать дорожные знаки и разметку, реагировать на сигналы светофора, прогнозировать поведение других водителей и замечать людей, которые оказались на дороге. Для решения каждой из этих задач в беспилотном автомобиле работает отдельная нейросеть [3] .
Выходной слой дает окончательный результат обработки всех данных искусственной нейронной сетью. Он может иметь один или несколько узлов. Например, при решении задачи двоичной классификации (да/нет) выходной слой будет иметь один выходной узел, который даст результат «1» или «0». Однако в случае множественной классификации выходной слой может состоять из более чем одного выходного узла.