Deductor как обучать нейросеть

0
19

Научная электронная библиотека Монографии, изданные в издательстве Российской Академии Естествознания

Примеры применения

Ассортиментный ряд средней компании, занимающейся сбытом продукции, составляет сотни наименований. Поэтому построение индивидуальной модели для каждой товарной позиции не представляется возможным по многим причинам. Обычно строят модель для товарной группы, а распределение квот по каждой позиции проводят специальным образом на этапе разгруппировки. Поэтому перед построением моделей важно провести сегментацию товаров на группы. Легче всего в качестве отправной точки использовать имеющуюся маркетинговую сегментацию, или деление по производителям. В любом случае следует прибегнуть к опросу экспертов, чтобы узнать, какое деление наиболее эффективно с точки зрения задачи прогноза. При отсутствии каких-либо гипотез можно начать, как вариант, с сегментации по производителям.

Если, например, имитационная модель экономики предприятия позволяет на компьютере проводить только рутинные расчёты, а принимает решение (так называемое в человеко-машинной системе «Лицо, принимающее решение») – руководитель, то в отличие от данной модели компьютерные средства моделирования на искусственных нейронных сетях выдают результат для конкретной моделируемой ситуации. Руководитель ставит цель прогнозирования и получает модельное решение, подсказывающее — как надо действовать в той или иной ситуации.

После разбиения исходного набора данных на подмножества проводится настройка структуры искусственной нейросети. Для первого эксперимента выбрана модель нейросети с архитектурой (5-2-1). Диаграмма рассеивания результатов моделирования определяет допустимость применения конкретной модели нейронной сети для прогнозирования сбыта продукции.

Данный обработчик позволяет задать структуру нейронной сети, определить ее параметры и обучить с помощью одного из доступных в системе алгоритмов. В результате будет получен эмулятор нейронной сети, который может быть использован для решения задач прогнозирования, классификации, поиска скрытых закономерностей, сжатия данных и многих других приложений.

Анализ бизнес-процесса проводится на основе четырех ассоциативных правил Data Mining: Популярные наборы, Правила, Дерево правил, Что-если, — которые позволяют эксперту найти интересные, необычные закономерности, объяснить их и применить на практике. Ассоциативные правила позволяют находить закономерности между связанными событиями. Целью анализа является установление следующих зависимостей: если в транзакции (набор товаров, купленных покупателем за один визит) встретился некоторый набор элементов Х, то на основании зависимостей можно сделать вывод о том, что другой набор элементов У также должен появиться в этой транзакции. Установление таких зависимостей дает возможность находитьпростые и интуитивно понятные правила.Алгоритмы поиска ассоциативных правил предназначены для нахождения всех правил вида «из Х следует У», причем поддержка и достоверность этих правил должны находиться в рамках некоторых наперед заданных границ, называемых соответственно минимальной и максимальной поддержкой и минимальной и максимальной достоверностью. Для анализа организации торговли используется набор способов отображения данных пакета Deductor. Входными данными являются данные о продажах товаров из магазина: номер чека и наименование товара. Выходными данными должны быть соотношения товаров и вероятность (в процентном отношении) их совместной покупки.

4) способ отображения данных «Что-если» в ассоциативных правилах позволяет ответить на вопрос: что получим в качестве следствия, если выберем данные условия? Например, какие товары приобретаются совместно с выбранными товарами. В списке всех элементов транзакций указана поддержка — сколько раз данный элемент встречается в транзакциях; указывается список элементов, входящих в условие.

Так как полученные значения не выходят за границы допустимой точности решения, то модель нейросети можно использовать для прогнозирования сбыта продукции по целевому фактору – прибыль при входных данных: цена продажи, цена закупки, скидка, объем продаж, средний уровень продаж, уровень спроса, уровень продаж, затраты.

Построение ассоциативных правил проводитсяна примере торговой организации. Рассматриваетсязадача организации продажи розничныхтоваров. Номенклатура товаров насчитывает 90 наименований. В задаче использовались данные чеков из магазина самообслуживания, в каждом из которых указывались реализованные товары: молочная продукция, хлеб, майонез, макаронные изделия, пиво, конфеты, чай, печенье, сухарики, чипсыи т.д.

Связь с автором (комментарии/рецензии к статье)

Источником входных и выходных данных являлся сайт «Ситистар» (недвижимость г. Магнитогорска). В качестве параметров были выбраны: количество комнат, тип дома, район, этаж, этажность дома, общая площадь, жилая площадь, площадь кухни, наличие ремонта, мебели, застеклённость балкона и стоимость.

ЧИТАТЬ ТАКЖЕ:  Нейросеть которая делает логотипы

Прогноз остатков на счетах. Используя информацию об ежедневных остатках на счетах клиентов, обработчик преобразует ее во временные ряды и построит прогноз остатка на будущее. Благодаря этому появляется возможность управлять ликвидностью банка.

Медицинская диагностика. Алгоритм, обрабатывая накопленные данные клинических исследований, моделирует сложные зависимости между симптомами и заболеваниями. Это позволяет поставить верный диагноз, произвести мониторинг состояния пациента, оценить эффективность лечения.

Deductor Studio Academic это аналитическая платформа для создания конечных прикладных решений в области анализа данных. Технологии, которые были реализованы в Deductor на базе единой архитектуры позволяют осуществить все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора и визуализации полученных результатов.

Использование метода искусственного интеллекта позволяет исключить постоянное проведение расчетов, так как «обученная» модель нейронной сети работает по системному принципу «чёрного ящика». В нейросетевой модели перед аналитиком встает вопрос определения архитектуры нейронной сети, в частности, количество скрытых слоев и нейронов в них.

Нейронные сети представляют собой самообучающиеся модели, имитирующие деятельность человеческого мозга. Они способны не только выполнять однажды запрограммированную последовательность действий над заранее определенными данными, но и сами анализировать вновь поступающую информацию.

В результате анализа показателей работы одного из потребительских обществ разработана система взаимосвязи и влияния 32 факторов управления деятельностью потребительского общества (на примере Потребительского общества «Пищекомбинат» j одного из районов Волгоградской области).

Шаг 3. Тестирование (оценивается качество классификации при подаче на вход тестового множества). Сеть считается успешной при относительной ошибке не более 20 %. Если ошибка больше, следует возврат к шагу 2. В случае, когда повторное обучение не улучшило результат, сеть считается неудачной и выбывает из эксперимента.

Описание алгоритма

В результате проведения ряда экспериментов на моделях с изменением настроек, структуры и (или)набора входных параметров определяется оптимальная модель нейронной сети. Например, модель нейронной сети, показанная нарис. 1.7, может считаться оптимальной в ряде проведенных экспериментов, что видно из диаграммы рассеяния на рис. 1.8.

1) способ отображения данных «Популярные наборы» отображает множества, состоящие из одного и более элементов, которые наиболее часто встречаютсяв транзакциях одновременно. Анализ показал, что популярными наборами являются: «Молочная продукция» — 38,46 %;«Хлеб» — 38,40 %;«Пиво» — 30,77 %; «Майонез»-23,08 % — показано на рис. 1.10.

После импорта данных и получения детальной статистики по выборке были установлены входные и выходные поля данных. Далее был установлен процент обучающего множества – 80% и тестового – 20%. После разбиения исходного набора данных на подмножества мы определили допустимый диапазон нейронов на скрытых слоях персептрона. Для этого мы использовали формулу, являющуюся следствием теорем Арнольда–Колмогорова–Хехт–Нильсена.

После изучения предметной области в качестве исходных данных были выбраны факторы: вид продукции, цена продажи, цена закупки, скидка, объем продаж, средний уровень товарооборота, уровень спроса, уровень предложения. Прогнозирование проводится по целевому фактору «Прибыль». Средний уровень товарооборота, уровень спроса, уровень предложения, вид продукции имеют назначение: информационные, как показано на рис. 1.6.

После выбора алгоритма обучения (Back Propagation или метод обратного распространения ошибки), функции (сигмоида) и скорости обучения выбирается архитектура нейросети для эксперимента — 4 нейрона во входном слое, а также один скрытый слой. На рис. 1.9 показан«экран» процесса обучения искусственной нейросети.

Оценка кредитоспособности клиента при выдаче кредитов. На базе алгоритма строятся скоринговые карты, модели аппликационного и поведенческого скоринга. Это позволяет проводить выбранную кредитную политику и снижать уровень просроченной задолженности.

АналитическаяплатформаDeductorпозволяетрешитьзадачу прогнозирования сбыта продукции,чему помогают создание хранилища данных и аналитическая OLAP-отчетность.Помимо этого необходимы моделипрогнозапродаж–онистановятсяглавной частью аналитическогорешениядля управления сбытом товаров. Для прогнозирования сбыта продукции в Deductor проводится ряд экспериментов на моделях нейронных сетей различной архитектуры. Для проведения экспериментов выбрана модель «Многослойная нейронная сеть».

При определении Nопти обучении персептрона на 10000 эпохах было найдено необходимое количество нейронов в скрытых слоях равное четырём, при которых система осуществляет вычисления с минимальной погрешностью (среднеквадратичная ошибка обучающего множества составила – 1,94Е-03).

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь