Понедельник, 27.05.2019, 04:35
Высшее образование
Приветствую Вас Гость | RSS
Поиск по сайту



Главная » Статьи » Сельское и приусадебное хозяйство

ПРОГНОЗИРОВАНИЕ УРОЖАЙНОСТИ НА ОСНОВЕ АНАЛИЗА КРОСС-РЕГИОНАЛЬНЫХ ДАННЫХ

А.Г. Гагарин, кандидат экономических наук, доцент
А.Ф. Рогачев, доктор технических наук, профессор

ПРОГНОЗИРОВАНИЕ УРОЖАЙНОСТИ НА ОСНОВЕ АНАЛИЗА КРОСС-РЕГИОНАЛЬНЫХ ДАННЫХ

Проблема адекватного математического моделирования и достоверного прогнозирования урожайности сельскохозяйственных культур является важной для оптимального планирования и организации аграрного производства. Определены базовые статистические характеристики для ВР урожайностей зерновых в целом по Волгоградской области начиная с 1955 г. Анализ показывает, что применение классических подходов математического моделирования, а также современных методов нелинейной динамики приводит к недостаточно адекватным результатам, особенно в острозасушливых условиях Нижнего Поволжья. Поэтому требуется применение классов математических моделей, основанных на искусственных нейронных сетях (ИНС). В работе рассмотрены вопросы построения генеративных состязательных ИНС, их конфигурации и структурной оптимизации, а также методов их обучения для прогнозирования урожайности зерновых по регионам РФ. Ввод данных и предпроцессирование реализовано с помощью библиотеки BrainJS. Разработаны рекомендации по предварительной обработке данных на основе кросс-регионального анализа массивов экономико-климатологических данных. Анализ построенных ИНС показал, что наилучшим методом предобработки оказалась линейная нормализация индексов роста, при этом увеличение количества итераций обучения положительно сказывается на качестве прогнозирования. Применение разработанных нейронных систем обеспечивает решение задачи прогнозирования урожайности на примере зерновых культур, на основе кросс-регионального анализа экономических и климатологических данных.

Ключевые слова: прогнозирование урожайности, нейронные сети, математические методы, корреляция.


Введение. Проблема математического моделирования и достоверного прогнозирования урожайности сельскохозяйственных культур является важной для планирования аграрного производства. В то же время влияние ряда природно- климатических, биологических и организационно-технологических групп факторов оказывает разнонаправленное воздействие на результаты прогнозирования, приводя к недопустимо высокой, более 15 %, погрешности [1, 5]. Применение классических подходов математического моделирования, таких как построение многофакторных регрессионных моделей, систем эконометрических уравнений, различного вида адаптивных моделей, а также современных методов нелинейной динамики [1, 6, 11, 12], не всегда приводит к адекватным результатам, особенно в острозасушливых условиях Нижнего Поволжья. Поэтому требуется применение и исследование новых классов экономико-математических моделей, одним из перспективных направлений среди которых можно считать искусственные нейросетевые структуры, формируемые на ЭВМ.

Математические модели класса искусственных нейронных сетей (ИНС), по мнению ряда отечественных исследователей в сфере прогнозирования аграрных проблем (Е. Бочаров, А. Ильченко, Л. Кальянов, О. Солдатова, М. Суменков и др.) и зарубежных специалистов в области компьютерного моделирования (С. Хайкин, Я. Потмешил, Х. Уайт и др.), позволяют успешно решать трудно формализуемые экономические задачи, такие как распознавание образов, многомерная классификация, диагностика безопасности, прогнозирование временных рядов (ВР) сложной внутренней структуры, характерные для рядов урожайности сельскохозяйственных культур [1, 7, 8, 9, 11].

Вследствие громоздкости структуры искусственной нейронной сети (ИНС), практическая реализации ее возможна только на основе некоторого программного средства, в качестве которого нами были проанализированы коммерческие программные средства (ПС), такие как аналитическая платформа DEDUCTOR, пакет статистического анализа STATISTIKA, а также ряд авторских разработок исследователей Санкт-Петербурга. Для обоснованного выбора предпочтительного ПС была разработана многофакторная вспомогательная структура в форме электронной таблицы с весовыми коэффициентами, обобщающая экспертные оценки опрошенных специалистов. По максимальному количеству функциональных возможностей, удобству интерфейса и доступности для вузовских исследований предпочтение было отдано первому из упомянутых ПС.

Методы и материалы. На основе данных с официального сайта Федеральной службы государственной статистики (http://www.gks.ru/) была получена выборка данных об урожайности озимой пшеницы по субъектам РФ с 1996 по 2016 гг. Субъекты с неполными данными были отброшены, в результате чего осталось 54 временных ряда урожайности со значениями за 21 год. Урожайность озимой пшеницы представляет собой нестационарный ВР, требующий обоснования специфических математических подходов и методов для моделирования и прогнозирования, в частности, искусственных нейронных сетей. В качестве передаточной функции нейронов ИНС ряд исследователей [7, 8] рекомендует сигмоидальную функцию (1), обеспечивающую, благодаря существенной нелинейности активации, достаточную обучаемость проектируемых ИНС.

(1)

Кроме того, для возможности применения в рамках обучения ИНС метода обратного распространения ошибки накладываются определенные условия на передаточную функцию, в частности, дифференцируемость.

Рисунок 1 - Обобщенная структура многослойной ИНС для распознавания образов

Рисунок 1 - Диаграмма урожайности озимой пшеницы за 1996-2016 гг.

Загрузка данных из формата CSV осуществлялась с помощью парсера PapaParse [9], моделирование нейронной сети проводилось с использованием библиотеки BrainJS [10].

На языке JavaScript был реализован скрипт, выполняющий следующие функции: загрузка данных об урожайности из файла в формате CSV; предобработка данных: логарифмирование, нормализация, расчет индексов роста; циклический перебор конфигураций нейронной сети (изменение количества нейронов во входном слое, количества скрытых слоев и нейронов в них); обучение нейронной сети определенной конфигурации с заданными порогом ошибки и максимальным количеством итераций обучения.

На этапе обучения нейронная сеть восстанавливает целевую функцию по множеству наборов обучающей выборки, т.е. решает задачу интерполяции [2, 3, 9]. На этапе использования обученной нейронной сети (получении прогноза) она будет использовать восстановленную зависимость для получения прогнозируемой величины, т.е. решать задачу экстраполяции.

Сходимость метода обратного распространения является весьма медленным процессом. Подстройка весов осуществляется независимо для каждой пары образов обучающей выборки. При этом улучшение функционирования некоторой заданной пары может привести к ухудшению работы на предыдущих образах. Обучение сети для определения весов входов нейронов второго слоя, а также третьего слоя производственного сегмента нейронной системы не требуется.

Результаты и обсуждение. Отработка методики обучения ИНС проводилась на ВР урожайности зерновых культур, который характеризуется выраженным осциллированием.

Вычисленные основные статистические характеристики для ВР урожайностей зерновых в целом по Волгоградской области, начиная с 1955 года, представлены на рисунке 3.

Рисунок 3 - Сравнение эмпирических частот распределения урожайностей зерновых культур с нормальным законом распределения: f - эмпирические частоты по интервалам; fn - теоретические частоты нормального распределения; F - накопленные эмпирические частоты; Fn - интегральная кривая нормального распределения

Для расчёта теоретических значений вероятности для нормального распределения использовалась встроенная в Excel функция Плотности нормального распределения (НОРМРАСП).

Для совокупности урожайностей зерновых в целом расчетное значение критерия χ2 (Хи-квадрат Пирсона) превысило 19,8, (критическое табличное значение 9,95, рассчитанное при уровне значимости а = 0,05 и числе степеней свободы v = q - k - 1 = 4). Для наглядности графического сопоставления исследуемого эмпирического распределения урожайности зерновых в целом с нормальным законом, оба распределения представлены на рис. 3, где слева по оси ординат приведены значения эмпирических и теоретических частот, а справа - соответствующих вероятностей как дифференциального, так и интегрального распределений.

Исследуемый ВР урожайности характеризуется выраженным несоответствием распределения нормальному закону.

Для корректного решения задачи экстраполяции как задачи интерполяции необходимо обеспечить стационарность временного ряда признаков, распределение значений ряда должно быть инвариантно относительно момента времени, для которого оно построено. Алгоритм применения ИНС для решения задачи прогнозирования ВР включает этапы предпрогнозного анализа, обоснования и формирования структуры, обучения сети, оценки погрешности и качества прогноза, проведения непосредственно прогнозирования.

Нейронная сеть обучалась 200, 1000 и 5000 эпох. Размер входного слоя d варьировался от 3 до 19 нейронов, в качестве входных значений подавались предварительно обработанные значения урожайности за d последовательных периодов, на выход - предварительно обработанное значение урожайности за следующий период.

Для генерации вариантов конфигурации скрытых слоев использовались следующие соотношения:

• количество скрытых слоев hlCount варьируется от 1 до числа нейронов во входном слое, деленное на два;

• количество нейронов в i-ом слое рассчитывается по формуле:

(3)

Такой подход позволяет получать конфигурации вида 3х2х1, 8х6х4х2х1, 15х11х7х2х1 и т.д. Количество вариантов конфигураций - 98, что гораздо меньше числа конфигураций, получаемых при полном переборе (порядка 1013).

Сгенерированные конфигурации нейронных сетей обучались на тестовых данных, в которые не входили показатели за 2016 год, используемые в качестве контрольного примера для независимой оценки ошибки прогнозирования.

Вид структуры и форма передаточных функций нейронов выбирались исходя из выявленной на предпрогнозном этапе мультичастотном характере цикличности исследуемых ВР урожайности.

Анализ построенных ИНС показал, что наилучшим методом предобработки оказалась линейная нормализация индексов роста, при этом увеличение количества итераций обучения положительно сказывается на качестве прогнозирования (рисунок 4). С ростом количества скрытых слоев средняя ошибка прогноза растет.

Среди лучших конфигураций можно рекомендовать: 5x2x1, 5x4x2x1, 8x5x2x1, 9x6x2x1, 8x2x1, которые обеспечивали величину погрешности для трехслойной ИНС в пределах 15.25 %.

Рисунок 4 - Распределение средних ошибок прогноза (предобработка - линейная нормализация)

На следующем этапе исследования планируется разработка программного комплекса для автоматизации процедуры обучения семейства состязательных ИНС для прогнозирования урожайности различных зерновых, овощных и кормовых культур, учитывающих особенности их возделывания в острозасушливых условиях Нижнего Поволжья.

Заключение. На основаниии вышеизложенного можно сделать следующие выводы:

1. Для создания математической модели урожайности с использованием технологии ИНС, на основе проведенных предпрогнозных численных экспериментов и анализа статистических характеристик ВР урожайности исследованных сельскохозяйственных культур, была обоснована структура ИНС, выполнено ее «обучение» и доказана возможность получения краткосрочных прогнозов с погрешностью в пределах 15.20 %.

2. Применение разработанных генеративных состязательных нейронных систем обеспечивает решение задачи прогнозирования урожайности на примере зерновых культур на основе кросс-регионального анализа экономических и климатологических данных.

 

Библиографический список

1. Гагарин А.Г. Программная инженерия [Текст] / А.Г. Гагарин. - Волгоград: Волгоградский государственный технический университет, 2016. - 96 с.
2. Ежов, А.А. Нейрокомпьютинг и его применения в экономике и бизнесе [Текст] / А.А. Ежов, С.А. Шумский; под ред. проф. В.В. Харитонова. - М.: МИФИ, 1998. - 224 с. Серия «Учебники экономико-аналитического института МИФИ».
НИЖНЕВОЛЖСКОГО АГРОУНИВЕРСИТЕТСКОГО КОМПЛЕКСА, НАУКА И ВЫСШЕЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ
3. Ильченко, А.Н. Экономико-математические методы [Текст]/ А.Н. Ильченко. - М.: Финансы и статистика, 2009. - 288 с.
4. Качановский, Ю.П. Предобработка данных для обучения нейронной сети [Текст] / Ю.П. Качановский, Е.А. Коротков // Фундаментальные исследования. - 2011. - № 12-1. - С. 117-120.
5. Рогачев, А.Ф. Оценка прогнозного уровня урожайности на основе нейросетевых моделей динамики [Текст] / А.Ф. Рогачев, М.Г. Шубнов // Известия Нижневолжского агроуниверситетского комплекса: наука и высшее профессиональное образование. - 2012. - № 4. - С. 226-231.
6. Рогачев, А.Ф., Математическое моделирование экономической динамики в аграрном производстве [Текст] : монография / А.Ф. Рогачев. - Волгоград: Изд-во Волгоградского ГАУ, 2014. - 172 с.
7. Тихонов, Э.Е. Методы прогнозирования в условиях рынка [Текст] : учебное пособие / Э.Е. Тихонов. - Невинномысск, 2006. - 221 с.
8. Черний, О. Нейронные сети на Javascript [Электронный ресурс] / О. Черний. - 2016. - Дата обновления: 01.07.2016. - Режим доступа : https://habrahabr.ru/post/304414/ (дата обращения: 25.10.2017).
9. Papa Parse - Powerful CSV Parser for JavaScript [Электронный ресурс]. - Режим доступа: http://papaparse.com (дата обращения: 25.10.2017).
10. Simple feed-forward neural network in JavaScript [Электронный ресурс]. 2014. Дата обновления: 20.10.2017. - Режим доступа: https://github.com/BrainJS/brain.js (дата обращения: 25.10.2017).
11. Rogachev, A.F. Economic and Mathematical Modeling of Food Security Level in View of Import Substitution // Asian Social Science Vol. 11, No. 20, 2015. - P. 178-185.
12. Rogachev, A.F. Manufacturing and Consumption of Agricultural Products as a Tool of Food Security Management in Russia / Rogachev, A.F., Shokhnekh, A.V., Mazaeva, T.I. // REVISTA GALEGA DE ECONOMiA (RGE) Vol. 25-2. July-December - 2016.

Источник: "Известия нижневолжского агроуниверситетского комплекса" № 2 (50), 2018


Категория: Сельское и приусадебное хозяйство | Добавил: x5443 (13.05.2019)
Просмотров: 20 | Теги: урожайность | Рейтинг: 0.0/0
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
...




Copyright MyCorp © 2019 Обратная связь