МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И ПОСТРОЕНИЕ ЛИНИЙ ТРЕНДА (на примере анализа временных рядов к коммунальным услугам)

XIV Международный конкурс научно-исследовательских и творческих работ учащихся
Старт в науке

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И ПОСТРОЕНИЕ ЛИНИЙ ТРЕНДА (на примере анализа временных рядов к коммунальным услугам)

Асадуллин Я.Р. 1Сенокосов С.С. 1
1МАОУ Политехническая гимназия
Киселёв Н.В. 1Широков М.С. 2
1МАОУ Политехническая гимназия
2ЧОУ Православная гимназия № 11
Автор работы награжден дипломом победителя II степени
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

ВВЕДЕНИЕ

В начале ХХ века, в эпоху становления и развития теория Чарльза Генри Доу послужила началом технического анализа. В те времена наклонные трендовые линии (наравне с горизонтальными линиями) были единственным инструментом, который позволял провести анализ рынка. Спустя более сотни лет этот инструмент не утратил своей популярности.

Линии тренда в современном мире затрагивают такие области, как торговля на бирже, промышленная автоматика, интернет сети, математика и многое другое. Они помогают в прогнозировании, показе роста того или иного продукта.

Мы решили изучить этот инструмент для того, провести диаграммы временных рядов и оплат коммунальных услуг, введение его в диаграммы и проведения прогноза роста или падения цен на оплату коммунальных услуг на ближайшие месяцы.

Актуальность. Анализ интернет-источников показал, что на сегодняшний день не существует сервисов для произведения прогноза поведения цен на коммунальные услуги. Существует только “Прогноз долгосрочного социально-экономического развития Российской Федерации на период до 2030 года”, разработанный Минэкономразвития России, в который включён “Прогноз роста тарифов на товары (услуги) инфраструктурных компаний для населения и тарифов на услуги организаций ЖКХ в 2016 - 2030 гг.”, для создания которого было использовано огромное количество разных факторов [12].

При изучении литературы мы столкнулись с проблемой. В данном документе показан прогноз только в целом по России, а не для отдельной семьи. При этом существует сервис "Planetcalc" - каталог онлайн калькуляторов, в котором есть калькулятор аппроксимаций функций одной прямой, включающий в себя большое количество различных аппроксимаций. Но сервис не оптимизирован под коммунальные услуги, да и в целом у него есть некоторые недостатки, о которых мы расскажем в данной работе [8].

Объект исследования: экономическое прогнозирование с помощью линий тренда.

Предмет исследования: особенности прогнозирования с помощью линии тренда поведения цен на коммунальные услуги.

Целью нашего исследования стало создание калькулятора, способного составлять прогноз поведения цен на коммунальные услуги.

Задачи:

Изучить тематическую литературу;

На основе выбранных данных провести анализ, с помощью метода моделирования выявить оптимальную линию тренда, наиболее точно описывающую изменение направления тренда;

Составить прогноз с использованием выбранной линии тренда;

Разработать калькулятор для прогнозирования поведения цен на коммунальные услуги.

Гипотеза: мы предполагаем, что самым оптимальным вариантом для прогнозирования поведения цен на коммунальные услуги будет использование полиномиальной линии тренда т.к. она используется для описания величин попеременно возрастающих и убывающих, и необходима для анализа большого набора данных о нестабильной величине (которой коммунальные услуги и являются).

Методы исследования: анализ теоретического материала, статистический метод, метод визуализации данных, моделирование, качественный эксперимент.

ГЛАВА 1. ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОЙ ЛИНИИ ТРЕНДА ДЛЯ ПОКАЗАТЕЛЕЙ СФЕРЫ КОММУНАЛЬНЫХ УСЛУГ

1.1. Определение линии тренда, её виды и применение в различных сферах

Линии тренда — элемент аппарата технического анализа, используемый для выявления тенденций изменения цен на различных видах бирж [9].

Линии тренда представляют собой геометрическое отображение средних значений анализируемых показателей, полученное с помощью какой-либо математической функции. Выбор функции для построения линии тренда обычно определяется характером изменения данных во времени.

Выделяют три типа трендов [6]:

«бычий» (растущий) — цены растут (от сравнения с быком, который поднимает рогами вверх);

«медвежий» (падающий) — цены падают (от сравнения с медведем, который бьет лапой вниз);

«флэт» (боковой) — цены находятся в ценовых диапазонах. Как правило, консолидация происходит перед последующим ростом или падением.

Тенденции на рынке также можно классифицировать по времени существования. Чаще всего выделяют три вида [6]:

долгосрочный (первичный или основной) тренд — длится от года до двух лет. Данная тенденция важна для крупных рыночных игроков и инвесторов.

среднесрочный (вторичный или промежуточный) тренд — длится от 1 до 6 месяцев. Он является коррекционным и идет в разрез основному тренду.

краткосрочный тренд — длится от одной недели до месяца, состоит из небольших колебаний (движений), может идти в разрез среднесрочному тренду, не всегда поддается техническому анализу и зависит от многих (иногда случайных) событий.

Линейная аппроксимация

Линейная аппроксимация — это прямая линия, наилучшим образом описывающая набор данных. Она применяется в самых простых случаях, когда точки данных расположены близко к прямой. Говоря другими словами, линейная аппроксимация хороша для величины, которая увеличивается или убывает с постоянной скоростью [10].

Формула: " y=ax+b", где:

b – то нулевой коэффициент регрессии, который показывает значение y, при отсутствии влияния объясняющего фактора (x=0),

a – коэффициент регрессии, который показывает, насколько исследуемый показатель y зависит от влияющего фактора x. Причем, если a>0, то динамика роста положительная. Если а<0, то динамика тренда отрицательная, т.е. например, продажи падают.

Далее для других линий тренда используются константы a и b, они имеют аналогичное значение, но формулы их расчёт для каждой лини тренда свои.

В приведенном ниже примере линейное приближение показывает равномерное увеличение объема продаж холодильников в течение 13 лет (см. рис.1). Следует заметить, что значение R-квадрат в данном случае составляет 0,9036. Это свидетельствует о достаточно хорошем согласовании линии аппроксимации с фактическими данными.

Рис.1. Пример линейной аппроксимации

Логарифмическая аппроксимация

Логарифмическая аппроксимация хорошо описывает величину, которая вначале быстро растет или убывает, а затем постепенно стабилизируется. Описывает как положительные, так и отрицательные величины.

Формула: "y=c*Inx+b", где c и b - константы, ln - функция натурального логарифма [6].

На рисунке 2 приведенный пример использует логарифмическое приближение для иллюстрации прогнозируемого роста популяции животных на ограниченной территории. По мере того, как свободное пространство становится все меньше, темпы роста популяции также снижаются. Следует заметить, что значение R-квадрат в данном примере равно 0,9407. Это указывает на то, что аппроксимирующая кривая описывает данные с достаточно высокой степенью достоверности.

Рис.2. Пример логарифмической аппроксимации

Полиномиальная аппроксимация

Полиномиальная аппроксимация используется для описания величин, попеременно возрастающих и убывающих. Она полезна, например, для анализа большого набора данных о нестабильной величине. Степень полинома определяется количеством экстремумов (максимумов и минимумов) кривой. Полином второй степени может описать только один максимум или минимум. Полином третьей степени имеет один или два экстремума. Полином четвертой степени может иметь не более трех экстремумов.

Формула: " y= b + c1*x + c2*x2  + c3*x3  + ...+ c6*x6", где b, c1, c2 , ... c6 — константы.

Ниже на примере аппроксимации полиномом второго порядка (одна вершина) показана зависимость скорости от потребления топлива (см.рис.3). Следует заметить, что значение R-квадрат в данном случае составляет 0,9474. Это достаточно хорошо согласуется с фактическими данными.

Рис.3. Пример полиномиальной аппроксимации

Степенное приближение

Степенное приближение дает хорошие результаты, если зависимость, которая содержится в данных, характеризуется постоянной скоростью роста. Примером такой зависимости может служить график ускорения автомобиля. Если в данных имеются нулевые или отрицательные значения, использование степенного приближения невозможно [6].

Формула: "y = c * x b", где c и b – константы.

На рисунке 4 показан пример зависимости пройденного расстояния от времени (в секундах). По степенной линии тренда ясно видно увеличение ускорения. Обратите внимание, что значение R-квадрат в данном примере равно 0,9923. Это говорит о высокой точности используемого приближения.

Рис.4. Пример степенного приближения

Линейная фильтрация

Линия тренда скользящего среднего позволяет сгладить колебания данных для более четкого отображения узора или тенденции. Линия тренда скользящего среднего использует определенное количество точек данных, усредняет их и использует среднее значение в качестве точки на линии тренда [6].

В приведенном ниже примере линии тренда скользящего среднего показывают количество проданных домов в течение 26 недель (см. рис.5).

Рис.5. Пример линии тренда скользящего среднего

Экспоненциальное приближение

Экспоненциальное приближение следует использовать в том случае, если скорость изменения данных непрерывно возрастает. Однако для данных, которые содержат нулевые или отрицательные значения, этот вид приближения неприменим [6].

Формула: "y = cebx", где c и b – константы,  e - основание натурального логарифма(число Эйлера).

На приведенном ниже примере экспоненциальное приближение иллюстрирует процесс распада углерода 14 (см. рис.6) . Следует заметить, что значение R-квадрат здесь равно 1, то есть линия приближения идеально соответствует данным.

Рис.6. Пример экспоненциального приближения

1.2. Алгоритм вычисления линии тренда для сферы коммунальных услуг. Прогнозирование

Рассмотрим процесс выявления оптимальной линии тренда на примере показателей сферы коммунальных услуг.

1 шаг. Построение таблиц исходных данных на примере коммунальных услуг и временных рядов

Мы произвели анализ расходов на коммунальные расходы 2 домохозяйств за 2018 и 2019 годы. Получили четыре таблицы с точными расходами (см. таблицы 1;2;3;4) и две таблицы исходных данных (см. таблицы 5, 6), которые мы использовали для составления линий тренда.

Таблица 1

Коммунальные расходы семьи Сенокосовых за 2018 год

Месяц

01.2018

02.2018

03.2018

04.2018

05.2018

06.2018

07.2018

08.2018

09.2018

10.2018

11.2018

Гор.В

1 200,00

1400.40

1485.32

1 500,00

1504.82

1582.06

942.90

1570.81

1 392,00

1380.46

1390.78

Хол.В

619.54

620,00

613.68

617.00

614.24

543.28

543.44

604.66

655.19

625.07

630.12

Електро + ремонт

1200.48

1345.40

1600.78

1678.28

1851.08

1844.53

1700.83

1 654,86

1855.14

1950.25

2446.51

Газ

185,00

185,00

185,00

185,00

205,00

205,00

205,00

205,00

205,00

205,00

205,00

Всего

3 205,02

3 550,80

3 884,78

3 980,28

4 175,14

4 174,87

3 392,17

4 035,33

4 107,33

4 160,78

4 672,41

Таблица 2

Коммунальные расходы семьи Сенокосовых за 2019 год

Месяц

01.2019

02.2019

03.2019

04.2019

05.2019

06.2019

07.2019

08.2019

09.2019

10.2019

11.2019

Гор.В

1400

1200.56

1600.84

1328.54

1500.41

1300.42

1250.84

1425.43

1338.51

1250.63

1400.23

Хол.В

619.54

832.11

754.42

619.54

619.54

619.54

625.07

625.07

625.07

625.07

625.07

Електро + ремонт

2824.64

2651.32

2845.34

2673.82

2433.58

1600.21

1600.21

1604,86

1800.11

2943.54

2846.57

Газ

205

205

205,00

205,00

205,00

205,00

205,00

205,00

205,00

205,00

205,00

Мусор

552

552

552,00

440,00

440,00

440,00

440,00

440,00

440,00

440,00

440,00

Всего

5601,18

5440,99

5957,60

5266,90

5198,53

4165,17

4121,12

4300,36

4408,69

5464,24

5516,87

Таблица 3

Коммунальные расходы семьи Гусевых за 2018 год

Месяц

01.2018

02.2018

03.2018

04.2018

05.2018

06.2018

07.2018

08.2018

09.2018

10.2018

11.2018

Гор.В

1559.12

984.50

850.07

1550,00

1493,17

1493,17

701,72

843,90

850,75

1749,36

2626,73

Хол.В

584.9

300.46

203.20

483,30

584,10

386,86

200,00

451,44

494,00

453,26

601,71

Електро + ремонт

947.18

400.24

1470,51

1385,28

1400,05

1245,40

700,63

721,90

776,90

1567,44

2810,93

Газ

155.00

155.00

155.00

155.00

155.00

155.00

155,00

155.00

155.00

155.00

155.00

Всего

3246,20

1840,20

2678,78

3573,58

3632,32

3288,43

1757,35

2172,24

2276,65

3925,06

6094,37

Таблица 4

Коммунальные расходы семьи Гусевых за 2019 год

Месяц

01.2019

02.2019

03.2019

04.2019

05.2019

06.2019

07.2019

08.2019

09.2019

10.2019

11.2019

Гор.В

2768.97

1359,91

1329,97

1422,00

1702,18

904,85

904,85

973,32

1300,32

1665,16

1610,90

Хол.В

1594,31

395,08

625,52

1300,00

661,04

453,60

453,60

704,16

404,00

405,93

407,88

Електро + ремонт

4020,82

647,26

652,60

1795,78

1201,80

1328,8

1328,85

1713,32

1656,67

2200,74

2520,76

Газ

155.00

155.00

155.00

155.00

175,00

175,00

175,00

175,00

175,00

175,00

175,00

Мусор

380,00

380,00

380,00

204,00

204,00

204,00

204,00

204,00

204,00

204,00

204,00

Всего

8919,10

2937,25

3143,09

4876,78

3944,02

3066,03

3066,30

3769,80

3739,99

4650,83

4918,54

Таблица 5

Сводная таблица коммунальных расходов двух семей за 2018 год

Месяц

01.2018

02.2018

03.2018

04.2018

05.2018

06.2018

07.2018

08.2018

09.2018

10.2018

11.2018

Гусевы

3246,20

1840,20

2678,78

3573,58

3632,32

3288,43

1757,35

2172,24

2276,65

3925,06

6094,37

Сенокосовы

3 205,02

3 550,80

3 884,78

3 980,28

4 175,14

4 174,87

3 392,17

4 035,33

4 107,33

4 160,78

4 672,41

Таблица 6

Сводная таблица коммунальных расходов двух семей за 2019 год

Месяц

01.2019

02.2019

03.2019

04.2019

05.2019

06.2019

07.2019

08.2019

09.2019

10.2019

11.2019

Гусевы

8919,10

2937,25

3143,09

4876,78

3944,02

3066,03

3066,30

3769,80

3739,99

4650,83

4918,54

Сенокосовы

5601,18

5440,99

5957,60

5266,90

5198,53

4165,17

4121,12

4300,36

4408,69

5464,24

5516,87

2 шаг. Построение диаграммы исходных данных и введение в нее линий тренда

Проанализировав таблицы исходных данных, мы построили многоточечную диаграмму (см. рис.7). На оси Y изображены затраты на коммунальные услуги. На оси X изображены временные ряды, во время которых была произведена оплата коммунальных услуг. Красной точкой обозначена оплата за коммунальные расходы в той или иной месяц у семьи Сенокосовых. Синей точкой обозначена оплата за коммунальные расходы в той или иной месяц у семьи Гусевых[11].

Рис.7. Многоточечная диаграмма

3 шаг. Введение в диаграмму линии тренда

Для введения линий тренда в диаграмму мы используем метод аппроксимации.

Аппроксимация — научный метод, состоящий в замене одних объектов другими, в каком-то смысле близкими к исходным, но более простыми [4, 5].

Для сравнения объективности той или иной линии мы вычисляли коэффициент детерминации для каждой кривой.

Коэффициент детерминации — это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными. Более точно — это единица минус доля необъяснённой дисперсии в дисперсии зависимой переменной [2,3].

После построение таблиц исходных данных и диаграммы, основанной на них, мы преступили к введению линий тренда.

Для определения искомого значения y, всё, что нам нужно сделать – это увеличить значение x на такое количество рядов, на сколько нам нужно сделать прогноз. Но не стоит забывать, что эффективным прогноз с помощью экстраполяции (переносе выводов, сделанных относительно какой-либо части объектов или явлений) через линию тренда может быть, если период прогнозирования не превышает 30% от анализируемой базы периодов [13]. 

Поэтому нами был сделан прогноз только на 3 временных периода, поскольку с каждым временным периодом прогноз становится менее правдоподобным. В итоге, после того как мы разобрались в принципе построение прогноза, мы приступили к его построению. Подробнее рассмотрим полученные результаты на примерах введения каждого их трендов.

Линейный тренд

Для введения линейного тренда мы использовали соответствующую формулу: " y=ax+b". При её выводе мы видим, что она стартует из начальной точки и продолжается до последней, показывая относительный рост показателей (см. рис.8). Это подходит для того, чтобы показать общий рост, но не очень пригодно для очень точных расчётов, которые нам и нужны.

И коэффициент детерминации R2 в случае с показаниями семьи Сенокосовых равен 0.41, в случае с Гусевыми - 0.11, - что очень мало (чем ближе к единице тем значение точнее.

Рис.8. Введение в диаграмму линейного тренда

Логарифмический тренд

Затем мы решили ввести логарифмическую линию тренда, используя формулу: "y=c*Inx+b". Линия начинается в точке 1. Затем начинает видоизменятся в точке 2 и до дочки 6, где она растёт с одной скоростью (см.рис.9).

Коэффициент детерминации R2 в случае с показаниями семьи Сенокосовых равен 0.46, в случае с показаниями семьи Гусевых - 0.12, что также очень мало и не подходит для нашей задачи.

Рис.9. Введение в диаграмму логарифмического тренда

Полиномиальный тренд

После мы ввели полиномиальный тренд, используя формулу: " y= b + c1*x + c2*x2  + c3*x3  + ...+ c6*x6". Линии стартуют в точке и постоянно меняют направление: то повышаясь, то понижаясь (см. рис.10).

Мы использовали шестую степень полинома, так-так, чем выше степень, тем значение R2 больше, соответственно и точнее. Шестая степень - максимальная в Microsoft Excel, но в LibreOffice calc это значение возрастает до 21.

И коэффициент детерминации R2 в случае с показаниями семьи Сенокосовых равен 0.82, в случае с Гусевыми - 0.34 - маленькая величина второй линии. Скорее всего она связана, с тем, что значения очень разнятся, в отличие от первой, где они более спокойные.

Рис.10. Введение в диаграмму полиномиального тренда

Степенной тренд

Затем мы построили диаграмму со степенным трендом, его формула: "y = c * x b". Он начинается в точке 1, в точке 2 начинает видоизменятся вплоть до точки 6, и дальше изменяется практически с одной скоростью (см. рис.11).

И коэффициент детерминации R2 в случае с показаниями семьи Сенокосовых равен 0.51, в случае с Гусевыми - 0.16, - лучше, чем у других, но меньше, чем у полиномиального тренда.

Рис.11. Введение в диаграмму степенного тренда

Экспоненциальный тренд

Наконец, остался экспоненциальный тренд, его формула: "y = cebx". Он начинается в точке 1 и изменяется вплоть до его конца с относительной скоростью роста (см.рис. 12).

Коэффициент детерминации R2 в случае с показаниями семьи Сенокосовых равен 0.44, в случае с Гусевыми - 0.18, - лучше, но тоже очень мало.

Рис.12. Введение в диаграмму экспоненциального тренда

4 шаг. Сравнение и анализ

После введения в диаграмму пяти линий тренда мы получили следующие результаты (см. таблица 7) [1, 3].

Таблица 7

Семья

R2линейного Тренда

R2логарифм. Тренда

R2полином. тренда

R2экспонен.тренда

R2степенного тренда

Сенокосвы

0,41

0,46

0,82

0,44

0,51

Гусевы

0,11

0,12

0,34

0,18

0,16

Из таблицы коэффициентов мы увидели, что самым точным (соответственно и лучшим) был полиномиальный тренд, так как его коэффициент детерминации R2 был наибольшим из всех других.

5 шаг. Прогнозирование

Поскольку мы выявили, что использование полиномиального тренда будет самым оптимальным и логичным для построения прогноза, он лёг в основу прогнозирования поведения цен на коммунальные услуги.

На рисунке 13 мы представили прогноз на 3 месяца вперёд для двух семей.
Несмотря на то, что прогнозирование для семьи Гусевых ушло в отрицательные значения (скорее всего это получилось из-за того, что коэффициент детерминации для них и так был очень мал - 0,3354), при этом мы полностью можем доверять прогнозу для семьи Сенокосовых, так как коэффициент детерминации чуть меньше, чем 0,85. Это значение принято считать достоверным.

Рис. 13. Прогнозирование

Итак, в этой главе мы изучили линии тренда как элемент аппарата технического анализа, показали различные виды линий тренда, формулы, по которым они строятся, примеры использования линий тренда в различных сферах жизни. Так же, описали в каких случаях лучше использовать ту или иную аппроксимацию. Объяснили понятие коэффициента детерминации и его назначение при построении линий тренда и при выборе более точной аппроксимации. Провели анализ коммунальных услуг за 2018 и 2019 года, затем на их основе построили таблицы исходных данных и диаграмму зависимости показаний от времени. Далее, вводя в диаграмму линейный, логарифмический, полиномиальный, экспоненциальный, степенной тренды, определили, что самым оптимальным является полиномиальный тренд.

ГЛАВА 2. СОЗДАНИЕ КАЛЬКУЛЯТОРА ДЛЯ ПРОГНОЗИРОВАНИЯ ПОВЕДЕНИЯ ЦЕН НА КОММУНАЛЬНЫЕ УСЛУГИ

2.1. Особенности разработки приложения "Калькулятор" для прогнозирования поведения цен на коммунальные услуги

Вот уже более трёх лет мы занимаемся робототехникой, но последние два года мы углубились в изучение языков программирование. Поэтому и идея по созданию калькулятора была одной из первых, когда мы подошли к началу работы над проектом.

Подробно расскажем об особенностях разработки приложения. На рисунке 14 представлен интерфейс калькулятора.

Весь интерфейс калькулятора представлен десятью кнопками ввода цифр, кнопкой ввода точки для вещественных чисел, пробелом и кнопкой ввода:

Рис.14. Интерфейс калькулятора

Калькулятор написан на языке программирования Python 3.8, с использованием следующих библиотек:

Tkinter - графический интерфейс;

Scikit-learn, Numpy - вся математическая часть (создание полиномиальной аппроксимации, составление прогноза);

Matplotlib - построение графиков и диаграмм.

Весь код калькулятора представлен в 2 файлах: prediction.py, com_rost.py. Первый файл - создания прогноза, построение графика, второй – рабочий интерфейс калькулятора. На рисунке 15 представлен скриншот части кода интерфейса.

Рис.15. Часть кода интерфейса.

Весь алгоритм работы калькулятора представлен в следующих шагах:

Ввод данных через пробел в окошко ввода в калькуляторе. Просто введите данные, на которые нужно сделать прогноз в окошко ввода данных через пробел. Для ввода вещественных чисел используйте точку;

Произведение вычислений. После ввода данных нажмите на кнопку “ввод”. Данные, которые вы ввели, попадут в файл “data.txt”, для дальнейшего использования, как данные для прогнозирования.

Рис.16. Кнопка "Ввод"

Произведение прогноза. Затем калькулятор принимает данные из файла, и производить аппроксимирование данных, на основе которых делается прогноз на один временной ряд, представленный в виде красной точки на диаграмме. Результат прогноза показан на рисунке 17.

Рис.17. Проведение прогноза

2.2. Условия и возможности использования калькулятора для прогнозирования поведения цен на коммунальные услуги

Сейчас из-за низкого уровня финансовой грамотности в России (9 место среди стран G20), многие люди просто не умеют формировать семейный бюджет и рассчитывать ежемесячные затраты, из-за чего люди собирают огромные кредиты и уходят в кредитную яму.

Поэтому мы и хотим помочь людям, показав какие расходы они будут иметь хотя бы в следующем месяце, при этом людям не придётся обладать никакими техническими навыками, потому что мы сделали простой интерфейс, который будет понятен даже ребёнку.

Но мы понимаем, что вводить такие огромные данные обычному человеку просто неудобно, да и в общем, не всегда является возможным. Поэтому перспективой в этом проекте (кроме доработки калькулятора), стало предложение ЖЭКу использовать наш калькулятор, в качестве сервиса для прогнозирования затрат на коммунальные услуги и добавление его в квитанции.

Делать прогнозирование ЖЭКу гораздо удобнее и проще, потому что данные о затратах на коммунальные услуги у них присутствуют в электронных базах данных, и им не нужно вручную вписывать данные с квитанций. Тем более, если у клиентов управляющих компаний будет информация о будущих затратах, то они будут примерно понимать, какую сумму им отложить на следующий месяц и не останутся в должниках у ЖЭКа. Кроме того, код нашего калькулятора находится в свободном доступе, и любой разбирающийся в Data Science человек может использовать его.

Наш калькулятор – не единственный сервис для прогнозирования. Кроме всем известного Microsoft Excel, в ходе анализа интернет источников мы нашли сервис "Planetcalc", в котором есть калькулятор аппроксимаций функций одной прямой, включающий в себя большое количество различных аппроксимаций. Мы провели анализ возможностей нашего калькулятора и двух других сервисов. Результаты анализа представили в таблице 8.

Таблица 8

Сравнительный анализ сервисов по прогнозированию

Приложение

Цена

Оптимизация под задачу

Навыки для работы

Калькулятор

Бесплатно

Малая оптимизация.

В последующих версиях сглаживанию и учёту сезонности будет уделено большее внимание

Не требуются.

"Planetcalc"

Бесплатно

Не оптимизирован.

Базовые

навыки работы с браузером

Microsoft Excel

2400 рублей.

Цены варьируются.

Покупка только с пакетом программ Microsoft Office.

При наличии технический знаний преобразование данных займёт > 10 минут.

Определённые технические навыки работы с программой "Excel".

Из таблицы видно, что самым оптимальным вариантом составления прогноза является наш калькулятор с учётом дальнейшей его доработки. Для более точного прогнозирования мы не учли несколько факторов: сезонность и неожиданные выбросы. Нам хорошо известно, что зимой стоимость коммунальных услуг выше, чем летом. А неожиданные факторы могут проявляться, например, в виде смены поставщика какой-либо из коммунальных услуг, что может привести либо к завышению, либо понижению цены.

Так же в дизайне калькулятора отсутствует клавиша стирания лишних символов, написанных случайно. Эту версию калькулятора можно считать самой первой и недоработанной. Например, если добавить лишнюю запятую во время ввода данных, программа выдаст ошибку, и для дальнейшего использования калькулятора нужно совершить перезагрузку.

В перспективе наш калькулятор может использовать ЖЭК для представления прогноза в своих квитанциях. Такая информация окажется полезной особенно для людей, имеющих кредиты и испытывающие острую необходимость в планировании своего бюджета.

Таким образом, во второй главе мы подробно описали особенности создания приложения "Калькулятор" для прогнозирования поведения цен на коммунальные услуги, возможности его применения, а также проанализировали его преимущества и недостатки перед другими программами.

ЗАКЛЮЧЕНИЕ

Подводя итог о проделанной работе, хотелось бы отметить, что нам удалось изучить теоретические аспекты данного вопроса, провести анализ коммунальных услуг за 2018 и 2019 года, затем на их основе построить таблицы исходных данных и диаграмму зависимости показаний от времени. Далее, вводя в диаграмму линейный, логарифмический, полиномиальный, экспоненциальный, степенной тренды, мы увидели, что самым точным (соответственно и лучшим) был полиномиальный тренд, так как его коэффициент детерминации R2 был наибольшим из всех других. Соответственно гипотеза подтвердилась.

Также мы попробовали составить прогноз поведения цен на коммунальные услуги и наткнулись на то, что данные, полученные нами, оказались в отрицательном диапазоне. Это говорит о том, что, когда данные действительно сильно разнятся, даже такой инструмент, как линии тренда, который действительно очень точен для некоторый случаев прогнозирования, может давать недостоверные значения. При этом не стоит забывать, что иногда мы делаем некоторые переплаты за коммунальные услуги и управляющие компании остаются нашими "должниками". Еще для более достоверного прогноза необходимо учитывать сезонность, ведь зимой затраты на коммунальные услуги значительно выше чем летом.

На основе выбранного тренда мы разработали калькулятор, который позволяет составлять прогноз поведения цен для коммунальной сферы услуг. В основе алгоритма работы калькулятора лежит построение линии тренда и прогнозирование с помощью метода экстраполяции.

Перспектива с продвижением нашего проекта как отдельную услугу ЖЭК очень важна и значима, но мы понимаем, что кроме этого у нашего калькулятора есть некоторые недочёты. Для работы с данными для начала нужно сгладить их, а также учесть сезонность данных. В таком случае прогноз будет более точным.

ЛИТЕРАТУРА

Патрик Микула. Лучшие методы линий тренда Алана Эндрюса плюс пять новых техник/ Mikula Forecasting Co (ENG) / На русском не издавалась, 2002. - 80 с.

Решение задач эконометрики в excel/ Воскобойников Ю.Е., Воскобойникова Т.Н.// Новосибирск, 206. - 107.

Эконометрика/Шалабанов А.К., Роганов Д.А// Учебно-методическое пособие. Казань, 2008. - 203 с.

Аппроксимация [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/%D0%90%D0%BF%D0%BF%D1%80%D0%BE%D0%BA%D1%81%D0%B8%D0%BC%D0%B0%D1%86%D0%B8%D1%8F.

Аппроксимация функции с помощью линии тренда [Электронный ресурс] - Режим доступа: https://vshot.ru/it-ebook/a10.html.

Виды (типы) линии тренда [Электронный ресурс] - Режим доступа: https://megaobuchalka.ru/7/37073.html.

Выбор наилучшей линии тренда для данных [Электронный ресурс] - Режим доступа: https://support.office.com/ru-ru/article/%D0%92%D1%8B%D0%B1%D0%BE%D1%80-%D0%BD%D0%B0%D0%B8%D0%BB%D1%83%D1%87%D1%88%D0%B5%D0%B9-%D0%BB%D0%B8%D0%BD%D0%B8%D0%B8-%D1%82%D1%80%D0%B5%D0%BD%D0%B4%D0%B0-%D0%B4%D0%BB%D1%8F-%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85-1bb3c9e7-0280-45b5-9ab0-d0c93161daa8.

Каталог онлайн калькуляторов [Электронный ресурс] - Режим доступа: https://planetcalc.ru/.

Линии тренда [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/%D0%9B%D0%B8%D0%BD%D0%B8%D0%B8_%D1%82%D1%80%D0%B5%D0%BD%D0%B4%D0%B0.

О линейном тренде [Электронный ресурс] - Режим доступа: https://4analytics.ru/trendi/o-lineienom-trende.html.

Построение линии тренда в excel [Электронный ресурс] - Режим доступа: http://ya-znau.ru/znaniya/zn/202.

Прогноз долгосрочного социально-экономического развития Российской Федерации на период до 2030 года (разработан Минэкономразвития России) [Электронный ресурс] - Режим доступа: http://www.consultant.ru/document/cons_doc_LAW_144190/.

Трендовые линии – как правильно строить их на графике и использовать в торговле на Форекс? [Электронный ресурс] - Режим доступа:http://tradelife.ru/trendovye-linii-kak-pravilno-stroit-ih-na-grafike-i-ispolzovat-v-torgovle-na-foreks.

Просмотров работы: 123