Мониторинг: методики, модели, оценки
9 Методики анализа
9.1 Общие положения
Так как для описания трафика используется модель временного ряда, то основные ожидаемые результаты анализа сводятся к возможностям идентификации этой модели, то есть декомпозиции ряда на детерминированную и случайную компоненту. При подборе адекватной модели ряда, на ее базе возможно осуществление прогнозов на различные сроки.
Укажем основные черты моделей временных рядов, описывающих трафик, необходимые статистические инструменты для их анализа и возможные результаты анализа.
Характерными чертами моделей временных рядов трафиков является их нестационарность. При этом детерминированная компонента трафика как правило включает тренд (плавный рост (падение), обусловленный долговременными причинами), различные сезонные компоненты (то есть колебание в течении суток, недели, месяца года), циклические компоненты (нерегулярные подъемы и спады с различной периодичностью и интенсивностью), а так же интервенции (то есть резкие изменения в условиях функционирования сети). Ниже мы более подробно остановимся на каждой из этих компонент. Другим характерным отклонением от стационарности является изменение дисперсии (разброса) наблюдений значений трафика в течении суток. Этот эффект особенно ярко проявляется у каналов, загруженность которых в определенное время суток выходит на максимум. При этом значения загрузки канала становятся равными его пропускной способности и при достаточном числе пользователей (при наличии очереди) и не изменяются в течении длительного времени (от нескольких часов до большей части суток).Взаимодействие и наложение друг на друга всех перечисленных выше эффектов делает задачу анализа трафика довольно сложной, требующей как высокой квалификации аналитика, так и специфических статистических процедур, устойчивых к различным выбросам и отклонениям от модельных предположений.
Остановимся более подробно на смысле, особенностях и причинах возникновения различных компонент в модели трафика, а так же возможных методах их идентификации.
Тренд. Эта компонента трафика показывает развитие загрузки канала в течении времени. Она обычно задается в виде достаточно простой аналитической зависимости. Ее наличие в трафике связано с объективным процессом развития телекоммуникационных технологий, увеличением числа абонентов сети, совершенствованием средств телекоммуникационного доступа и т.п. Именно на базе этой компоненты трафика можно осуществлять долговременный прогноз загрузки канала.На разных стадиях развития канала можно использовать различные модели тренда: линейные, полиномиальные, экспоненциальные, S-образные (логистические, Гомперца) и др.
Наиболее адекватно описывают развитие трафика на всем его протяжении именно S-образные кривые, у которых период медленного роста на начальном этапе (ввод канала, отладочные работы, начало формирования сети пользователей), сменяется убыстряющемся, интенсивным ростом на средней стадии (этап начала активной работы достаточно разветвленной сети с многочисленными пользователями), и, наконец, затуханием темпов роста трафика с выходом на полную загрузку сети в течении всех суток (этот этап свидетельствует о необходимости увеличения объема канала или принятия других кардинальных решений, так как происходит реальное снижение качества телекоммуникационных услуг и канал не способен обеспечивать работу новых пользователей).
В качестве методов оценки моделей тренда можно использовать устойчивые методы регрессионного анализа. При использовании стандартного метода наименьших квадратов следует соблюдать крайнюю осторожность, обращая особое внимание на наличие незначительного числа нехарактерных значений.
Сезонная компонента трафика. Эта компонента возникает за счет цикличности присущей человеческой деятельности. Анализ трафика канала в течении суток обычно показывает наличие спада загрузки канала в ночные часы. Величина этого падения даже для развитых сетей может быть почти что вдвое. Иногда может наблюдаться и два заметных спада трафика в различное время суток. Анализ трафика канала в течении недели показывает спад загрузки канала в выходные дни. На настоящем этапе это связано с тем, что в России развитие сетевых услуг развивается пока прежде всего по производственному принципу.