Мониторинг: методики, модели, оценки
6.2 Среднечасовые многодневные трафики
Рассматривать многодневные трафики на базе исходных рядов довольно неудобно, так как ряды получаются весьма длинными и излишне детализированными. В таких рядах короткие случайные падения или всплески загрузки канала могут довольно сильно искажать общее впечатление от поведения трафика. Для описания многодневных трафиков представляется целесообразным переход к показателю среднечасовой загрузки канала (или медиане часа). Устраняя излишнюю детализацию, процедура перехода к среднечасовым данным, имеет ряд статистических преимуществ. Во-первых, среднечасовой показатель более устойчив, чем первоначальный четырехминутный. Во-вторых, вероятностное распределение среднечасового показателя в силу центральной предельной теоремы теории вероятностей ближе к гауссовскому распределению, чем у исходных данных, что весьма важно для построения дальнейших выводов. Наконец, корреляция соседних среднечасовых показателей ниже, чем у исходных данных.
Покажем на примере конкретных графиков, как выглядит переход от первичных данных загрузки канала к показателям среднечасовой нагрузки. На рис.6 приведены графики исходных данных трафика семи последовательных дней недели по выходу (Output) канала Москва-Новосибирск c 23 по 29 сентября 1996 г. На рис.7 приведен график среднечасового трафика за неделю для данных рис.6. На нем хорошо прослеживаются колебания загрузки канала в различные часы суток.
Осуществив переход к среднечасовым показателям трафика, легко получить представление о том, как изменяется трафик в течении нескольких месяцев. На рис.8 приведен среднечасовой трафик входа (Input) канала Москва-Новосибирск за 10 последовательных недель (с 5 августа по 13 октября 1996 г.). На рис.9 приведен среднечасовой трафик выхода канала Москва-Новосибирск за тот же период времени.
Трафик на рис.8 иллюстрирует среднезагруженный канал, а трафик на рис.9 показывает сильнозагруженный канал.
Рис.6. Трафик семи последовательных дней недели канала Москва-Новосибирск (Output).
Рис.7. Трафик семи последовательных дней недели канала Москва-Новосибирск (Output).
Одним из наиболее интересных практических вопросов является анализ тенденции изменения трафика. Визуальный просмотр полученных трафиков не позволяет с первого взгляда сделать определенного вывода о росте или снижении общей загрузки каналов. Это связано с тем, что колебания трафика в различные часы суток и, возможно, дни недели скрывают возможный рост загрузки канала. Тем более, что за рассматриваемый двухмесячный срок подобный рост загрузки (или падение) могут быть не очень значительными. (В более общей постановке задачи следует учитывать колебания загрузки, вызванные различными месяцами года. Этот явление хорошо известно, например, для трафиков междугородных телефонных сообщений. Однако для оценки подобного эффекта необходимы данные
, по крайней мере, за несколько лет. Такими данными в области трафиков компьютерных сетей авторы пока не располагают.) Более внимательное рассмотрение графиков 8 и 9 однако позволяет предположить, что определенный рост загрузки канала со временем все же присутствует. Так из графика 9 видно, что загрузка выхода канала с течением времени все больше и больше времени находится на максимальной емкости канала. Об этом говорят ярко выраженные максимальные "полки" в последние две недели. Для графика на рис.8 видно, что если в первые рассматриваемые недели среднечасовая загрузка редко достигала 75 кбит/с, то в последние недели она начинает подниматься до 100 и выше кбит/с.Рис.8 Среднечасовой трафик десяти последовательных недель канала Москва-Новосибирск (Input)
Рис.9. Среднечасовой трафик десяти последовательных недель
канала Москва-Новосибирск (Output)Для выяснения, насколько подобные первые впечатления соответствуют действительности, необходим довольно сложный и детальный статистический анализ. Он должен включать в себя выявление и устранение сезонных эффектов трафика. Последнее может рассматриваться как самостоятельная задача, которую мы будем именовать построением "профиля суток" и "профиля недели". Практическое использование подобных профилей хорошо известно в практике междугородных телефонных разговоров, когда оплата за разговор варьируется в зависимости от времени суток. Назначение этой меры - общее увеличение суточного объема трафика за счет перевода части абонентов с загруженных часов, когда они все равно не могут дозвониться, на относительно свободные часы. Более подробно вопросы выделения сезонных компонент будут рассмотрены ниже.
Учитывая присущие трафику естественные кратковременные спады, которые со статистической точки зрения характеризуются как "выбросы" или "нехарактерные наблюдения" при автоматическом анализе трафика целесообразно использовать устойчивые методы оценки трендов. Так результаты расчетов динамики трафика по отдельным каналам показали, что реальная скорость роста объема трафика может быть занижена вдвое при использовании стандартных (неустойчивых) процедур статистического анализа.