Издательство СО РАН

Издательство СО РАН

Адрес Издательства СО РАН: Россия, 630090, а/я 187
Новосибирск, Морской пр., 2

soran2.gif

Baner_Nauka_Sibiri.jpg


Яндекс.Метрика

Поиск по журналу

Вестник НГУЭУ

2020 год, номер 3

ИМПУТАЦИЯ ДАННЫХ МУНИЦИПАЛЬНОЙ СТАТИСТИКИ

Т.Б. Скрипкина
Новосибирский государственный университет экономики и управления «НИНХ», Новосибирск, Российская Федерация
t.b.skripkina@nsuem.ru
Ключевые слова: импутация статистических данных, восстановление пропусков данных, муниципальная статистика, метод K ближайших соседей, критерий согласия Пирсона, imputation of statistical data, restoration of data omissions, municipal statistics, K nearest neighbor method, Pearson's consent criterion
Страницы: 277-286

Аннотация

Рассмотрена ключевая проблема проведения статистического анализа на массиве данных муниципальной статистики: наличие существенного количества пропущенных данных. Приведено понятие и виды импутации данных. Обосновано применение метода K ближайших соседей для проведения импутации на этапе использования данных официальной статистики, содержащихся в Базе данных показателей муниципальных образований. Предложен авторский алгоритм восстановления пропусков в массиве данных показателей муниципальной статистики с использованием системы STATISTICA . Верификация результатов импутации проведена путем сравнения распределений исходных и восстановленных данных на основе критерия согласия Пирсона .