Задачи эссе предполагают использование данных уровня домохозяйства для построения моделей. Такие данные собираются Госкомстатом России в рамках выборочных обследований, а также в рамках специальных проектов (например, «Российский мониторинг экономики и здоровья», RLMS). Данное исследование будет построено на данных выборочного опроса RLMS. Выборка репрезентирует население России.
Объем выборки 4711 домохозяйств. Данные собирались по формализованной анкете (опроснику). Данные содержат богатую базу для различного моделирования.
База данных, которая будет использоваться для моделирования, содержит много переменных. Наиболее интересующими для нас являются переменные, которые позволяют выявить наличие тех или иных ТДП, такие как наличие ПК, стиральной машины и т.д., а также переменные, которые могут влиять/определять наличие ТДП у домохозяйств. Доходы, количество человек в семье, число источников домохозяйства и проч.
Не все переменные будут представлены в анализе так, как они представлены в исходной базе данных. Дело в том, что некоторые переменные нуждаются в преобразовании, а некоторые – в вычислении заново. Так, например, данные о месте проживания домохозяйства я преобразовала в двоичную переменную город=1/село=0, тогда как исходная переменная содержала 4 градации (в части анализа это показано). Это выгодно, т.к. мне требовалось включить эту переменную в регрессионную модель, а это допускается лишь для количественных, или для двоичных переменных. А число источников доходов я вообще считала по нескольким переменным, где респонденту предлагался целый спектр источников доходов и предлагалось согласиться или не согласиться что очередной источник доходов используется семьей респондента.
Всего в вычислениях задействовано более 30 переменных. Это отражено в синтаксисе (см. приложение).
Пример самой базы данных представлен в следующей таблице:
Пример базы данных
Имя перем. Номер семьи |
iid_h |
Ic9.1a |
Ic9.1b |
… |
indexTDP1 |
… |
1 |
10101 |
1 |
8 |
… |
0,51 |
… |
2 |
10102 |
1 |
20 |
… |
0,72 |
… |
3 |
10103 |
1 |
24 |
… |
0,54 |
… |
4 |
10105 |
2 |
… |
0 |
… | |
5 |
10107 |
1 |
6 |
… |
1,11 |
… |
6 |
10112 |
99 |
… |
0 |
… | |
… |
… |
… |
… |
… |
… |
… |