Словарь социологической статистики

ИНДИКАТОРНЫЕ ПЕРЕМЕННЫЕ

Бинарные переменные, которые применяются для представления дискретных переменных, когда их нужно использовать в регрессионных моделях. Дискретная переменная с k градациями кодируется (k-1)-й индикаторной переменной. Существуют две стандартных схемы кодирования значений дискретных переменных: 1. маргинальное кодирование (отклонение от среднего), при котором значение индикаторной переменной всегда равно -1 для последнего уровня дискретной переменной, 1 для j-й индикаторной переменной, если дискретная переменная на j-м уровне, и 0 во всех остальных случаях. Например, переменная регион с четырьмя категориями (северо-восток, юго-восток, центр, запад) может послужить источником индикаторных переменных, отличающими северо-восток от всех остальных регионов. 2. ссылки (частное) кодирование, при котором значение индикаторной переменной всегда равно 0 для первого (ссылки) уровня дискретной переменной, 1 для j-й индикаторной переменной, если дискретная переменная на (j+1)-м уровне, и 0 во всех остальных случаях. При маргинальном кодировании взаимодействия между двумя дискретными факторами можно выразить через перекрестные произведения двух наборов индикаторных переменных (все попарные произведения между индикаторной переменной фактора X1 и индикаторной переменной фактора X2. При втором типе кодирования в качестве ссылки можно использовать любой уровень дискретной переменной, однако обычно выбирают либо первый уровень, либо последний. Иногда эти переменные называют фиктивными.