У меня есть несколько сотен тысяч измерений, где зависимый
переменная является вероятностью, и хотел бы использовать логистическую регрессию.
Тем не менее, все ковариаты, которые у меня есть, являются категоричными, и что еще хуже
вложенный. Я имею в виду, что если определенное измерение имеет "город -
Феникс "тогда, очевидно, наверняка есть" штат - Аризона "и
"страна - США" У меня есть четыре таких фактора - самый гранулированный
около 20 тысяч уровней, но, если понадобится, я могу обойтись без этого, я думаю.
У меня также есть несколько не вложенных категориальных ковариат (только четыре или около того,
возможно с тремя различными уровнями каждый).
Что меня больше всего интересует
это прогноз - учитывая новое наблюдение в каком-то городе, я бы хотел
знать соответствующую вероятность / зависимую переменную. Я не заинтересован
столько же в связанных логических механизмах - стандартные отклонения,
и т. д. - по крайней мере, на данный момент. Я надеюсь, что могу позволить себе быть неряшливым.
Тем не менее, я хотел бы получить эту информацию, если она не требует
методы, которые являются более дорогими в вычислительном отношении.
У кого-нибудь есть советы, как на это напасть? Я смотрел в
смешанные эффекты, но я не уверен, что это то, что я ищу.