Я делаю постоянный опрос, каждый квартал. Мы заставляем людей подписаться (где они дают обширную демографическую информацию).
Затем мы даем им возможность ответить на шесть коротких вопросов с 5 возможными значениями, намного хуже, хуже, так же, лучше, намного лучше.
Конечно, со временем мы не получим тех же участников, некоторые выпадут, а некоторые подпишутся, поэтому я пытаюсь решить, как лучше построить базу данных и код (надеюсь использовать Python, Numpy?), Чтобы лучше обеспечить непрерывный сбор и анализ по различным категориям, определенным исходными демографическими данными. На данный момент у нас около 700 участников, поэтому набор данных не слишком большой.
т.е. .;
демографический, UID, север, юг, жилой. реклама Тогда ответь на 6 вопросов за первый квартал
То же самое для Q2 и т. Д., Затем нужно уметь нарезать кубики и усреднить значения для квартальных ответов по разным демографическим показателям, чтобы увидеть тенденции во времени.
Усреднение, группировка и т. Д. Скромно усложняются наличием разных участников в каждом квартале
Есть какие-нибудь указатели для разработки шаблонов для такого рода БД? а анализ? Это разреженная матрица?