Я косвенно сделал это вики-сообществом, видя, что ответы могут быть довольно широкими.
Я работаю с начинающей компанией для достижения следующей цели.
В медицинских исследованиях медицинская карта пациента может содержать бесконечное количество данных о пациенте для конкретного диагноза, например, У курильщика больше шансов заболеть раком легких, но это не обязательно означает, что некурящий может заболеть раком легких. Моя цель - создать / использовать модель базы данных, которая может работать с такими параметрами.
Теперь я также должен придумать способы сбора этих параметризованных данных для создания статистических данных, например, увидеть тенденции на всех 40-летних женщин, которые страдали от рака легких. Этот отчет может быть общим (график, таблица и т. Д.), Где доктора могут видеть тенденции или анализировать возможные решения, которые могут работать ....
Мои вопросы:
1) Какие системы баз данных допускают параметризованное внутреннее хранилище (например, Cassandra), которое можно легко использовать в Java, и которое очень эффективно при извлечении данных, связывании и т. Д. Мы имеем дело с большим количеством записей о пациентах на состояния.
2) Какие алгоритмы или методы искусственного интеллекта я могу использовать для интеллектуального анализа данных? Есть ли какие-нибудь методы майнинга, которые могут помочь мне сделать это?
PS Как Google Analytics работает с параметризованными данными?
PPS Параметризованные данные - это данные, которые имеют ключ, и данные, в которых данные могут быть значениями, другая пара ключ-значение, список значений, набор параметризованных данные (организованные, неорганизованные)
Я жду сенсационных ответов! : -D