Я хотел бы взять данные из API Graph Facebook и проанализировать их, чтобы приблизительно определить, насколько близок один человек к другому. Я пытаюсь использовать платформу Pylons с SqlAlchemy (сейчас она подключена к базе данных SQLite) для хранения информации из API Graph, чтобы я мог сделать ее доступной для других моих приложений через веб-сервис RESTful. Мне интересно, какой будет лучший подход к анализу данных.
Например, следует ли мне создавать объекты, аналогичные узлам и ребрам в Graph API (пользователи, сообщения, статусы и т. Д.), И анализировать их, а затем сохранять в базе данных только результаты этого анализа, возможно, UID каждый узел и его соединения с другими узлами? Или я должен хранить еще меньше, и иметь только базу данных пользователей и их близких друзей? Или я должен пройти шаг за шагом и сохранить каждый из объектов с помощью преобразователя ORM в базе данных и выполнить анализ из базы данных после ее заполнения?
Какие проблемы возникают при проектировании базы данных в подобных ситуациях? Как объекты должны соотноситься / отображаться с моделью? Где должен проводиться анализ в течение всего процесса сбора и хранения данных?