Лично я бы сохранял исходный и проанализированный контент в базе данных, если только контент не станет большим. Разбор каждый раз будет большой проблемой масштабируемости.
И это зависит от того, нужен ли вам доступ к исходному контенту. Когда я сталкивался с подобными ситуациями, я обнаружил, что мы можем внести изменения в то, как мы анализируем такой контент, и нам нужно вернуться назад и повторно проанализировать весь старый контент, так что это определенно удобно, чтобы сохранить оригинальный контент.