Я думаю, это зависит от того, где вы хотите хранить текст, если вам нужны такие вещи, как транзакции и т. Д.
Базы данных, такие как SQL Server, имеют тип, который может хранить длинные текстовые поля. В SQL Server 2005 это в первую очередь будет nvarchar (max) для длинных текстовых строк Unicode. Используя базу данных, вы можете извлечь выгоду из транзакций и простого резервного копирования / восстановления, если вы используете базу данных для других целей, таких как StackOverflow.com.
Альтернатива - хранить текст в файлах на диске. Это может быть довольно просто реализовать и может работать в средах, где база данных недоступна или излишняя.
Относительно формата текста, который хранится в базе данных или файле, он, вероятно, очень близок к вводу. Если это HTML, тогда вы просто протолкнете его через функцию, которая будет правильно экранировать его.
Следует помнить, что вы, вероятно, хотите использовать Unicode или UTF-8 от создания до хранения и наоборот. Это позволит вам поддерживать дополнительные языки. Любая проблема с этим механизмом кодирования повредит ваш текст. Исторически люди могли использовать ASCII по умолчанию, исходя из предположения, что они экономили дисковое пространство и т. Д.