Должен ли я «жестко кодировать» определенную типографику в мои «внутренние текстовые строки»? - PullRequest
0 голосов
/ 10 января 2020

Я делаю журнал. Сначала я создаю текстовые записи в таблице базы данных, а затем использую свой собственный код для вывода готовой «проблемы» в виде открытого текста и HTML форматов. Давайте пока проигнорируем версию HTML. Я хочу, чтобы текстовая версия выглядела следующим образом:

  This here is the first sentence of the
first paragraph.  This is the second
sentence of the first paragraph.

  This here is the first sentence of the
second paragraph.  This is the second
sentence of the second paragraph.

Обратите внимание на два пробела перед каждым абзацем и для каждого нового предложения внутри него.

В настоящее время я храню его именно так, минус разрывы строк:

  This here is the first sentence of the first paragraph.  This is the second sentence of the first paragraph.

  This here is the first sentence of the second paragraph.  This is the second sentence of the second paragraph.

То есть текстовые записи таблицы базы данных содержат «жестко закодированные» пробелы.

Это кажется неправильным и может вызвать проблемы, когда пришло время сделать HTML генератор. В конце концов, HTML (или CSS, действительно) имеет специальный атрибут стиля для добавления «отступа» / поля в начале каждого абзаца, но не для того, чтобы делать то же самое для каждого нового предложения. HTML также не понимает двойные пробелы, поэтому мне пришлось бы надежно изменить все эти случаи ...

Кажется, что "правильный" способ был бы хранить его как:

This here is the first sentence of the first paragraph. This is the second sentence of the first paragraph.

This here is the first sentence of the second paragraph. This is the second sentence of the second paragraph.

И затем автоматически анализировать в "", где это уместно, для открытого текста. Однако я понятия не имею, как бы я это сделал. Я могу представить миллион случаев, когда любой автоматизированный код неправильно определял бы новое предложение и добавлял «», где это не имело бы смысла для человека.

Кажется, что это нельзя сделать хорошим способом. Я склоняюсь просто к жесткому кодированию пробелов в пользу открытого текста, а затем "разбираюсь с этим" для HTML. Как правильно это сделать? Я не хочу, чтобы в конечном итоге пришлось вручную go просматривать огромное количество контента, чтобы вручную это исправить, потому что я принял неправильное решение с самого начала.

Примечание : Меня поразило, что если бы вместо одного текстового столбца для «тела статьи» я мог бы создать отдельную таблицу, содержащую каждый отдельный абзац каждой статьи. Тогда было бы очень просто применить форматирование / 1033 * форматирование / специальную обработку. Тем не менее, это также усложнит задачу ввода / редактирования статьи в миллион раз, не говоря уже о необходимости полностью перепроектировать весь мой интерфейс и базу данных ... так что я не слишком занят этим, если это «единственный путь к go».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...