C # - Заголовок заглавия - Определить заголовок в тексте - PullRequest
0 голосов
/ 03 апреля 2012

Я просто ищу небольшой совет по этому вопросу.Что я хотел бы сделать, это извлечь заголовок, который присутствует в абзаце текста.Это основной заголовок, а не подзаголовки в тексте.Под заголовком я подразумеваю «описательный заголовок или заголовок главы, раздела или другой части книги».

Эти текстовые выдержки будут храниться в строке формат.В обычном случае первое предложение слов в текстовом извлечении будет заголовком, например:

Текст для поиска

Это остальная часть абзаца и т. Д. И т. Д.и т. д.

Как вы думаете, это будет так же просто, как:

  • Проверка первых слов, которые появятся в текстовом извлечении, на разрыв текста.
  • При обнаружении разрыва в тексте убедитесь, что нет полной остановки (заголовки, как правило, не имеют полной остановки).
  • Если вышеуказанные совпадения совпадают, это можно классифицировать как заголовок и использовать.

Я мог бы пойти дальше и посмотреть на заглавные буквы в стиле заголовков (http://www.writersblock.ca/tips/monthtip/tipmar98.htm), но это может быть слишком строго и поэтому может пропустить некоторые присутствующие заголовки. Есть ли какие-либо вопросы, которые я пропускаю / есть ли методуже найден заголовок?

Мне известно о TextInfo.ToTitleCase, но это просто преобразовывает все первые буквы каждого слова в верхний регистр или соответствует правилам "заглавных букв в стиле заголовка"?

Спасибо.

...