Я просто ищу небольшой совет по этому вопросу.Что я хотел бы сделать, это извлечь заголовок, который присутствует в абзаце текста.Это основной заголовок, а не подзаголовки в тексте.Под заголовком я подразумеваю «описательный заголовок или заголовок главы, раздела или другой части книги».
Эти текстовые выдержки будут храниться в строке формат.В обычном случае первое предложение слов в текстовом извлечении будет заголовком, например:
Текст для поиска
Это остальная часть абзаца и т. Д. И т. Д.и т. д.
Как вы думаете, это будет так же просто, как:
- Проверка первых слов, которые появятся в текстовом извлечении, на разрыв текста.
- При обнаружении разрыва в тексте убедитесь, что нет полной остановки (заголовки, как правило, не имеют полной остановки).
- Если вышеуказанные совпадения совпадают, это можно классифицировать как заголовок и использовать.
Я мог бы пойти дальше и посмотреть на заглавные буквы в стиле заголовков (http://www.writersblock.ca/tips/monthtip/tipmar98.htm), но это может быть слишком строго и поэтому может пропустить некоторые присутствующие заголовки. Есть ли какие-либо вопросы, которые я пропускаю / есть ли методуже найден заголовок?
Мне известно о TextInfo.ToTitleCase, но это просто преобразовывает все первые буквы каждого слова в верхний регистр или соответствует правилам "заглавных букв в стиле заголовка"?
Спасибо.