Разделение абзаца - PullRequest
       3

Разделение абзаца

0 голосов
/ 10 августа 2011

Я хочу разделить абзац, используя "."оператор.Но я не хочу разделять это для некоторых случаев.Как где "."приходят со словами, как «доктор» или «миссис» и «мисс».или несколько других слов.

Мне нужна логика, будь то в C # или SQL Server.

1 Ответ

1 голос
/ 10 августа 2011

Я прочитал вопрос как «Как разделить абзац на предложения по компонентам?», Если вы это имели в виду, вот как я мог бы подойти к этой проблеме:

  1. Построить «белый список»"о допустимом использовании периода внутри предложений
  2. Разделить ваш абзац на". "(назовите эти возможные предложения)
  3. Переберите все возможные предложения, сравнив конечные символы с вашим белым списком допустимого использования периода внутри предложений
  4. Если оно совпадает, объедините это возможное предложение со следующими проверьте его снова

Не зная объема вашего истинного набора проблем, я не могу сказать, является ли этот подход реально выполнимым или нет.

Вот это (возможно) связанный вопрос , если вы ищете более надежный анализатор английского языка, но этот вопрос был для Java.

...