То же AlexR.Если ВСЕ, что вы хотите найти, это адрес электронной почты и номер телефона, вы можете сканировать строки символов в соответствующем формате.Пара простых регулярных выражений может сделать это довольно надежно.Даже это не будет 100%.Если кто-то включил, «Изучил Java @ Technocorp. Гражданин США».и т. д. Вы можете легко обмануть себя, думая, что это адрес электронной почты "java@technocorp.us".Хорошо, это напряженный пример, но это тот тип вещей, который сбивает синтаксический анализ естественного языка.
Если вы хотите большего, нет простого ответа.Вы можете искать по ключевым словам, например, чтобы найти, куда он ходил в школу, вы можете искать слова «колледж» или «университет».Но даже тогда кто-то может поставить «Выпускник Foobar College» или «College: Foobar» или «BA from Foobar» или многие другие возможные форматы.