Машинное обучение для извлечения текста из группы файлов - PullRequest
0 голосов
/ 28 мая 2019

У меня есть случай, когда у меня много файлов спецификаций, и мне нужно извлечь из них информацию определенного типа (блок текста).Это невозможно сделать с помощью решения RegExp, потому что файлы довольно нестандартные (это можно сделать, но с большим усилием создать строку RegExp, и я не хочу этого делать).Моей первой мыслью было использование извлечения информации (у меня есть много примеров, которые можно использовать для изучения модели) из ветви машинного обучения.Мой основной язык - C #, поэтому я проверил ML.NET, но, похоже, в библиотеке нет такой функциональности.Итак, мой вопрос: есть ли библиотеки, которые позволили бы мне достичь цели?Или у кого-нибудь есть идея автоматизировать такую ​​задачу без написания сложного RegExp?

...