Question

Я ищу эффективный способ чтения необработанного текста из любого офисного документа MS (word, excel или powerpoint), а затем отображения отдельного списка слов и подсчета того, сколько раз это слово используется. Если возможно, я бы хотел исключить общие слова ('и', 'to', 'the' и т. Д.).

Как лучше всего добиться этого в C #?

LBushkin · Answer 1 · 13 июля 2009

Вы должны взглянуть на Lucene.NET - он имеет возможность создавать словарные индексы из различных источников, включая, я полагаю, текстовые документы.

Получить отдельный список слов и считать из MS Office документов с помощью C #

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получить отдельный список слов и считать из MS Office документов с помощью C #

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы