Фактический алгоритм, который использовался для извлечения и оценки ключевых слов, был бы фирменным фирменным рецептом, я не ожидаю, что они сделают его публичным.Но вы можете найти множество исследовательских работ на эту тему, но обычно конечные коммерческие продукты содержат различные методы для достижения наилучших результатов.
Вы можете сравнить различные службы NLU из разных поставщиков, таких как IBM, Google, Amazon и сравнить результаты.
Специально для вашего запроса вы пытаетесь извлечь ключевые слова или темы из одного документа.КПК встречается в каждом предложении вашего документа.Если мы применяем простую технику, такую как TF-IDF, где каждое предложение является документом, TF-IDF = 0 для слова PDA, поскольку оно встречается в каждом предложении и становится неактуальным, поскольку не добавляет информацию к общей теме или важности документа.