Постановка задачи: Разделите язык программирования (скажем, JS) на темы.Затем разделите темы на три группы в зависимости от сложности концепции: начальный, средний и продвинутый.
Пример: Давайте возьмем JavaScript в качестве целевого языка, который мы хотим разделить на темы,
Шаг 1. Поиск тем, связанных с самим языком.(Подобно тому, как автор книги строит свое оглавление) Предположим, что нам удалось идентифицировать 100 тем.
Шаг 2. Разделите их на группы по относительной сложности.темы.(Начинающий, средний и продвинутый.)
Шаг 3. Постобработка.
Наше решение: просмотрите всю документацию по языку и создайте корпус.Для каждой страницы найдите ключевые слова, используя термин «частота - обратная частота документа» (TF-IDF).Эти ключевые слова являются нашими темами, и мы можем поместить их в нужное место в том порядке, в котором они отображаются, при условии, что в документации сначала обсуждаются темы начального уровня, а затем - расширенные темы.
Приведенное выше решение не помогло нам.Любые мысли или идеи приветствуются!