Я работаю над небольшим проектом, связанным с рекомендациями. Мне нужно найти сходство документов в качестве одной из задач, и мне нужен корпус слов, более специфичный c для домена (ИТ-терминология). Итак, есть ли способ создать корпус для ИТ-домена.