У меня есть свои собственные данные, основанные на английском языке.Мне нужно написать проверку орфографии для этого.Я пользуюсь этой записью MajorTal.
Я немного новичок в области глубокого обучения, поэтому я немного сбит с толку, как я могу создать свой собственный набор данных для использованияс помощью этой проверки орфографии на основе RNN.Например, есть слово «шубхамна», которое неправильно пишется как «шунхкамна».Как это отразится в файле данных, чтобы программа проверки орфографии знала исправление?Как я могу создать набор данных таких слов, которые можно использовать для обучения этой программы проверки правописания?Пожалуйста, уточните формат аннотации и строки кода, которые необходимо изменить в этом коде.Заранее спасибо.