Я создаю каталог для различных актов Конституции Индии для моего проекта ИИ.У меня есть CSV-файл с более чем 50000 записями.
Я хочу сгруппировать / классифицировать подобные ACT вместе на основе слов, используемых в нем, а также его сокращений.
Например.Если я найду ИНДИЙСКИЙ ПЕНАЛЬНЫЙ КОД, он покажет
i) I.PC
ii) Уголовный кодекс Индии
iii) Уголовный кодекс InDiAnМоторный закон о двигателях
iv) Индийский уголовный кодекс
v) МПК (полиция)
vi) Уголовный кодекс Индии, 1980
vii) Уголовно-процессуальный кодекс Уголовный кодекс Индии
Есть много разных вариантов ACT в CSV.
Я пытался разделить, но он не работал должным образом.Пожалуйста, предоставьте мне код для этого.