Как сгруппировать подобные предложения из CSV-файла из 50000 записей на основе слов, сокращений в Python? - PullRequest
0 голосов
/ 23 апреля 2019

Я создаю каталог для различных актов Конституции Индии для моего проекта ИИ.У меня есть CSV-файл с более чем 50000 записями.

Я хочу сгруппировать / классифицировать подобные ACT вместе на основе слов, используемых в нем, а также его сокращений.

Например.Если я найду ИНДИЙСКИЙ ПЕНАЛЬНЫЙ КОД, он покажет

i) I.PC

ii) Уголовный кодекс Индии

iii) Уголовный кодекс InDiAnМоторный закон о двигателях

iv) Индийский уголовный кодекс

v) МПК (полиция)

vi) Уголовный кодекс Индии, 1980

vii) Уголовно-процессуальный кодекс Уголовный кодекс Индии

Есть много разных вариантов ACT в CSV.

Я пытался разделить, но он не работал должным образом.Пожалуйста, предоставьте мне код для этого.

...