Как определить, является ли значение двух слов одинаковым с помощью регулярного выражения Python - PullRequest
0 голосов
/ 27 апреля 2019

У меня есть несколько слов, подобных этому:

['Java开发工程师', 'Java高级开发工程师', 'java开发工程师', 'JAVA开发工程师', '高级Java开发工程师', 'Java中级开发工程师', '高级java开发工程师', 'Java工程师', 'java工程师', 'JAVA工程师', 'Java架构师', '高级Java工程师', '高级java工程师', 'JAVA大数据开发工程师定岗生', '高级JAVA开发工程师', 'java+人工智能(AI)开发签约实习生', 'Java软件工程师', 'java软件工程师与人工智能开发委培', 'java高级开发工程师', 'Java开发实习生']

Прежде всего, некоторые слова имеют одинаковое значение, например: java 工程师 工程师 = Java 工程师 = JAVA , , другой пример : 高级 Java 工程师= Java 高级工程师
Теперь я хочу выяснить, имеют ли они одинаковое значение, тогда я могу добавить их в список.

Вот код:

cursor.execute("select title from job_java")
results = cursor.fetchall()
counter = dict()
for (item,) in results:
    counter[item] = counter.get(item, 0) + 1  # this codes
counter_sort = sorted(counter.items(), key=lambda value: value[1], reverse=True)

что я ожидаюэтот счетчик 'java 工程师' и 'JAVA add' добавляет к одному и тому же индексу dict и этот 高级Java工程师 = Java高级工程师

Я стажер в python , Можете ли вы дать мне совет?Из-за этого я могу сделать это более конкретно.https://img.shownmmp.top/job.png

1 Ответ

0 голосов
/ 27 апреля 2019

Если ваши синонимы есть в словаре:

synonyms = {"java开发工程师": "Java工程师", 
            "Java工程师": "JAVA工程师", 
            "高级Java工程师": "Java高级工程师"}

Вы можете заменить слово его синонимом, если оно имеет:

word = synonyms.get(word, word)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...