Попытка написать код, который ищет значения хеш-функции для конкретной строки (вводимые пользователем) и возвращает хеш-код, если в этой строке присутствует поисковый запрос.
Делая это, вы немного больше изучаете python, но это может быть реальное приложение, используемое отделом кадров для поиска в базе данных резюме .csv конкретных слов в каждом резюме.
Я бы хотел, чтобы эта программа просматривала файл .csv, в каждой строке по три записи (id #; имя кандидата; текст резюме)
Я настроил его так, чтобы он создавал хэш, затем создал строку для записи хэша текста резюме, и я пытаюсь использовать функцию .find (), чтобы вернуть весь хэш для каждого экземпляра.
Что бы я хотел, чтобы слово «gpa» использовалось в качестве поискового запроса и находилось в s ['resumetext'] для трех претендентов (строки в файле .csv), оно печатает id, name, и резюме для каждой строки, которая имеет его. (Все три претендента)
Как и сейчас, моя программа печатает первую строку в файле .csv (печать резюме ['id'], резюме ['name'], резюме ['resumetext']) независимо от того, что является поисковым запросом, будь то в резюме или нет.
наконец, есть ли лучшие способы сделать это, ища документы по словам, файлы pdf и .txt в папке по определенным словам, используя python (я только начал читать о модуле re, и мне интересно, может ли это быть вместо того, чтобы помещать все в файл .csv.)
def find_details(id2find):
resumes_f=open("resume_data.csv")
for each_line in resumes_f:
s={}
(s['id'], s['name'], s['resumetext']) = each_line.split(";")
resumetext = str(s['resumetext'])
if resumetext.find(id2find):
return(s)
else:
print "No data matches your search query. Please try again"
searchquery = raw_input("please enter your search term")
resume = find_details(searchquery)
if resume:
print resume['id'], resume['name'], resume['resumetext']