Как сделать курсовой документ на питоне - PullRequest
0 голосов
/ 02 ноября 2018

У меня 16000 записей из набора данных imdb, как это

Movie_Name         Synops 
Alien Predator     ['great','17th', 'abigail', 'by', 'century', 'is']
Shark Exorcist     ['demonic', 'devil', 'great', 'hell', 'holy', 'nun']
Jurassic Shark     ['abandoned', 'an', 'and', 'beautiful', 'abigail',]

Я не знаю, как создать терминологический документ для каждого слова в столбце Синопс, как этот

"great": Alien Predator,Shark Exorcist
"17th"  :Alien Predator
"abigail":Alien Predator,Jurassic Shark
.....

Ответы [ 2 ]

0 голосов
/ 02 ноября 2018
data = {
    "Alien Predator": ['great','17th', 'abigail', 'by', 'century', 'is'],
    "Shark Exorcist": ['demonic', 'devil', 'great', 'hell', 'holy', 'nun'],
    "Jurassic Shark": ['abandoned', 'an', 'and', 'beautiful', 'abigail',]
}

result = {}
for movie_name, keywords in data.items():
    for keyword in keywords:
        result.setdefault(keyword, []).append(movie_name)
print(result)

Результат (для ясности добавлены новые строки):

{
'great': ['Alien Predator', 'Shark Exorcist'], 
'17th': ['Alien Predator'], 
'abigail': ['Alien Predator', 'Jurassic Shark'], 
'by': ['Alien Predator'], 
'century': ['Alien Predator'], 
'is': ['Alien Predator'], 
'demonic': ['Shark Exorcist'], 
'devil': ['Shark Exorcist'], 
'hell': ['Shark Exorcist'], 
'holy': ['Shark Exorcist'], 
'nun': ['Shark Exorcist'], 
'abandoned': ['Jurassic Shark'], 
'an': ['Jurassic Shark'],
'and': ['Jurassic Shark'], 
'beautiful': ['Jurassic Shark']
}
0 голосов
/ 02 ноября 2018

Сначала поместите их в словарь или JSON. Как только у вас есть это.

dataset = {
"Alien Predator":['great','17th', 'abigail', 'by', 'century', 'is'],
"Shark Exorcist":['demonic', 'devil', 'great', 'hell', 'holy', 'nun'],
"Jurassic Shark":['abandoned', 'an', 'and', 'beautiful', 'abigail',],
}

Здесь вы можете легко запросить значения.

search_word = "great"
d = [movie for movie, synops in dataset.items() if search_word in synops]

возвращает ['Alien Predator', 'Shark Exorcist']

Вы можете добавить их в словарь, чтобы получить полный результат.

final_dict = {}
final_dict[search] = d

Это должно дать вам.

>>> final_dict
{'great': ['Alien Predator', 'Shark Exorcist']}

Теперь вы можете реализовать то же самое, используя цикл for и список необходимых ключевых слов, и выполнить задачу самостоятельно.

...