У меня есть Dataframe со столбцом 'cleaned_tweet'. Этот столбец состоит из твитов с несколькими сокращениями, и я хочу заменить эти сокращения на правильные английские слова. Для этого я подготовил словарь под названием «сленги», где сокр. это ключ и нужная английская фраза / слово в качестве значения, и я хочу заменить все вхождения этих сокращений. со своими значениями в словаре. Я искал несколько других решений для stackoverflow, но ни одно из них, похоже, не работает. Вот что я попробовал. Я использую вложенный цикл for, и я считаю, что я довольно близок к решению, но я делаю что-то не так, что я не могу понять.
Вот вложенный цикл:
for i in range(len(train_test_set)):
for j in slangs:
train_test_set['cleaned_tweet'][i] = train_test_set['cleaned_tweet'][i].replace(j, slangs[j])
, когда я выполнил этот код и напечатал print(train_test_set['cleaned_tweet][0])
, я получил неожиданный вывод, подобный этому:
"#mopanthank whyour | hi | years oldwhyour | hi | years oldhesitationospecial editekissas insekissperience wall hacken whyour | hi | years oldunited statesing a hallwhyour | hi | years olducinogenic drwhyour | hi | years olduglwhyour | hi | years oldung ladye rainbowhwhy | would whyour | hi | years olduohesitationents | rapper from atalk later | ekissperience wall hacken whyour | hi | years oldunited statesing a hallwhyour | hi | years olducinogenic drwhyour | hi | years olduglwhyour | hi | years oldung ladye rainbowhwhy | would whyour | hi | years olduoue loversatileionwhyes | yeah | yes | your | hi | years oldu | team leaderantaonwhysomethingop it | somethingwhyour | hi | years oldupid idiotake careal edwhyour | hi | years olducatekissas insekissperience wall hacken whyour | hi | years oldunited statesing a hallwhyour | hi | years olducinogenic drwhyour | hi | years olduglwhyour | hi | years oldung ladye..."
Кажетсямногие нежелательные значения добавляются в ячейки. Размер вывода действительно большой, поэтому я не могу скопировать все это здесь. Вот структура моего набора данных и словаря перед выполнением кода:
Может кто-нибудь сказать мне, что я делаю не так?