Моя цель - очистить адресные данные из отдельных файлов CSV, используя словари для каждого отдельного столбца.Вроде как автоматизировать функцию поиска и замены из Excel.Адреса разделены на столбцы.Housenumbers
, streetnames
, directions
и streettype
все в своих столбцах.Я использовал следующий код для создания всего документа.
missad = {
'Typo goes here': 'Corrected typo goes here'}
def replace_all(text, dic):
for i, j in missad.items():
text = text.replace(i, j)
return text
with open('original.csv','r') as csvfile:
text=csvfile.read()
text=replace_all(text,missad)
with open('cleanfile.csv','w') as cleancsv:
cleancsv.write(text)
Пока код работает, мне нужно иметь отдельные словари, так как некоторые столбцы нуждаются в определенных исправлениях опечаток. Например, для столбца Housenumbers
housenum
, stdir
для направления улицы и так далее для каждого с их опечатками, специфичными для столбца:
housenum = {
'One': '1',
'Two': '2
}
stdir = {
'NULL': ''}
Я понятия не имею, как поступить, я чувствую, что это что-то простое или что мне понадобятся панды, но я не уверен, какпродолжать.Буду признателен за любую помощь!Также есть ли способ сгруппировать опечатки вместе с одной исправленной опечаткой?Я попробовал следующее, но получил ошибку типа unhashable.
missad = {
['Typo goes here',Typo 2 goes here',Typo 3 goes here']: 'Corrected typo goes here'}