Как мне хешировать конкретные столбцы из файла CSV? - PullRequest
1 голос
/ 20 апреля 2019

Я пытаюсь хэшировать столбцы 2 и 8, но в итоге я хэшировал весь файл. В чем проблема с моим кодом?

import csv
import hashlib


with open('UserInfo.csv') as csvfile:

    with open('UserInfo_Hashed.csv', 'w') as newfile:

        reader = csv.DictReader(csvfile)

        for r in reader:

            hashing = hashlib.sha256((r['Password']).encode('utf-8')).hexdigest()

            newfile.write(hashing + '\n')

enter image description here

enter image description here

1 Ответ

1 голос
/ 20 апреля 2019

Поскольку ваш код показывает вашу попытку хэширования только столбца Password, следующий код просто выполняет хэширование для столбца Password.

import csv
import hashlib

with open('UserInfo.csv') as csvfile:

    with open('UserInfo_Hashed.csv', 'w') as newfile:

        reader = csv.DictReader(csvfile)

        for i, r in enumerate(reader):
            #  writing csv headers
            if i is 0:
                newfile.write(','.join(r) + '\n')

            # hashing the 'Password' column
            r['Password'] = hashlib.sha256((r['Password']).encode('utf-8')).hexdigest()

            # writing the new row to the file with hashed 'Password'
            newfile.write(','.join(r.values()) + '\n')

Проблема с вашим кодом связана с этой строкой newfile.write(hashing + '\n'), так как при этом в файл записывается только хешированный пароль (без других столбцов). Также вы не записали заголовок CSV в новый файл.


Я настоятельно рекомендую использовать Pandas:

import pandas as pd
import hashlib

# reading CSV input
df = pd.read_csv('UserInfo.csv')

# hashing the 'Password' column
df['Password'] = df['Password'].apply(lambda x: \
        hashlib.sha256(x.encode('utf-8')).hexdigest())

# writing the new CSV output
df.to_csv('UserInfo_Hashed.csv', index=False)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...