Цель в том, что я хочу получить
имя файла и создать метку так, как я хочу (для всех моих файлов) и
затем сохраните эту информацию в CSV-файле
Вы можете использовать glob и pandas to_csv()
для этой задачи, т. Е .:
from os import path
from glob import glob
import pandas as pd
f_filter = ["mp3", "ogg"] # a list containing the desired file extensions to be matched
m = [] # final match list
for f_path in glob('D:/museu_do_fado/mp3/**', recursive=True): # loop directory recursively
f_name = path.basename(f_path) # get the filename
f_ext = f_name.split(".")[-1].lower() # get the file extension and lower it for comparison.
if f_ext in f_filter: # filter files by f_filter
label = "Your choice"
#label = f_name[0] + f_ext[-1] # as per your example, first char of file_name and last of file_ext
m.append([f_path, f_name, f_ext, label]) # append to match list
#print(f_path, f_name, f_name, label)
df = pd.DataFrame(m, columns=['f_path', 'f_name', 'f_ext', 'label']) # create a dataframe from match list
df.to_csv("my_library.csv", index=False) # create csv from df
Образец csv
:
f_path,f_name,f_ext,label
D:\museu_do_fado\mp3\MDF0001_39.mp3,MDF0001_39.mp3,mp3,Your choice
D:\museu_do_fado\mp3\MDF0001_40.mp3,MDF0001_40.mp3,mp3,Your choice
...
Примечания:
- Pandas позволяет несколько форматов экспорта , включая to_json () , to_pickle () и
to_csv()
, использованные в примере выше Это отличная библиотека для создания нескольких типов анализа / визуализации данных вашей библиотеки. Я бы окончательно посоветовал вам выучить панд, если сможете.
- Этот ответ должен дать вам отправную точку, убедитесь, что вы прочитали документы , если что-то не так, GL.