Question

Я извлек набор данных из библиотеки librosa.

Эти данные в формате объекта.

У него есть '\ n', пробелы и все. Итак, его нужно почистить

import ast
import numpy as np
import re

#  removing \n and converting into number format
if '\n' in df['MFCC_1'][0]:
    row = df['MFCC_1'][0]        
    row = ast.literal_eval(re.sub('\s+', ",", df['MFCC_1'][0].replace('\n', '')))

print(row)

Этот код работает, но в большинстве случаев выдает синтаксическую ошибку.

Это ошибка, возникающая в большинстве случаев.

После этого я хочу сохранить все очищенные данные в CSV-файл в том же формате строк и столбцов. Так что любые предложения для этого тоже.

Toto · Answer 1 · 21 марта 2019

Не заменяйте все пробелы, но только если они находятся между 2 цифрами:

if '\n' in df['MFCC_1'][0]:
    row = df['MFCC_1'][0].replace('\n', '')
    row = ast.literal_eval(re.sub(r'(?<=\d)\s+(?=\d)', ",", row))

Получение синтаксической ошибки при очистке данных с помощью ast.literal_eval ()

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получение синтаксической ошибки при очистке данных с помощью ast.literal_eval ()

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы