Как я могу экспортировать два списка строк в два столбца в CSV-файле без разделения - PullRequest
0 голосов
/ 03 мая 2019

У меня есть два списка reviews_text (который содержит все отзывы) и review_label (который сообщает, является ли отзыв Positive или Negative).Мне нужно экспортировать их в CSV-файл с reviews_text и reviews_label в виде двух столбцов.

Я попробовал следующие коды и не могу их решить.

np.savetxt('reviews.csv', [p for p in zip(review_text, review_label)], delimiter=',', fmt='%s', encoding="utf-8")

После сохранения их в виде csv-файла я хочу review_text в одном столбце, но он сохраняетсяв другом столбце

Когда я открываю CSV-файл в Excel, я получаю что-то вроде этого

Вывод выглядит так

         A       ,       B       ,       C       ,       D       ,       E

1 Very rustic...   off Knick...    salad           potatoes were..  Negative

2 Went here...     a crepe...      Negative

3 Huge fan of..    hot choc...     good place..    Positive

Но я хочу, чтобы выходной результат выглядел следующим образом

                   A                                     ,     B      

1 Very rustic place. Mismatched furniture,off Knick...      Negative

2 Went here for coffee, a crepe and salad but bad p...      Negative

3 Huge fan of their meatball, hot chocolate, good p...      Positive

Я думаю, что отзывы после каждого , отделяются и переходят в новый столбец.Есть ли способ ее решить?Спасибо

РЕДАКТИРОВАТЬ:

Вывод reviews_text выглядит примерно так.Надеюсь, что это поможет в устранении проблемы любым способом.

Вывод:

'Слишком дорого для того, что у них было ... У меня была тарелка с яйцом Бенедикта, называемая la drolet, но у нее была странная сторонасуп с пустыней, который я лично не люблю.Я не думаю, что я вернусь туда снова… »,« Очень простоватое место. Несоответствующая мебель, без Никина. Сделал бы отличное место для фото в Instagram. Много разнообразия в меню. У меня был их поздний завтрак.яйца, салат, картофель, суп и десерт. Хорошо стоит цена. Я был фарширован, фактически не мог закончить картофель. Вежливое обслуживание. Обязательно приеду снова. ", 'Я настоятельно рекомендую Au Festin de Babette для их позднего завтрака.Их выбор бранчей отличается от большинства других мест.Я обычно хожу за горячим напитком, супом, гратеном дофиноисом, двумя яйцами Бенедикт и шоколадным муссом.Все предметы превосходны, особенно гратен дофиноис.Эта еда, как правило, очень сытная и стоит менее 20 долларов, что является разумным для хороших завтраков в Монреале.Интерьер очень милый и приятный, а обслуживание, как правило, хорошее. ', ...]

Ответы [ 2 ]

0 голосов
/ 03 мая 2019

Вы должны указать небольшую часть данных, которые вы используете, если вы хотите эффективные ответы. Предположим, у вас такая ситуация:

review_text = ['Very rustic place. Mismatched furniture,off Knick', 'Went here for coffee, a crepe and salad but bad p...', 'Huge fan of their meatball, hot chocolate, good p... ']  
review_label = ["Negative", "Negative", "Positive"]

Я вижу две проблемы в вашем коде: одна из них заключается в том, что в zip-объекте понимается неприятный список, а другая - сам разделитель.

Быстрое исправление для преобразования данных заключается в следующем:

import numpy as np  
np.savetxt('reviews.csv', np.asarray([review_text, review_label]).T, delimiter='\t', fmt='%s', encoding="utf-8")

Стоит отметить, что при открытии файла вам нужно выбрать только вкладку в инструменте импорта Excel.

0 голосов
/ 03 мая 2019

Если вы думаете, что это из-за ",", измените разделитель в вашем коде на что-то другое. Вы также можете закодировать "," в наборе данных вашего отзыва и декодировать его позже.

...