Загрузка текстового файла в записную книжку IBM Watson - PullRequest
0 голосов
/ 18 апреля 2020

Моя цель: Анализ текста - например, найти наиболее часто встречающиеся слова из набора данных, сколько слов в тексте и т. Д. c с помощью IBM Watson Notebook. Я использовал следующую ссылку https://www.youtube.com/watch?v=Jtej3Y6uUng для загрузки данных.

Если это CSV-файл, нет проблем, он работает (TXT-файлы продолжают работать со мной). Но я хотел бы проанализировать некоторый текст, поэтому я скопировал текст в Excel и сохранил как csv и смог увидеть его в блокноте.

df_data_0 = pd.read_csv (body) df_data_0.head ()

И как только я пытаюсь разбить текст, я получаю сообщение об ошибке

split_it = df_data_0.split () <- CAUSING ERROR </h2> AttributeError Traceback (самое последнее последний вызов) в ----> 1 split_it = df_data_0.split () /opt/conda/envs/Python36/lib/python3.6/site-packages/pandas/core/generic.py в getattr (self, name) 5065, если self._info_axis._can_hold_identifiers_and_holds_name (name): 5066 вернуть self [name] -> 5067 возвращаемый объект. getattribute (self, name) 5068 5069 def setattr (self, name, value): Сообщение об ошибке: AttributeError: у объекта «DataFrame» нет атрибута «split» Мое ожидание: Слова теперь разделены и готовы к подсчету. Что я делаю неправильно? И может ли кто-нибудь объяснить мне, как я могу загрузить txt.file в IBM Watson Notebook, прочитать и проанализировать его? Я думаю, что это имеет больше смысла, чем CSV. Это сообщение появляется при загрузке текста в формате txt. И я не знаю, что я должен делать отсюда. Каков следующий шаг, чтобы прочитать загруженный текстовый файл и разделить его? Ниже приведено сообщение от IBM Watson Notebook. Ваш файл данных был загружен в botocore.response.StreamingBody объект. Пожалуйста, ознакомьтесь с документацией ibm_boto3 и pandas, чтобы узнать больше о возможностях загрузки данных. Документация ibm_boto3: https://ibm.github.io/ibm-cos-sdk-python/ pandas Документация: http://pandas.pydata.org/ streaming_body_1 = client_3ef9efbd7aae429ebf5dc645c0cddc50.get_object (Bucket = '56 -donotdelete-pk-w9r5ec6.t Keyboard ') [' Body '] добавить отсутствующий iter метод, поэтому pandas принимает тело как файлоподобный объект, если не hasattr (streaming_body_1, " iter "): streaming_body_1. iter = types.MethodType ( iter , streaming_body_1) Заранее благодарим за ваше время! С уважением,

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...