Python: RuntimeError: Ошибка чтения элемента при анализе файла .txt - PullRequest
0 голосов
/ 06 февраля 2020

У меня есть предварительно обработанный файл с именем dln1.txt, полный файл здесь , на котором я запустил pycspade / алгоритм spade

resultln1 = spade(filename='dln1.txt', support=0.5, parse=True)

, для которого я получаю ошибка:

---------------------------------------------------------------------------
RuntimeError                              Traceback (most recent call last)
<ipython-input-2-31dea31e3ce9> in <module>
----> 1 resultln1 = spade(filename='dln1.txt', support=0.5, parse=True)
      2 rln1=pd.DataFrame(resultln1)
      3 rnl1

~/anaconda3/lib/python3.7/site-packages/pycspade/helpers.py in spade(filename, data, support, maxsize, maxlen, mingap, maxgap, memsize, numpart, maxwin, bfstype, tid_lists, parse)
    153     try:
    154         result = c_runspade(filename, support, maxsize, maxlen, mingap, maxgap, memsize, numpart, maxwin, bfstype,
--> 155                             tid_lists)
    156         decode_result(result)
    157         if parse:

pycspade/cspade.pyx in pycspade.cspade.c_runspade()

RuntimeError: Error reading item

1 Ответ

0 голосов
/ 06 февраля 2020

Я отвечаю на свой вопрос здесь, проблема заключалась в упорядочении последовательностей в предварительно обработанном файле.

вход для spade в pycspade должен иметь формат

1 1 3 8 37 42
1 2 4 4 11 37 42
2 1 2 10 73
2 2 1 72
2 3 3 4 24 77

Первое число - это индекс последовательности, второе - это индекс события, третье - это число элементов, за которым следует элемент, разделенный пробелом

Индекс последовательности необходимо упорядочить, тогда как в моем случае это не было. Как только я это сделал, алгоритм работал отлично.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...