У меня есть некоторые данные в 3 массивах с формами:
docLengths.shape = (10000,)
docIds.shape = (10000,)
docCounts.shape = (68,10000)
Я хочу получить относительные значения и их средние значения, а также стандартные отклонения для некоторых значений i:
docRelCounts = docCounts/docLengths
relCountMeans = docRelCounts[i,:].mean()
relCountDeviations = docRelCounts[i,:].std()
Проблема в том, что некоторые элементы docLengths равны нулю. Это приводит к появлению элементов NaN в docRelCounts, поэтому средние значения и отклонения также являются NaN.
Мне нужно удалить данные для документов нулевой длины. Я мог бы написать цикл, находя документы нулевой длины и удаляя их, но я надеялся на некоторую магию с массивными массивами, которая сделает это более эффективно. Есть идеи?