Итак, я хочу подсчитать количество точек данных, нанесенных на график, чтобы отслеживать общий объем полученных данных. Проблема в том, что моя таблица данных испортила его до уровня, где есть некоторые значения NaN в другой строке по сравнению с другим столбцом, где он может иметь или не иметь значение NaN. Например:
# I use num1 as my y-coordinate and num1-num2 for my x-coordinate.
num1 num2 num3
1 NaN 25
NaN 7 45
3 8 63
NaN NaN 23
5 10 42
NaN 4 44
#So in this case, there should be only 2 data point on the graph between num1 and num2. For num1 and num3, there should be 3. There should be 4 data points between num2 and num3.
Я считаю, что Matplotlib не отображает строки столбца, содержащие значения NaN, начиная с его нуля (пожалуйста, исправьте меня, если я ошибаюсь, я могу сказать это только из-за отсутствия точекнаходясь на координате 0 осей x и y). В начале я думал, что смогу обойтись без использования .count () и найти меньший из двух столбцов и использовать его в качестве моего трекера, но реально это не будет работать, как показано в моем примере выше, потому что это может быть даже МЕНЬШЕчем это, так как один может иметь значение NaN, а другой будет иметь фактическое значение. Некоторые примеры кода, которые я сделал:
# both x and y are columns within the DataFrame and are used to "count" how many data points are # being graphed.
def findAmountOfDataPoints(colA, colB):
if colA.count() < colB.count():
print(colA.count()) # Since its a smaller value, print the number of values in colA.
else:
print(colB.count()) # Since its a smaller value, print the number of values in colB.
Кроме того, я подумал об использовании .value_count (), но я не уверен, что это именно та функция, которую я ищу, чтобы завершить то, что я хочу. Любые предложения?
Редактировать 1: Изменены имена фреймов данных, чтобы сделать пример более понятным.