Вы хотите отфильтровать строки путем поиска столбцов, которые содержат символ \N
Я предполагаю.
Если я посмотрю на ваш DataFrame
, вы можете сделать следующее, чтобы получить строки, которые соответствуют:
df[df.episodeNumber.str.contains(r'\\N') | df.seasonNumber.str.contains(r'\\N')]
tconst parentTconst seasonNumber episodeNumber
2 tt0042889 tt0989125 \N \N
Чтобы подсчитать количество строк, соответствующих этому условию, вы можете использовать .shape
или len()
df[df.episodeNumber.str.contains(r'\\N') | df.seasonNumber.str.contains(r'\\N')].shape
len(df[df.episodeNumber.str.contains(r'\\N') | df.seasonNumber.str.contains(r'\\N')])
#Output
(1, 4)
1
Shape возвращает форму вашего фрейма данных, в этом случае (#rows, #columns)
Примечание Я добавил обратную косую черту \
перед \N
, нам нужно буквально искать \N
, только одна обратная косая черта в этом случае будет функционировать какescape-символ, поэтому нам нужно добавить секунду, когда мы хотим точное совпадение.