Скажем, у меня есть список школ:
schools = [
'00A000',
'01A000',
'00B000',
'01B000',
'00C000',
'01C000'
]
Я провожу некоторые исследования данных, и первое, что я хочу сделать, это подсчитать все школы как %A%
(есть A
посередине).
Я предположил, что мог бы использовать что-то вроде команды ниже:
schools.count('\BA')
Но похоже, что единственный способ использовать регулярное выражение с модулем re
:
[re.findall('\BA', x) for x in schools].count(['A'])
Это самый простой способ сделать это?
Полный код:
import re
schools = [
'00A000',
'01A000',
'00B000',
'01B000',
'00C000',
'01C000'
]
# Data exploration. Find count of all district A schools.
# I thought I could use list's built in count and some kind of string regex for it to
# take in:
schools.count('\BA')
# Above example is invalid.
# It looks like I must loop over with regex and then add a count after, right?
[re.findall('\BA', x) for x in schools].count(['A'])
# Repeat for B and C...