существование идентификатора в нескольких фреймах данных - PullRequest
0 голосов
/ 23 октября 2019

У меня есть 10 фреймов данных с похожими столбцами, и я хочу проверить, существует ли какой-либо идентификатор, существующий хотя бы в 8 из этих фреймов. Как мне это сделать

Ответы [ 2 ]

0 голосов
/ 23 октября 2019

Быстрый и грязный пример, объясняющий, как вы могли бы это сделать:

Переименуйте столбцы, в которых находится идентификатор, чтобы они все имели одно и то же имя, затем выполните что-то вроде этого

for df in list_of_dfs:
    if specific_value in df.columnname.values:
        counter+= 1
        if counter >= 8:
            print(specific_value,' is in ',counter,' Dataframes')

Просто помните, с этим вы можете проверить, есть ли что-то в вашем DF или нет. (Возвращает True / False)

specific_value in df.columnname.values
0 голосов
/ 23 октября 2019
import collections
li=[]
for df in [df1,df2,df3]:  # List your dataframe names here
  li+=df.columns.values.tolist()
counter = collections.Counter(li)

# counter is a dictionary with key value pairs of each column name with its frequency count

print(list(k for k,v in counter.items() if v>=8))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...