Сравнение значений в двух столбцах - PullRequest
0 голосов
/ 05 мая 2020

Теперь у меня есть большой набор данных по акциям (2 ГБ):

    StockID       date    Industry code 1     Industry code 2       
0   10000   1986-01-06     NaN                 399        
1   10000   1986-01-07     NaN                 399         
2   10000   1986-01-08     NaN                 399  
3   10000   1986-01-09     NaN                 399  
...  

Я хочу проверить две вещи,

  1. , если акционерное лицо когда-либо меняло свои Industry code 1 или Industry code 2
  2. , если акционерное общество отнесено к финансовой отрасли в одном отраслевом коде, но не в другом (например, ['Industry code 1']=52 или 53, если от ['Industry code 2']!=60 до 70 или наоборот. наоборот)

1 Ответ

2 голосов
/ 05 мая 2020

Ваш первый вопрос невозможно, если у вас нет истории данных. Если у вас есть история, то все, что вам нужно сделать, это проверить, совпадают ли текущее значение фрейма данных и старое значение, а если нет, это означает, что объект изменился.

Для вашего второго вопрос, если вы используете библиотеку, такую ​​как pandas, и ваш фрейм данных хранится в переменной df, то вы можете проверить определенные c ситуации следующим образом:

df[(df['Industry code 1'] == 52 | df['Industry code 1'] == 53) & (df['Industry code 2'] < 60 | df['Industry code 2'] > 70)] 

Этот код указан c к приведенному вами примеру, но вы можете изменить его, чтобы он соответствовал любому подмножеству, которое вы хотите создать. Это дает вам подмножество, с которым вы можете делать все, что захотите (посмотрите, какие фондовые объекты следуют этому шаблону, сколько всего и т. Д. c.).

Надеюсь, что это поможет!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...