Вот мой вопрос. Я работаю с набором данных python CSV, используя pandas. Я сравниваю уровень преступности в районах Нью-Йорка C и арендной платы Airbnb в этом районе, используя 2 разных набора данных. Я хочу проверить, совпадают ли названия окрестностей, а затем добавить столбец уровня преступности рядом со столбцом цены air BnB df. Тем не менее, индексы не одинаковы, так что для домов в верхнем восточном направлении совершено 500 преступлений, а в верхнем восточном - только один. Так как я могу объединить эту информацию? ПОМОГИТЕ очень нужное, так как у меня есть отчет, который должен был представить сегодня вечером thnx
Пока что я сделал: я реализовал только CSV-файлы как df для обоих, а затем подумал о создании Dctionary с данными о преступности для окрестностей и уровней, и если Я нахожу равенство в местоположениях aribnb и словарях, я хочу добавить значения уровня преступности из словаря в пустой список. И после этого я считаю, что список будет упорядочен с местоположениями Air BNB, чтобы я мог добавить этот список в качестве нового столбца в Air BNB CSV. Извините, мой код неверен, поэтому я не могу опубликовать его здесь. Также я застрял при добавлении правильного значения dict в пустой список, найдя те же местоположения в 2 csvs.
наборов данных: http://app.coredata.nyc/?mlb=false&ntii=crime_all_rt&ntr=Community%20District&mz=14&vtl=https%3A%2F%2Fthefurmancenter.carto.com%2Fu%2Fnyufc%2Fapi%2Fv2%2Fviz%2F98d1f16e-95fd-4e52-a2b1-b7abaf634828%2Fviz.json&mln=true&mlp=true&mlat=40.718&ptsb=&nty=2018&mb=roadmap&pf=%7B%22subsidies%22%3Atrue%7D&md=table&mlv=false&mlng=-73.996&btl=Borough&atp=neighborhoods
https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data