Как искать конкретный текст c в csv внутри Pandas, python - PullRequest
0 голосов
/ 10 июля 2020

Здравствуйте, я хочу найти текст учетной записи @ в столбце заголовка и сохранить его в новом CSV. Pandas может, я пытался сделать, но не вышло. Это мой csv http://www.sharecsv.com/s/c1ed9790f481a8d452049be439f4e3d8/Newnormal.csv

это мой код:

import pandas as pd 

  
data = pd.read_csv("Newnormal.csv")
data.dropna(inplace = True) 

  

sub ='@'
  
data["Indexes"]= data["title"].str.find(sub)
print(data)

Мне нужны такие результаты

От, до , title Xavier5501, KudiiThaufeeq, RT @KudiiThaufeeq: Royal Rape, Royal Harassment, Royal Cocktail Party, Royal Pedo, Royal Bidding, Royal Maalee Bayaan, Royal Slavery..et

Спасибо.

1 Ответ

0 голосов
/ 10 июля 2020
  1. сократить записи до тех, у которых есть «@» в заголовке
  2. определить новый столбец, который представляет собой текст между «@» и «:»
  3. у вас осталось записи, в которых NaN остается в столбце. Я только что отфильтровал их
df = pd.read_csv("Newnormal.csv")
df = df[df["title"].str.contains("@")==True]
df["to"] = df["title"].str.extract(r".*([@][A-Z,a-z,0-9,_]+[:])")
df = df[["from","to","title"]]
df[~df["to"].isna()].to_csv("ToNewNormal.csv", index=False)
df[~df["to"].isna()]

вывод

    from    to  title
1   Xavier5501  @KudiiThaufeeq: RT @KudiiThaufeeq: Royal Rape, Royal Harassmen...
2   Suzane24979006  @USAID_NISHTHA: RT @USAID_NISHTHA: Don't step outside your hou...
3   sandeep_sprabhu @USAID_NISHTHA: RT @USAID_NISHTHA: Don't step outside your hou...
4   oliLince    @Timothy_Hughes:    RT @Timothy_Hughes: How to Get a Salesforce Th...
7   rismadwip   @danielepermana:    RT @danielepermana: Pak kasus covid per hari s...
... ... ... ...
992 Reptoid_Hunter  @sapiofoxy: RT @sapiofoxy: I literally can't believe we ha...
994 KPCResearch @sapiofoxy: RT @sapiofoxy: I literally can't believe we ha...
995 GreySparkUK @VoxSmartGlobal:    RT @VoxSmartGlobal: The #newnormal will see mo...
997 Gabboa10    @HuShameem: RT @HuShameem: One of @PGO_MV admin staff test...
999 wanjirunjendu   @ntvkenya:  RT @ntvkenya: AAK's Mugure Njendu shares insig...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...