pandas中处理两列数据
程序员文章站
2022-06-05 19:30:22
...
找到两列中相通的字符
找出这两列中相同的字符
1、读取数据为dataframe个格式
2.查看是否有空值
3、将两列数据转化为小写字母。使用lower()函数
import numpy as np
from numpy import nan as NA
df1['S_brand']=df1.brandName.apply(lambda x : x.lower() if not pd.isnull(x) else NA)
df1['S_key_word']=df1.key_word.apply(lambda x : x.lower() if not pd.isnull(x) else NA)
``
增加了两列,然后对这两列进行数据分析
定义一个函数,有可以传递两列数据。返回值作为新的一列数据
```python
def equal_word(B,A): # A ->关键词 B->品牌词
A,B=str(A),str(B)
if B in A :
return False #如果包含,返回False
else:
return True #如果不包含,则返回True
df2=df1[['S_key_word','S_brand']]
df1['bool']=df2.apply(lambda x :equal_word(x['S_brand'] ,x['S_key_word']),axis=1)
此时就可以进行筛选了,将bool这一列为TRUE筛选出来,即使两列没有交集的dataframe数据
保存为excel