也就是深挖df[df['columnA']==B]的细节,以及等价的其他写法
2025-08-09
总结起来就是:
- (df['columnA']==B) 返回的东西是一串True/False,长度和df相同,“盖在”df上面,过滤出True对应的数值,所以被称为mask
- df[mask],其中mask可以是pandas.Series(但是需要带索引---下面单独说),也可以是numpy array,甚至可以是python list
- 如果mask是pandas.Series,那么“盖住”的逻辑遵循df.index(row index)而不是物理索引;如果mask是np array/list,那么“盖住”的逻辑是物理索引
- mask的长度必须和df相同
下面是一些学习代码:
Last Modified in 2025-08-09