当前位置: 代码网 > it编程>编程语言>Asp.net > 关于dataframe.query()筛选tips

关于dataframe.query()筛选tips

2024年09月10日 Asp.net 我要评论
1、常规操作要从一个 dataframe 中,筛选出某些列值符合要求的行数据,可以用类似以下的语句实现:df[df[col] == x]也可以用 .query() 实现:df.query('col =

1、常规操作

要从一个 dataframe 中,筛选出某些列值符合要求的行数据,

可以用类似以下的语句实现:

df[df[col] == x]

也可以用 .query() 实现:

df.query('col == x')

2、其他操作方法

1)筛选出 col 列中值不是 bool 类型的行

df.query('col not in (true, false)')

2)筛选出 col 列中值为 nan、none 的值

df = pd.dataframe({"value": [3,4,9,10,11,np.nan,12]})

# 方法1
# 利用 'nan 不等于自身' 的性质,筛选出非 nan、none 的行
df.query('value == value')

# 方法2
# 类似的还有 isnull, notnull,isnan 等
df.query('value.notna()', engine='python')

# 方法3
df.query('value != 'nan'")

以上结果都是

out[28]: 
   value
0    3.0
1    4.0
2    9.0
3   10.0
4   11.0
6   12.0

# 筛选出不是 nat 的行(提前使用外部函数,超纲了哈)
df.query('col not in [@pd.nat]')

3)在 query 中筛选时引用外部变量

# 1. 外部为普通变量
# 方法1
pi = 3.1415
df.query('value < 10 and value > @pi')

# 方法2
pi = 3.1415
df.query(f'value < 10 and value > {pi}')

# 2.外部变量为 list
cond = [4, 12]
df.query('@cond[0] < value < @cond[1]')

# 3.外部变量为 dict,注意中括号中不能有引号,因此要取 dict 的值,需要用 dict.get() 的方式
cond = {'dn_band': 4, 'up_band': 12}
df.query("@cond.get('dn_band') < value < @cond.get('up_band')")

# 4.外部为函数
num = [2, 6] 
def func(x):
	return x * 2
df.query('@func(@num[0]) < value < @func(@num[1])')

以上的结果都是

out[30]: 
   value
3   10.0
4   11.0

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com