当前位置: 代码网 > it编程>前端脚本>Python > Pandas 处理DataFrame中的inf值实现

Pandas 处理DataFrame中的inf值实现

2024年05月15日 Python 我要评论
inf 表示正无穷大或负无穷大,通常是在数学计算中产生的结果。例如,import numpy as np# 创建一个包含 infinity 的数组arr = np.array([3.0, 4.0, n

inf 表示正无穷大或负无穷大,通常是在数学计算中产生的结果。

例如,

import numpy as np

# 创建一个包含 infinity 的数组
arr = np.array([3.0, 4.0, np.inf, -np.inf])
print(arr)

1)通过where方法和isinf方法查找inf行和列

import pandas as pd
import numpy as np

df = pd.dataframe(np.arange(18).reshape(3,6), index=list('abc'), columns=list('uvwxyz'))
print('*'*36)
# 将df的第一列变成inf
df.u = np.inf
print(df)
print('*'*36)
#输出结果,是一个tuple,前面array是横坐标,后面的array是纵坐标。
print(np.where(np.isinf(df)))

2)数据处理

import pandas as pd
import numpy as np

df = pd.dataframe(np.arange(18).reshape(3,6), index=list('abc'), columns=list('uvwxyz'))
print('*'*36)
# 将df的第一列变成nan
df.u = np.inf
print(df)
print('*'*36)
#输出结果,是一个tuple,前面array是横坐标,后面的array是纵坐标。
print(np.where(np.isinf(df)))
print('*'*36)
# 使用 replace 替换整个 dataframe 中的 inf 值为特定值
print(df.replace(np.inf, 1, inplace=false))
print('*'*36)
#使用np.isinf()
df[np.isinf(df)]=11.0
print(df)
print('*'*36)
# 创建一个包含 inf 的数组
arr = np.array([3.0, 4.0, np.inf, 6.0])
# 将inf值为5
arr[np.isinf(arr)]=5
print(arr)

3)删除有inf的行

import pandas as pd
import numpy as np

x=np.arange(0,30).reshape(5,6)
x=np.array(x,dtype=float)
x[2,3]=np.inf
x[0,4]=np.inf
print(x)
print('*'*36)
#删除包含inf的行
x1=np.delete(x,np.where(np.isinf(x))[0],axis=0)
print(x1)

注意:np.inf和np.nan的处理方法基本相同,注意调用处理时方法名。none是python中用于标识空缺数据,nan是nunpy和pandas中用于标识空缺数据,none是一个python特殊的数据类型, 但是nan却是用一个特殊的float。

在用dataframe计算变化率时,例如(今天-昨天) / 昨天恰好为(2-0) / 0时,这些结果数据会变为inf。

为了方便后续处理,可以利用numpy,将这些inf值进行替换。

1. 将某1列(series格式)中的 inf 替换为数值。

import numpy as np

df['col'][np.isinf(df['col'])] = -1

2. 将某1列(series格式)中的 inf 替换为na值。

import numpy as np

df['col'][np.isinf(df['col'])] = np.nan

3. 将整个dataframe中的 inf 替换为数值(空值同理)。#感谢评论区的补充

import numpy as np

df.replace(np.inf, -1) #替换正inf为-1

#替换正负inf为na,加inplace参数 
df.replace([np.inf, -np.inf], np.nan, inplace=true)

(0)

相关文章:

  • pandas分组聚合(agg,transform,apply)

    在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根…

    2024年05月15日 前端脚本
  • python实现一个通用的插件类

    python实现一个通用的插件类

    本文提供了一种插件类的实现方案。定义插件管理器插件管理器用于注册、销毁、执行插件。import abcfrom functools import wrapsfr... [阅读全文]
  • 使用Python实现Excel表格转图片

    使用Python实现Excel表格转图片

    在数据处理与信息分享过程中,excel表格作为一种强大的数据管理工具被广泛应用,它能够清晰、有序地呈现大量数据和复杂计算结果。然而,有时我们会遇到需要将exce... [阅读全文]
  • pandas求行最大值及其索引的实现

    pandas求行最大值及其索引的实现

    在平时训练完模型后,需要对模型预测的值做进一步的数据操作,例如在对模型得到类别的概率值按行取最大值,并将最大值所在的列单独放一列。数据格式如下:arrayarr... [阅读全文]
  • 使用Python实现绘制发散条形图

    使用Python实现绘制发散条形图

    发散条形图用于简化多个组的比较。它的设计允许我们比较各组中的数值。它还帮助我们快速地想象出有利的和不利的或积极的和消极的反应。条形图由从中间开始的两个水平条的组... [阅读全文]
  • pandas中concat函数实现横向连接

    pandas中concat函数实现横向连接

    在pandas中,concat函数可用于合并不同的series和dataframe对象。当需要将两个或多个dataframe对象在横向方向进行连接时,可以使用c... [阅读全文]

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com