inf 表示正无穷大或负无穷大,通常是在数学计算中产生的结果。
例如,
import numpy as np # 创建一个包含 infinity 的数组 arr = np.array([3.0, 4.0, np.inf, -np.inf]) print(arr)
1)通过where方法和isinf方法查找inf行和列
import pandas as pd import numpy as np df = pd.dataframe(np.arange(18).reshape(3,6), index=list('abc'), columns=list('uvwxyz')) print('*'*36) # 将df的第一列变成inf df.u = np.inf print(df) print('*'*36) #输出结果,是一个tuple,前面array是横坐标,后面的array是纵坐标。 print(np.where(np.isinf(df)))
2)数据处理
import pandas as pd import numpy as np df = pd.dataframe(np.arange(18).reshape(3,6), index=list('abc'), columns=list('uvwxyz')) print('*'*36) # 将df的第一列变成nan df.u = np.inf print(df) print('*'*36) #输出结果,是一个tuple,前面array是横坐标,后面的array是纵坐标。 print(np.where(np.isinf(df))) print('*'*36) # 使用 replace 替换整个 dataframe 中的 inf 值为特定值 print(df.replace(np.inf, 1, inplace=false)) print('*'*36) #使用np.isinf() df[np.isinf(df)]=11.0 print(df) print('*'*36) # 创建一个包含 inf 的数组 arr = np.array([3.0, 4.0, np.inf, 6.0]) # 将inf值为5 arr[np.isinf(arr)]=5 print(arr)
3)删除有inf的行
import pandas as pd import numpy as np x=np.arange(0,30).reshape(5,6) x=np.array(x,dtype=float) x[2,3]=np.inf x[0,4]=np.inf print(x) print('*'*36) #删除包含inf的行 x1=np.delete(x,np.where(np.isinf(x))[0],axis=0) print(x1)
注意:np.inf和np.nan的处理方法基本相同,注意调用处理时方法名。none是python中用于标识空缺数据,nan是nunpy和pandas中用于标识空缺数据,none是一个python特殊的数据类型, 但是nan却是用一个特殊的float。
在用dataframe计算变化率时,例如(今天-昨天) / 昨天恰好为(2-0) / 0时,这些结果数据会变为inf。
为了方便后续处理,可以利用numpy,将这些inf值进行替换。
1. 将某1列(series格式)中的 inf 替换为数值。
import numpy as np df['col'][np.isinf(df['col'])] = -1
2. 将某1列(series格式)中的 inf 替换为na值。
import numpy as np df['col'][np.isinf(df['col'])] = np.nan
3. 将整个dataframe中的 inf 替换为数值(空值同理)。#感谢评论区的补充
import numpy as np df.replace(np.inf, -1) #替换正inf为-1 #替换正负inf为na,加inplace参数 df.replace([np.inf, -np.inf], np.nan, inplace=true)
发表评论