关于pandas中两个不同的Series相减的问题
众所周知,pandas中有两种主要的数据结构,一种是DataFrame,一种是Series,DataFrame的行或列其实都是Series,然后一般情况我们不会对两个df或者两个series进行计算,但是事实上pandas是支持两个df或者series的整体运算的,具体算法就是根据对应的行列索引进行计算,比如进行加减乘除,只对行列索引相同的进行计算,剩下的会变成Nan,所以基于这个原理,其实pandas也支持不同长度的Series进行计算,这里有个坑要注意,由于是按索引进行计算,如果索引不同,则计算结果就会
众所周知,pandas中有两种主要的数据结构,一种是dataframe,一种是series,dataframe的行或列其实都是series,然后一般情况我们不会对两个df或者两个series进行计算,但是事实上pandas是支持两个df或者series的整体运算的,具体算法就是根据对应的行列索引进行计算,比如进行加减乘除,只对行列索引相同的进行计算,剩下的会变成nan,所以基于这个原理,其实pandas也支持不同长度的series进行计算,这里有个坑要注意,由于是按索引进行计算,如果索引不同,则计算结果就会为nan,今天就遇到这个坑,排查了很久,记录一下。
示例代码
import pandas as pd
import numpy as np
df = pd.dataframe({
'a':np.arange(10),
'b':np.arange(10),
'c':np.arange(10),
})
df1 = pd.dataframe({
'a':np.arange(5)
})
df['a'] - df1['a']
结果
0 0.0
1 0.0
2 0.0
3 0.0
4 0.0
5 nan
6 nan
7 nan
8 nan
9 nan
name: a, dtype: float64
相关文章:
-
-
时间复杂度的定义:在计算机科学中,(数学函数表达式),它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有把程序放在机器上运行起来,才能知道。但…
-
我们需要创建一个seqlist.h头文件,seqlist.c文件存放函数,还有一个.c的测试文件。…
-
栈和队列都是线性表中比较特殊的一种,这俩种我们都学了那么用队列实现栈不知道把你难倒了嘛!看完保证你对队列的理解又上一个档次!…
-
本篇文章讲解了图的基本概念以及关于图的一些专有名词. 讲解了图的存储之邻接矩阵和邻接表. 最后模拟实现了邻接矩阵版的图…
-
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论