一、简介
dataframe.drop
是 pandas 库中一个非常实用的函数,用于删除 dataframe 中的行或列。通过指定列名或行索引,可以灵活地从数据集中移除不需要的数据。这对于数据清洗和预处理非常有用。
二、语法和参数
dataframe.drop(labels, axis=0, index=false, columns=false, level=none, inplace=false)
参数
- labels: 要删除的标签,可以是数组、列表、元组或单个标签。
- axis: 删除的轴,0 表示行,1 表示列,默认为 0。
- index: 如果为 true,则删除标签为索引。
- columns: 如果为 true,则删除标签为列。
- level: 指定删除标签的级别,仅在使用多级索引时有效。
- inplace: 如果为 true,则在原地修改 dataframe,否则返回一个新的 dataframe。
三、实例
3.1 删除指定行
import pandas as pd # 创建一个示例 dataframe df = pd.dataframe({ 'a': [1, 2, 3, 4], 'b': [5, 6, 7, 8], 'c': [9, 10, 11, 12] }) # 删除第一行 result = df.drop(0) print(result)
输出:
a b c
1 2 6 10
2 3 7 11
3 4 8 12
3.2 删除指定列
# 删除列 'b' result = df.drop('b', axis=1) print(result)
输出:
a c
0 1 9
1 2 10
2 3 11
3 4 12
3.3 删除多个行和列
import pandas as pd # 创建一个示例 dataframe df = pd.dataframe({ 'a': [1, 2, 3, 4], 'b': [5, 6, 7, 8], 'c': [9, 10, 11, 12] }) # 删除列 'b' result = df.drop(columns='b', axis=1) print(result)
输出:
a b
0 1 5
2 3 7
3 4 8
3.4 使用 inplace 修改原 dataframe
import pandas as pd # 创建一个示例 dataframe df = pd.dataframe({ 'a': [1, 2, 3, 4], 'b': [5, 6, 7, 8], 'c': [9, 10, 11, 12] }) print(df) # 删除列 'a' 并直接修改原 dataframe df.drop('a', axis=1, inplace=true) print(df)
输出:
a b c
0 1 5 9
1 2 6 10
2 3 7 11
3 4 8 12
b c
0 5 9
1 6 10
2 7 11
3 8 12
四、注意事项
- 索引和列名:确保删除的标签是存在的,否则会引发 keyerror。
- inplace 参数:使用 inplace=true 时,原 dataframe 会被修改,不返回新的 dataframe。
- 多级索引:在使用多级索引时,level 参数可以指定删除标签的级别。
- 数据类型:删除操作不会影响 dataframe 的数据类型。
扩展
del与drop的区别
在python中del和drop方法都能够删除dataframe中的列数据,但两者也有着些许区别:
1. del属于python的内置函数,drop属于pandas中的内置函数
2. del 删除列
drop 删除行和列(默认行)
3. drop一次可以处理多个项目;del一次只能操作一个
4. drop可以就地操作或返回副本;del仅是就地操作
5. 两种函数在执行效率上很接近,但是在较大数据上,drop函数优势更明显,尤其是在处理多列数据时
del crime['total'] crime=crime.drop(['total'],axis=1)
到此这篇关于pandas中dataframe.drop()函数的具体使用的文章就介绍到这了,更多相关pandas dataframe.drop()内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论