Python pandas中DataFrame.dropna()删除缺失值用法实例_Python

前言

在 pandas 中，dataframe.dropna() 用于删除缺失值（nan 或 none），是数据清洗的关键操作。以下是详细用法和常见场景：

1. 基本语法

cleaned_df = df.dropna(
    axis=0,          # 删除行（默认）或列（axis=1）
    how='any',       # 'any'（默认，存在缺失即删除）或 'all'（全为缺失才删除）
    thresh=none,     # 保留非缺失值数量≥thresh的行/列
    subset=none,     # 仅检查指定列的缺失情况
    inplace=false    # 是否原地修改（false时返回新dataframe）
)

2. 核心参数详解

参数	说明	示例
axis	`0` 或 `'index'`：删除包含缺失值的行（默认） `1` 或 `'columns'`：删除列	`df.dropna(axis=1)`
how	`'any'`：行/列中任一缺失即删除 `'all'`：行/列全部缺失才删除	`df.dropna(how='all')`
thresh	保留至少含 `thresh` 个非缺失值的行/列（优先级高于 `how`）	`df.dropna(thresh=3)`
subset	仅对指定列（列表形式）检查缺失值	`df.dropna(subset=['age', 'salary'])`
inplace	`true`：直接修改原dataframe，不返回新对象 `false`：返回新dataframe（默认）	`df.dropna(inplace=true)`

3. 常见使用场景

(1) 删除所有含缺失值的行（默认行为）

import pandas as pd
import numpy as np

df = pd.dataframe({
    'a': [1, np.nan, 3],
    'b': ['x', np.nan, 'z'],
    'c': [10, 20, 30]
})

cleaned_df = df.dropna()
print(cleaned_df)

输出：

a b c
0 1.0 x 10
2 3.0 z 30

(2) 删除所有含缺失值的列

cleaned_df = df.dropna(axis=1)
print(cleaned_df)

输出：

c
0 10
1 20
2 30

(3) 仅当整行全为缺失值时删除

cleaned_df = df.dropna(how='all')

(4) 保留至少2个非缺失值的行

cleaned_df = df.dropna(thresh=2)

(5) 仅检查特定列的缺失值

cleaned_df = df.dropna(subset=['a', 'b'])

4. 注意事项

缺失值类型：pandas 将 none 和 np.nan 均视为缺失值。
性能优化：对大型dataframe，thresh 比 how 更高效。
替代方案：若不想删除数据，可用 df.fillna() 填充缺失值。

5. 可视化对比

原始数据 (df)：

a	b	c
1.0	‘x’	10
nan	nan	20
3.0	‘z’	30

执行 df.dropna() 后：

a	b	c
1.0	‘x’	10
3.0	‘z’	30

通过灵活组合参数，dropna() 可以精准控制数据清洗的粒度，是处理缺失值的利器！

总结

到此这篇关于python pandas中dataframe.dropna()删除缺失值用法的文章就介绍到这了,更多相关pandas dataframe.dropna()删除缺失值内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

Python中几种高效读取大文件的完整指南

在处理大型文件时（如内存只有4g却要读取8g的文件），我们需要采用特殊的技术来避免内存溢出。以下是几种高效读取大文件的方法。一、基本方法：逐行读取1. 使用文件... [阅读全文]

Python中re模块结合正则表达式的实际应用案例

前言在 python 中，re 模块是用于处理正则表达式的标准库。它非常适合用于文本清洗、提取和整理任务。下面是一些常见的使用 re 包结合正则表达式进行文本清... [阅读全文]

Python中enumerate函数详解之遍历中的索引神器

对话实录小白：（苦恼）我在遍历列表时，想知道每个元素的位置，只能用个计数器变量，好繁琐，有没有更简单的办法？专家：（掏出法宝）用enumerate函数，遍历同时... [阅读全文]

Python多方式分支switch case实现举例详解

简介在 python 编程语言中，没有内置的 switch case 功能。switch case 是一种常见的编程结构，它可以根据不同的条件值执行不同的代码块... [阅读全文]

Python类型系统typing模块示例详解

1. 模块概述typing模块在 python 3.5 中引入，用于支持类型提示（type hints）。它提供了：用于类型注释的工具泛型类型支持类型别名回调协... [阅读全文]

使用Python实现可恢复式多线程下载器

在数字时代，大文件下载已成为日常操作。当面对数十gb的蓝光原盘或企业级数据包时，传统单线程下载工具显得力不从心。本文将手把手教你用python打造专业级下载器，... [阅读全文]


验证码：

验证码：

Python pandas中DataFrame.dropna()删除缺失值用法实例

2025年06月30日 • Python •我要评论

前言