当前位置: 代码网 > it编程>前端脚本>Python > pandas.str.replace 不起作用的解决方法

pandas.str.replace 不起作用的解决方法

2024年05月18日 Python 我要评论
背景最近在处理别人给的数据时,大概 700w+ 行数据,发现有的字段里面存在换行符、斜杠等一些特殊字符,于是想着就用python来处理下,因为pandas处理数据还是很方便,结果发现这些转义字符:\n

背景

最近在处理别人给的数据时,大概 700w+ 行数据,发现有的字段里面存在换行符、斜杠等一些特殊字符,于是想着就用python来处理下,因为pandas处理数据还是很方便,结果发现这些转义字符: \n\r\ 一直替换不掉,后来经过研究成功替换,分享出来供大家参考

演示数据

演示数据

python 与 pandas版本

特意说一下版本,现在不同的版本功能可能不一样

软件版本

问题复现

因为涉及到字符串替换,所以直接想到的方法是用 pandas.series.str.replace 来进行替换,但是一直不能成功,即使双斜杠也不行

问题复现

问题解决

在上面第7个单元格运行时,报了一个错误,futurewarning: the default value of regex will change from true to false in a future version.,于是就翻看了 pandas.series.str.replace 的官方文档:http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.series.str.replace.html,文档中写了 regex:bool, default true,正则默认是开启的,个人经验:正则表达式来处理转义字符是比较麻烦的事,因为里面的斜杠不知道要写几个,总是记不住

官方文档

经过测试如下几种方法,可行:

方法1:明确使用正则来处理,并且使用原字符 r

方法1

方法2:明确使用正则来处理,正常的写法,经测试需要4个斜杠

方法2

方法3:不使用正则来处理,但是在处理单个斜杠时,必须用2个

方法3

到此这篇关于pandas.str.replace 不起作用的解决方法的文章就介绍到这了,更多相关pandas.str.replace 不起作用内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网! 

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com