【自然语言处理系列】安装nltk_data和punkt库（亲测有效）_Python

一、下载nltk_data-gh-pages.zip数据文件

二、将nltk_data文件夹移到对应的目录

三、测试

四、成功调用punkt库

问题：

解决方案：

一、下载nltk_data-gh-pages.zip数据文件

nltk_data: nltk data - gitee.com

点击上方链接，进入到如下界面：

然后点击右上角的克隆下载，进入到如下界面，然后再点击下载zip,开始下载nltk_data-gh-pages.zip文件。

将下载得到的nltk_data-gh-pages.zip文件解压缩，解压缩后的内容如下：

重点：我们只需要其中的packages,将packages文件夹重新命名为nltk_data

二、将nltk_data文件夹移到对应的目录

import nltk
nltk.find('.')

运行上方两行代码，我的运行结果是

则将nltk_data文件夹移动到searched in下边的任意路径都可。

三、测试

运行结果出现以下界面就是安装成功了。

四、成功调用punkt库

问题：

有的小伙伴在成功完成上边的步骤之后，在运行下边两行代码的时候仍然报错。

import nltk
nltk.download('punkt')

或者

运行下方代码时，仍然报错，报错的大概意思是没有punkt库。

from nltk.tokenize import word_tokenize
from nltk.text import text
input_str = "today's weather is good, very windy and sunny, we have no classes in the afternoon,we have to play basketball tomorrow."
tokens = word_tokenize(input_str)

解决方案：

step1：打开刚刚路径下的nltk_data

step2：打开其中的tokenizers文件夹

发现其中虽然有punkt，但是还没有解压，关键点就在于将其解压到当前文件路径下。

同时还有一个关键点需要注意，否则很有可能不成功。解压punkt.zip之后，punkt文件夹里的内容应该是如下：

如果打开punkt文件夹，里边还嵌套一个punkt文件夹，再打开第二个punkt文件夹之后才出现上方的界面，这样就需要删除一个punkt文件夹了。也就是避免nltk_data\tokenizers\punkt\punkt的情况出现，理想状态是nltk_data\tokenizers\punkt\

Python图像边缘检测：边缘检算法原理及实现过程

图像边缘检测是计算机视觉和图像处理中的重要任务，它用于检测图像中物体和区域之间的边缘和轮廓。在Python中，有多种方法可以进行图像边缘检测，本文将介绍一种常用... [阅读全文]

精选：15款顶尖Python知识图谱（关系网络）绘制工具，数据分析的强力助手

知识图谱（关系网络）可以用简单的形状和线条显示复杂的系统，帮助我们理解数据之间的联系。我们今天将介绍15个很好用的免费工具，可以帮助我们绘制网络图。…

2024年07月28日 • 前端脚本

大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统

基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统通过构建医疗领域的知识图谱来实现计算机的深度学习，并且能够实现自动问答的功能。本次的内容研究主要是通过以Py…

2024年07月28日 • 前端脚本

知识图谱最简单的demo实现——基于pyvis

我们在上篇文章中介绍了知识图谱的简单实现，最后使用neo4j进行了展示，对于有些情况我们可能并不想为了查看知识图的结果再去安装一个软件去实现，那么我们能不能直接将三元组画出来呢/接…

2024年07月28日 • 前端脚本

第十篇：构建你的第一个知识图谱项目：从零开始

在数据驱动的世界中，知识图谱不仅仅是一个概念上的创新，它已经成为了连接复杂信息、提供深入见解的强大工具。无论您是数据科学家、软件开发人员还是业务分析师，构建知识图谱可以帮助您组织零…

2024年07月28日 • 前端脚本

【小沐学Python】Python实现语音识别（Whisper）

Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。Open AI在2022年9月21…

2024年07月28日 • 前端脚本


验证码：

验证码：

【自然语言处理系列】安装nltk_data和punkt库（亲测有效）

2024年07月28日 • Python •我要评论

一、下载nltk_data-gh-pages.zip数据文件

二、将nltk_data文件夹移到对应的目录

三、测试

四、成功调用punkt库

问题：

解决方案：

相关文章:

精选：15款顶尖Python知识图谱（关系网络）绘制工具，数据分析的强力助手

大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统

知识图谱最简单的demo实现——基于pyvis

第十篇：构建你的第一个知识图谱项目：从零开始

【小沐学Python】Python实现语音识别（Whisper）

发表评论