当前位置:首页 > 服务端 > jieba分词--python

jieba分词--python

2022年11月09日 22:52:02服务端6

import
os import os.path import codecs import numpy import pandas import jieba #创建语料库 corpos = pandas.DataFrame(columns=['filePath', 'content']) for root, dirs, files in os.walk( "D:\\PDM\\2.1\\SogouC.mini\\Sample\\C000007\\" ): for name in files: filePath = root + '\\' + name; f = codecs.open(filePath, 'r', 'utf-8') content = f.read() f.close() corpos.loc[len(corpos)+1] = [filePath, content.strip()]; #进行分词 segments = pandas.DataFrame(columns=["filePath", 'segment']) for content in corpos['content']: segs = jieba.cut(content) for seg in segs: segments.loc[len(segments)+1] = [filePath, seg]

 

作者:草莓干123456
来源链接:https://www.cnblogs.com/chenyaling/p/5556571.html

版权声明:
1、JavaClub(https://www.javaclub.cn)以学习交流为目的,由作者投稿、网友推荐和小编整理收藏优秀的IT技术及相关内容,包括但不限于文字、图片、音频、视频、软件、程序等,其均来自互联网,本站不享有版权,版权归原作者所有。

2、本站提供的内容仅用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯相关权利人及本网站的合法权利。
3、本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站(javaclubcn@163.com),我们将第一时间核实后及时予以删除。


本文链接:https://www.javaclub.cn/server/68988.html

分享给朋友:

“jieba分词--python” 的相关文章

【python】函数用法详解(一)

【python】函数用法详解(一)

✅作者简介:大家好我是姐姐划船吗?让我们一起共同进步吧!🏆 📃个人主页:姐姐划船吗? 🔥系列专栏:学会python,逆天改命 💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞 💬格言:静坐要辨己过,闲谈莫论人非🔥 学习目标:   &nbs...

Python快速学习05:面向对象

Python快速学习05:面向对象

        系列文章:[传送门]  Python对象是Python语言的核心部分。Python使用类(class)和对象(object),进行面向对象(object-oriented programming...

Windows下python环境变量配置

默认情况下,在windows下安装python之后,系统并不会自动添加相应的环境变量。此时不能在命令行直接使用python命令。   1. 首先需要在系统中注册python环境变量:假设python的安装路径为c:\python2.6,则修改我的电脑->属性...

Win 10安装Python及环境变量配置

Win 10安装Python及环境变量配置

  安装项目报错     解决方法:  https://blog.csdn.net/lyj_viviani/article/details/51763101 君不见,高堂明镜悲白发,朝如青丝...

python学习——解决:'chromedriver' executable needs to be in PATH问题

1、chromedriver.exe放在chrome安装目录文件夹 2、chromedriver.exe放在python安装目录文件夹 3、将chrome安装目录配置环境变量加到PATH中 作者:KellyWu 来源链接...

在Java中调用Python

在Java中调用Python

写在前面 在微服务架构大行其道的今天,对于将程序进行嵌套调用的做法其实并不可取,甚至显得有些愚蠢。当然,之所以要面对这个问题,或许是因为一些历史原因,或者仅仅是为了简单。恰好我在项目中就遇到了这个问题,需要在Java程序中调用Python程序。关于在Java中调用Python程序...

python笔记

python笔记

网上推荐使用python3:     安装python之后(安装过程参考“菜鸟教程”),配置环境变量,这样可以在cmd中的任何目录调用python的执行程序。 查询python版本:    ...

windows 安装python环境

windows 安装python环境

1.下载python安装包 www.python.org/downloads 2.安装 3,配置环境变量,系统变量path 中加入python可执行文件的路径。 作者:Mr.peter 来源链接:https...

win10安装python  3.7后(正确配置了环境变量)使用pip命令失败 :Unknown or unsupported command 'list',原因是卸载loadrunner 11没卸载干净

win10安装python 3.7后(正确配置了环境变量)使用pip命令失败 :Unknown or unsupported command 'list',原因是卸载loadrunner 11没卸载干净

问题:安装python 3.7后,正确配置环境变量,使用pip命令报错:Unknown or unsupported command 'list' 搜索问题原因:卸载loadrunner 11没卸载干净 解决方法:删除C盘下的C:\strawberry文件夹 &nbs...

在Windows系统下设置Python的环境变量,以及安装BeautifulSoup

默认情况下,在windows下安装python之后,系统并不会自动添加相应的环境变量。此时不能在命令行直接使用python命令。   1. 首先需要在系统中注册python环境变量:假设python的安装路径为c:\python2.6,则修改我的电脑->属性...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。