当前位置:首页 > 服务端 > jieba库的使用

jieba库的使用

2022年11月08日 08:17:00服务端8

常用函数:

jieba.lcut(s):精确模式,返回一个列表类型的分词结果

>>>jieba.lcut('中国是一个伟大的国家')
['中国', '是', '一个', '伟大', '的', '国家']

jieba.lcut(s, cut_all=True):全模式,返回一个列表类型的分词结果,存在冗余

>>>jieba.lcut('中国是一个伟大的国家', cut_all=True)
['中国', '国是', '一个', '伟大', '的', '国家']

jieba.lcut_for_search(s):搜索引擎模式,返回一个列表类型的分词结果,存在冗余

>>>jieba.lcut_for_search('中华人民共和国是伟大的')
['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '伟大', '的']

jieba.add_word(w)

>>>jieba.add_word('蟒蛇语言')

作者:little_trash_
来源链接:https://blog.csdn.net/little_trash_/article/details/122751578

版权声明:
1、JavaClub(https://www.javaclub.cn)以学习交流为目的,由作者投稿、网友推荐和小编整理收藏优秀的IT技术及相关内容,包括但不限于文字、图片、音频、视频、软件、程序等,其均来自互联网,本站不享有版权,版权归原作者所有。

2、本站提供的内容仅用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯相关权利人及本网站的合法权利。
3、本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站(javaclubcn@163.com),我们将第一时间核实后及时予以删除。


本文链接:https://www.javaclub.cn/server/68462.html

标签: jieba
分享给朋友:

“jieba库的使用” 的相关文章

.net 的一个分词系统(jieba中文分词的.NET版本:jieba.NET)

.net 的一个分词系统(jieba中文分词的.NET版本:jieba.NET)

简介 平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词,于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单,同时分词的结果也令人印象深刻,有兴趣的可以到它的在线演示站点体验下(注意第三行文字)。 .NET平台上常见的分词组件...

python中lcut啥意思

python学习笔记——jieba库入门 python学习笔记——jieba库入门 一、查找官方文档 https://pypi.org/project/jieba/ 二、介绍 jieba(中文意思是“结巴”)中...

jieba的一些使用

最近处理中文数据集经常用到jieba,记录一下遇到的问题。 1.分词 最常用的就是jieba.cut(text) 一般还会使用jieba.posseg进行词性过滤 词性表: Ag 形语素...

Python 中文分词 jieba(小白进)

Python 中文分词 jieba(小白进)

文章目录 0、安装 1、分词 1.1、CUT函数简介 1.2、分词模式 1.3、词性标注 1.4、词语出现的位置 2、...

NLP-jieba篇

和拉丁语系不同,亚洲语言是不用空格分开每个有意义的词的。而当我们进行自然语言处理的时候,大部分情况下,词汇是我们对句子和文章理解的基础,因此需要一个工具去把完整的文本中分解成粒度更细的词。 jieba就是这样一个非常好用的中...

jieba库安装我和你干上了

jieba库安装我和你干上了

最近老是遇到第三方库安装不上。比如jieba库。 1. jieba库能干嘛 jieba“结巴”中文分词:做最好的 Python 中文分词组件 “Jieba” (Chinese for “to stutter”) Chinese text...

简单粗暴认识jieba(结巴)

转载:https://blog.csdn.net/comeonyangzi/article/details/80500509 jieba(结巴)是一个强大的分词库,完美支持中文分词,本文对其基本用法做一个简要总结...

Python中文分词 jieba

Python中文分词 jieba

三种分词模式与一个参数 以下代码主要来自于jieba的github,你可以在github下载该源码 import jieba seg_list = jieba.cut("我来到北京清华大学", cut_all=True, HMM=False) #jieba.c...

jupyter怎么安装jieba

最近用到 jieba ,在anaconda 怎么也安装补上,在网上找了一下,发现有几篇文章写得很好,但是为了怕自己以后再浪费时间,这里还是做个记录。 通常安装模块直接用pip install jieba,或者conda install jieba,但是有一些模块...

python jieba模块基本命令讲解

1、分词精确模式: import jieba s="fdsfdsfsdfds" s_cut_jq=jieba.cut(s) #可见分词结果返回的是一个生成器,可实现拼接 cut_jq=','.join(s_cut_jq)全模式: s_cut_qms=jieba.cut(s,cut...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。