jieba库的使用
常用函数:
jieba.lcut(s):精确模式,返回一个列表类型的分词结果
>>>jieba.lcut('中国是一个伟大的国家')
['中国', '是', '一个', '伟大', '的', '国家']
jieba.lcut(s, cut_all=True):全模式,返回一个列表类型的分词结果,存在冗余
>>>jieba.lcut('中国是一个伟大的国家', cut_all=True)
['中国', '国是', '一个', '伟大', '的', '国家']
jieba.lcut_for_search(s):搜索引擎模式,返回一个列表类型的分词结果,存在冗余
>>>jieba.lcut_for_search('中华人民共和国是伟大的')
['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '伟大', '的']
jieba.add_word(w)
>>>jieba.add_word('蟒蛇语言')
作者:little_trash_
来源链接:https://blog.csdn.net/little_trash_/article/details/122751578
版权声明:
1、JavaClub(https://www.javaclub.cn)以学习交流为目的,由作者投稿、网友推荐和小编整理收藏优秀的IT技术及相关内容,包括但不限于文字、图片、音频、视频、软件、程序等,其均来自互联网,本站不享有版权,版权归原作者所有。
2、本站提供的内容仅用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯相关权利人及本网站的合法权利。
3、本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站(javaclubcn@163.com),我们将第一时间核实后及时予以删除。