|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
jieba库
jieba库是具有壮大分词服从的第三圆库。正在中文文本分词中具有较好的操纵暗示。事情机造为
操作一此中文词库,必定汉字之间的联系关系概率汉字间概率年夜的构成词组,组成份词功效除体系给定分词,借撑持用户自定义增长词组
jieba分词的三种情势:
1、切确分词情势:jieba.lcut() 返回一个列表规范的分词功效;
2、齐情势:jieba.lcut(,=True),返回一个列表规范的分词功效,存正在冗余
3、搜刮引擎情势:jieba.(),返回一个列表规范的分词功效,存正在冗余
>>> str="结巴库测试时操纵的字符串例子"
>>> eg1=jieba.lcut(str)
>>> eg1
['结', '巴库'游客,您当前的用户组是:“游客”,以下内乱容需求正式会员可睹,请晋级到正式会员(面击进进)后持续查察。 |
|