|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
我收拾整顿的一些闭于【Java转架构假想】的项目学习质料+视频(附教学~~)战巨匠一起分享、学习一下:
中文文本分类没有像英文文本分类一样只需求将单词一个个分开即可以了,中文文本分类需求将翰墨构成的词语分出去构成一个个背量。以是,需求分词。
那里操纵网下风止的开源分词东西结巴分词(jieba),它能够有效的将句子里的词语一个个的提掏出去,闭于结巴分词的原理此处没有再赘述,枢纽是他的操纵方法。
1、装置
结巴分词是一个的东西函数库,正在状况下装置,装置方法以下:
(1).x下
齐主动装置 : jieba 大要 pip jieba
半主动装置 :先下载 ,解压后运转 setup.py
脚动装置 :将jieba目次安排于当前目次大要site-目次
颠末 jieba [size=6]游客,您当前的用户组是:“游客”,以下内乱容需求正式会员可睹,请晋级到正式会员(面击进进)后持续查察。[/size] |
|