|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
截至分词的各种调试:
1.分词
第一步,最本初的分词法,jieba.cut 分词目标:从txt中导进语言,然后用结巴分词
<p><pre> <code class="language-python">import jieba
f=open('d://shuju.txt','r')
test_sent=f.read()
words=jieba.cut(test_sent)
print('/'.join(words))</code></pre></p>
.join的方法正在底子教程内里有阐明,是根据切分的处所减上前里念减的东西【那里为/】
第一步得出的谜底以下:
我们能够发明,有一些词分错了。好比:改动传统 本来该当是两个词,被分白一个词了 年夜数据本来游客,您当前的用户组是:“游客”,以下内乱容需求正式会员可睹,请晋级到正式会员(面击进进)后持续查察。 |
|