python「結巴」分詞(jieba)

371 ワード

#-*- coding: UTF-8 -*- 
import jieba

str = jieba.cut("               ，          ",cut_all=False)

s=list(str)
print s      #  [u'\u5c0f', u'\u660e'...]
for i in range(len(s)):
	print s[i].encode("utf-8")   #          [u'\u5c0f', u'\u660e'...]

cut_allはTrue(フルモード)でもFalse(デフォルトモード/精密モード)でも構いません

414エラーに遭遇した話

子供と一緒にプログラミング15章を勉強します