NLPのTEA:SnowNLPに基づいて自然言語処理を実現する入力テキストに対する感情分析(分詞→語性表示→ピンイン&簡繁変換→感情分析→テスト)

3480 ワード

NLPのTEA:SnowNLPに基づいて自然言語処理を実現する入力テキストに対する感情分析(分詞→語性表示→ピンイン&簡繁変換→感情分析→テスト)
 
 
 
 
目次
NLP分詞
NLP品詞表記
NLP感情分析—TEA
NLP共通機能(ピンイン出力、サポート方法)
NLPテスト
 
 
 
 
 
 
 

NLP分詞

sentence = u" , 《 》"
s = SnowNLP(sentence)

print("Segmented words = {}".format(s.words))

Segmented words=['今年','春節','枠','の','映画',',','私','特に','好き','呉','京','主演','の','映画',',','放浪','地球','''']
 
 
 

NLP品詞表記

for word, tag in s.tags:
    print("Word = {}, Tag = {}
".format(word, tag))

Tagging:Word=今年、Tag=t Word=春節、Tag=t Word=枠、Tag=Ng Word=の、Tag=u Word=映画、Tag=n Word=、Tag=w Word=私、Tag=r Word=私、Tag=r Word=私、Tag=r Word=特に、Tag=d Word=好き、Tag=v Word=呉、Tag=nr Word=京、Tag=nr Word=主演、Tag=nr Word=主演、Tag=v Word=の、Tag=u Word=映画、Tag=n Word=映画vn Word=地球、Tag=n Word=』, Tag = w
 
 
 

NLP感情分析—TEA

print("Sentiment score = {}".format(s.sentiments))

Sentiment score = 0.999991806695989
 
 
 
 

NLP共通機能(ピンイン出力、サポート方法)

print("Pinyin = {}".format(s.pinyin))

print(dir(s))

Pinyin = ['jin', 'nian', 'chun', 'jie', 'dang', 'de', 'dian', 'ying', ',', 'wo', 'you', 'qi', 'xi', 'huan', 'wu', 'jing', 'zhu', 'yan', 'de', 'dian', 'ying', '《', 'liu', 'lang', 'di', 'qiu', '》'] ['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'bm25', 'doc', 'han', 'idf', 'keywords', 'pinyin', 'sentences', 'sentiments', 'sim', 'summary', 'tags', 'tf', 'words']  
sentence = u" , "
print("  = {}".format(s.han))

私は特に呉京主演の映画が好きです.
 
 
 
 

NLPテスト

sentence = u" 2019 , , 、 、 、 "
print("Sentiment score = {}".format(s.sentiments))

sentence = u" "
print("Sentiment score = {}".format(s.sentiments))
 
sentence = u" , , !"
print("Sentiment score = {}".format(s.sentiments))

Sentiment score = 0.9713889788637894 Sentiment score = 0.4228962549024792 Sentiment score = 0.031366312726148315