NLPのTEA:SnowNLPに基づいて自然言語処理を実現する入力テキストに対する感情分析(分詞→語性表示→ピンイン&簡繁変換→感情分析→テスト)
3480 ワード
NLPのTEA:SnowNLPに基づいて自然言語処理を実現する入力テキストに対する感情分析(分詞→語性表示→ピンイン&簡繁変換→感情分析→テスト)
目次
NLP分詞
NLP品詞表記
NLP感情分析—TEA
NLP共通機能(ピンイン出力、サポート方法)
NLPテスト
Segmented words=['今年','春節','枠','の','映画',',','私','特に','好き','呉','京','主演','の','映画',',','放浪','地球','''']
Tagging:Word=今年、Tag=t Word=春節、Tag=t Word=枠、Tag=Ng Word=の、Tag=u Word=映画、Tag=n Word=、Tag=w Word=私、Tag=r Word=私、Tag=r Word=私、Tag=r Word=特に、Tag=d Word=好き、Tag=v Word=呉、Tag=nr Word=京、Tag=nr Word=主演、Tag=nr Word=主演、Tag=v Word=の、Tag=u Word=映画、Tag=n Word=映画vn Word=地球、Tag=n Word=』, Tag = w
Sentiment score = 0.999991806695989
Pinyin = ['jin', 'nian', 'chun', 'jie', 'dang', 'de', 'dian', 'ying', ',', 'wo', 'you', 'qi', 'xi', 'huan', 'wu', 'jing', 'zhu', 'yan', 'de', 'dian', 'ying', '《', 'liu', 'lang', 'di', 'qiu', '》'] ['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'bm25', 'doc', 'han', 'idf', 'keywords', 'pinyin', 'sentences', 'sentiments', 'sim', 'summary', 'tags', 'tf', 'words']
私は特に呉京主演の映画が好きです.
Sentiment score = 0.9713889788637894 Sentiment score = 0.4228962549024792 Sentiment score = 0.031366312726148315
目次
NLP分詞
NLP品詞表記
NLP感情分析—TEA
NLP共通機能(ピンイン出力、サポート方法)
NLPテスト
NLP分詞
sentence = u" , 《 》"
s = SnowNLP(sentence)
print("Segmented words = {}".format(s.words))
Segmented words=['今年','春節','枠','の','映画',',','私','特に','好き','呉','京','主演','の','映画',',','放浪','地球','''']
NLP品詞表記
for word, tag in s.tags:
print("Word = {}, Tag = {}
".format(word, tag))
Tagging:Word=今年、Tag=t Word=春節、Tag=t Word=枠、Tag=Ng Word=の、Tag=u Word=映画、Tag=n Word=、Tag=w Word=私、Tag=r Word=私、Tag=r Word=私、Tag=r Word=特に、Tag=d Word=好き、Tag=v Word=呉、Tag=nr Word=京、Tag=nr Word=主演、Tag=nr Word=主演、Tag=v Word=の、Tag=u Word=映画、Tag=n Word=映画vn Word=地球、Tag=n Word=』, Tag = w
NLP感情分析—TEA
print("Sentiment score = {}".format(s.sentiments))
Sentiment score = 0.999991806695989
NLP共通機能(ピンイン出力、サポート方法)
print("Pinyin = {}".format(s.pinyin))
print(dir(s))
Pinyin = ['jin', 'nian', 'chun', 'jie', 'dang', 'de', 'dian', 'ying', ',', 'wo', 'you', 'qi', 'xi', 'huan', 'wu', 'jing', 'zhu', 'yan', 'de', 'dian', 'ying', '《', 'liu', 'lang', 'di', 'qiu', '》'] ['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'bm25', 'doc', 'han', 'idf', 'keywords', 'pinyin', 'sentences', 'sentiments', 'sim', 'summary', 'tags', 'tf', 'words']
sentence = u" , "
print(" = {}".format(s.han))
私は特に呉京主演の映画が好きです.
NLPテスト
sentence = u" 2019 , , 、 、 、 "
print("Sentiment score = {}".format(s.sentiments))
sentence = u" "
print("Sentiment score = {}".format(s.sentiments))
sentence = u" , , !"
print("Sentiment score = {}".format(s.sentiments))
Sentiment score = 0.9713889788637894 Sentiment score = 0.4228962549024792 Sentiment score = 0.031366312726148315