テンセント文智自然言語処理紹介と感情分析API呼び出し
一.製品の概要
文智中国語の意味開放プラットフォームは並列計算システムと分布式爬虫プラットフォームに基づいて、独特な意味分析技術を結合して、ワンストップでユーザーNLP、トランスコード、抽出、全ネットデータのキャプチャなどの中国語の意味分析需要を満たす開放プラットフォームである.ユーザーはプラットフォームが対外に提供するOpenAPIに基づいて検索、推薦、舆情、発掘などの意味分析応用を実現することができる.
テンセント雲文智中国語語義プラットフォームはSDKモジュール方式でサービスを提供し、多種のプログラミング言語をサポートする
二.製品の機能
Actionidクエリー:https://cloud.tencent.com/document/product/271/2050
1.分詞/ネーミングエンティティ識別API、インテリジェント分詞(基本語+フレーズ)、品詞表記、ネーミングエンティティ識別機能を提供する.Action id=LexicalAnalysis
2.感情分析API、情報に対して感情上の順方向、負方向及び中性を評価し、Actionid=TextSentiment
3.テーマ分類API、自動テキスト分類サービスを提供し、現在プラットフォームが識別できるカテゴリは招聘、映画・テレビ、音楽、健康養生、財経、広告普及、犯罪、政治など90以上のカテゴリを含む.
4.キーワード抽出API、キーワード抽出プラットフォームに基づいて、ユーザーにニュース内容キーワード自動抽出、評論キーワード抽出などの基礎サービスを提供する.カスタム辞書のサポート
5.機密情報識別API
6.文法はAPIを分析し、文法は文の中の語と語の関係を分析し、文の主幹、核心語などを抽出するのに用いることができる.文法分析は文をよりよく理解することができ、機械翻訳、自動問答、知識抽出などの分野で応用できる.
7.同義語API
8.誤り訂正API、短いテキストに対する自動誤り訂正機能を実現し、ユーザーは業務データとログを提供するだけである
9.トランスコードAPI、ウェブトランスコードとウェブ名刺、ウェブトランスコードはPC機に展示された2次元ページをモバイル端末装置に展示された1次元ページに変換する.ページ名刺は、ページを主体画像、タイトル、要約の組み合わせに簡略化し、カード形式で展示し、ページの共有、コレクション、普及に適しています.ユーザーはWebページurlをコミットするだけです
10.抽出APIをダウンロードし、分布式爬虫類システムに基づいて、ユーザーはurlを提供してデータのキャプチャを完成することができる.分布式爬虫類システムは全網urlに対して正確なスケジューリング、知能圧力掘削、適応ページ更新周期予測を行うことによって、自動ルーティング、url不正行為識別、知能テーマキャプチャなどの機能を実現することができる.
7.3.API呼び出し
1.API要求構造
ドメイン名アクセスアドレス:wenzhi.api.qcloud.com
通信プロトコル:HTTPS
要求方法:POSTGET可、一般使用GET
文字コード:utf-8
名前
説明
コメント
APIエントリ
API呼び出しWebServiceエントリ
https://wenzhi.api.qcloud.com/v2/index.php
共通パラメータ
各インタフェースに含まれる汎用パラメータ
詳しくは3.共通パラメータ
コマンド名
Action=LexicalAnalysisなどのAction指定を使用して実行するAPIのコマンドの名前
完全な命令はAPIクエリを参照してください
めいれいパラメータ
各特定の命令に必要なパラメータ
各命令の文智インタフェースドキュメントを参照
2.インタフェース認証-アルゴリズムは対応するpyファイルにある
テンセントクラウドコンソール->クラウド製品->管理ツール->クラウドAPI鍵
新しい鍵を作成し、Secretld/secretKeyのペアを作成します.
3.共通パラメータ
名前
を選択します.
説明
必須
Action
String
インタフェース命令の名前、例LexicalAnalysis
はい
Region
String
どの領域を操作するかを識別するための領域パラメータ.オプション:bj:北京;gz:広州;sh:上海;hk:香港;Ca:北米
はい
Timestamp
UInt
現在のUNIXタイムスタンプ
はい
Nonce
UInt
ランダム正の整数で、Timestampと連携して再生攻撃を防止
はい
SecretId
String
テンセントクラウドプラットフォームで申請されたアイデンティティを識別するSecretIdとSecretKeyで、SecretKeyはSignatureを生成するために使用されます.
はい
Signature
String
今回のリクエストの正当性を検証するために署名を要求する
はい
エラーコードの意味クエリー:
https://cloud.tencent.com/document/product/271/2057
四.感情分析
感情分析は感情傾向を判断するために用いられ、世論監視、話題監督、口コミ分析などの商業分析分野で非常に重要な応用価値がある.
1.インタフェースの説明
ドメイン名:wenzhi.api.qcloud.comインタフェース名:TextSentiment
2.入力パラメータ
パラメータ名
必須
を選択します.
説明
content
はい
String
分析対象テキスト(utf 8符号化のみ)
type
はい
Int
(オプションパラメータ、デフォルトは4)1:電子商取引;2:APP;3:グルメ;4:ホテルとその他
3.出力パラメータ
パラメータ名
を選択します.
説明
code
Int32
エラーコード、0:成功、その他の値:失敗
message
String
エラーメッセージ
positive
Double
ポジティブ感情確率
negative
Double
ネガティブ感情確率
文智中国語の意味開放プラットフォームは並列計算システムと分布式爬虫プラットフォームに基づいて、独特な意味分析技術を結合して、ワンストップでユーザーNLP、トランスコード、抽出、全ネットデータのキャプチャなどの中国語の意味分析需要を満たす開放プラットフォームである.ユーザーはプラットフォームが対外に提供するOpenAPIに基づいて検索、推薦、舆情、発掘などの意味分析応用を実現することができる.
テンセント雲文智中国語語義プラットフォームはSDKモジュール方式でサービスを提供し、多種のプログラミング言語をサポートする
二.製品の機能
Actionidクエリー:https://cloud.tencent.com/document/product/271/2050
1.分詞/ネーミングエンティティ識別API、インテリジェント分詞(基本語+フレーズ)、品詞表記、ネーミングエンティティ識別機能を提供する.Action id=LexicalAnalysis
2.感情分析API、情報に対して感情上の順方向、負方向及び中性を評価し、Actionid=TextSentiment
3.テーマ分類API、自動テキスト分類サービスを提供し、現在プラットフォームが識別できるカテゴリは招聘、映画・テレビ、音楽、健康養生、財経、広告普及、犯罪、政治など90以上のカテゴリを含む.
4.キーワード抽出API、キーワード抽出プラットフォームに基づいて、ユーザーにニュース内容キーワード自動抽出、評論キーワード抽出などの基礎サービスを提供する.カスタム辞書のサポート
5.機密情報識別API
6.文法はAPIを分析し、文法は文の中の語と語の関係を分析し、文の主幹、核心語などを抽出するのに用いることができる.文法分析は文をよりよく理解することができ、機械翻訳、自動問答、知識抽出などの分野で応用できる.
7.同義語API
8.誤り訂正API、短いテキストに対する自動誤り訂正機能を実現し、ユーザーは業務データとログを提供するだけである
9.トランスコードAPI、ウェブトランスコードとウェブ名刺、ウェブトランスコードはPC機に展示された2次元ページをモバイル端末装置に展示された1次元ページに変換する.ページ名刺は、ページを主体画像、タイトル、要約の組み合わせに簡略化し、カード形式で展示し、ページの共有、コレクション、普及に適しています.ユーザーはWebページurlをコミットするだけです
10.抽出APIをダウンロードし、分布式爬虫類システムに基づいて、ユーザーはurlを提供してデータのキャプチャを完成することができる.分布式爬虫類システムは全網urlに対して正確なスケジューリング、知能圧力掘削、適応ページ更新周期予測を行うことによって、自動ルーティング、url不正行為識別、知能テーマキャプチャなどの機能を実現することができる.
7.3.API呼び出し
1.API要求構造
ドメイン名アクセスアドレス:wenzhi.api.qcloud.com
通信プロトコル:HTTPS
要求方法:POSTGET可、一般使用GET
文字コード:utf-8
名前
説明
コメント
APIエントリ
API呼び出しWebServiceエントリ
https://wenzhi.api.qcloud.com/v2/index.php
共通パラメータ
各インタフェースに含まれる汎用パラメータ
詳しくは3.共通パラメータ
コマンド名
Action=LexicalAnalysisなどのAction指定を使用して実行するAPIのコマンドの名前
完全な命令はAPIクエリを参照してください
めいれいパラメータ
各特定の命令に必要なパラメータ
各命令の文智インタフェースドキュメントを参照
2.インタフェース認証-アルゴリズムは対応するpyファイルにある
テンセントクラウドコンソール->クラウド製品->管理ツール->クラウドAPI鍵
新しい鍵を作成し、Secretld/secretKeyのペアを作成します.
3.共通パラメータ
名前
を選択します.
説明
必須
Action
String
インタフェース命令の名前、例LexicalAnalysis
はい
Region
String
どの領域を操作するかを識別するための領域パラメータ.オプション:bj:北京;gz:広州;sh:上海;hk:香港;Ca:北米
はい
Timestamp
UInt
現在のUNIXタイムスタンプ
はい
Nonce
UInt
ランダム正の整数で、Timestampと連携して再生攻撃を防止
はい
SecretId
String
テンセントクラウドプラットフォームで申請されたアイデンティティを識別するSecretIdとSecretKeyで、SecretKeyはSignatureを生成するために使用されます.
はい
Signature
String
今回のリクエストの正当性を検証するために署名を要求する
はい
エラーコードの意味クエリー:
https://cloud.tencent.com/document/product/271/2057
四.感情分析
感情分析は感情傾向を判断するために用いられ、世論監視、話題監督、口コミ分析などの商業分析分野で非常に重要な応用価値がある.
1.インタフェースの説明
ドメイン名:wenzhi.api.qcloud.comインタフェース名:TextSentiment
2.入力パラメータ
パラメータ名
必須
を選択します.
説明
content
はい
String
分析対象テキスト(utf 8符号化のみ)
type
はい
Int
(オプションパラメータ、デフォルトは4)1:電子商取引;2:APP;3:グルメ;4:ホテルとその他
3.出力パラメータ
パラメータ名
を選択します.
説明
code
Int32
エラーコード、0:成功、その他の値:失敗
message
String
エラーメッセージ
positive
Double
ポジティブ感情確率
negative
Double
ネガティブ感情確率
#qcloudapi-sdk-python SDK
#
pip install qcloudapi-sdk-python
# API
#Python 3.6
from QcloudApi.qcloudapi import QcloudApi
#
module = 'wenzhi'
# -
action = 'TextSentiment'
# API - ( )
config = {
'method': 'GET',
'Region': 'ap-guangzhou',
'secretId': ' ',
'secretKey': ' ',
'SignatureMethod': 'HmacSHA1'
}
# , json
# 'content':[1,2,3]
params = {'content':' ','type':4}
service = QcloudApi(module, config)
# (5 )
#service.setRegion('ap-shanghai')
# url,
print(service.generateUrl(action, params))
# -
s=service.call(action, params)
print(s)
#
b'{"code":0,"message":"","codeDesc":"Success","positive":0.35916191339493,"negative":0.64083808660507}'