R言語によるSVM(機械学習)

1526 ワード

自然言語処理 svm 機械学習 R R テキストリンク

はじめに

　R言語を用いたサポートベクターマシンにより、テキスト分類を行ってみました。
　テキストのベクトル化などについて、詳しくは、
リンク(GitHub) を参照ください。

データ

　テキストは、文書内の語の出現頻度の指標である「tf-idf」を用いてベクトル化し、次のような形状のcsvファイルになっています。

num,。,が,の,...,おめでとう,くん,笑,group
0,0.000576,0.018227,0.018290,...,0.036156,0.019288,0.012082,ctrl
1,0.012769,0.026343,0.016902,...,0.007307,0.020576,0.013051,dep
2,0.000437,0.000360,0.000364,...,0.002279,0.001640,0.002097,ctrl
...

最終列（group列）の、"ctrl" or "dep" が、ラベルです。

R言語によるサポートベクターマシンの利用

kernlabライブラリの、ksvm関数を用いました。

>library(kernlab)

>setwd("//")

>train=read.csv("trainデータの一覧.csv")

>test=read.csv("testデータの一覧.csv")

>svm<-ksvm(group ~., data=train)

>predict<-predict(svm, test)

>predict

>table(predict,test$group)

ksvm関数のパラメータをきちんと調整すると、さらに良いかもしれません。

詳しくは、
リンク(GitHub) を参照ください。

環境

R version 3.6.1
macOS Catalina 10.15.3

Author And Source

この問題について(R言語によるSVM(機械学習)), 我々は、より多くの情報をここで見つけました https://qiita.com/Yuuki_Uchida/items/504c2fca376811390fe4

著者帰属：元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。

Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .

『Pythonプログラミング入門から実践へ』(第18章.Django入門)

Python-クラスへのアクセス