機械学習に関する問題とリソースのダウンロード.

3382 ワード

リソースの共有:
1、po 1篇の無料の無効な字のダウンロード:https://blog.csdn.net/u010533386/article/details/51458591コピー後、txtファイルに貼り付けて保存します.pythonを使用してtxtファイルを読み込むときは、文を使用することに注意してください.stpwrdlst = open(stopword_path).read().replace('
', ' ').split()

を使用してフォーマットを調整します.そうしないと、プログラムに警告が表示されます.UserWarning: Your stop_words may be inconsistent with your preprocessing. Tokenizing the stop words generated tokens [·····] not in stop_words. sorted(inconsistent))
ブログノート:
一、機械学習関連:1、行列の共分散について詳しく説明するhttp://www.elecfans.com/dianzichangshi/20171205594693.html2、マルテンサイト距離とオーステナイト距離の説明:https://blog.csdn.net/sinat_27652257/article/details/804833253、読み取ったファイルが永久に対象に転化することについて、次回の読み取り説明を便利にする:https://blog.csdn.net/lanqiu5ge/article/details/25136909
二、python文法関連:1、multiply()、dot()、*の三つの配列と行列の違いについて、レイアウトは違和感がありますが、内容ははっきり書いています.https://blog.csdn.net/orangefly0214/article/details/802621642、pickleモジュールの説明:https://blog.csdn.net/dcrmg/article/details/78180692 3、.readline() .readlines() .read() .write() .writeline()の違いreadline()はforと組み合わせて使用する、ファイルの内容を一度にメモリに格納するのではなく、行ごとに読み取る、速度が遅く、通常はメモリが不足している場合にのみ使用される.readlines()はforに合わせて使用し、ファイル内容を一括して読み取り終了後、行単位で出力する.read()は、ファイルのすべてのテキスト内容を返す.writeline()の書き込みファイルが終了すると、ファイルの最後に改行を入力、次回入力時に新しい行から開始する.write()書き込みファイルが終了したら、ファイルの最後に改行文字を入力せず、次回入力は前回終了位置から継続します.4、python 3のdist型データの.items()メソッドは、元のpython 2のitems()とiteritems()を置き換えます.5、zip()関数の使い方:(実例を通して理解を深める)
p = {'art':'2', 'math':'3', 'eng':'5'}
a = ones([3, 2])  
print(zip(a,p))   
print(zip(a))   
print(list(zip(a, p)))   
print(list(zip(a))) 

出力結果は次のとおりです.


[(array([1., 1.]),), (array([1., 1.]),), (array([1., 1.]),)]
[(array([1., 1.]), 'art'), (array([1., 1.]), 'math'), (array([1., 1.]), 'eng')]

6、自分のプログラムの実行時間を表示する:datetime.datetime.now()はpython 3にあります.8廃棄、timeの使用を推奨.perf_counter()は、perf_を1回呼び出す方法と同じです.counter()は、コンピュータシステムからランダムに1つの時点Aを選択し、現在の時点B 1から何秒離れているかを計算する.この関数が2回目に呼び出されると、デフォルトでは、1回目に呼び出された時点Aから現在の時点B 2から何秒離れているかが計算されます.2つの関数は、時刻B 1からB 2までの計時機能を実現する.
そして自分で良い(zhuang)奇(bi)心理から、プログラムの実行の進捗バーをどのように展示するかを学びました.https://blog.csdn.net/Bolong_/article/details/79764664ところで、上記の言葉もこのブログから切り取ったものです.この記事は全部です.https://blog.csdn.net/btujack/article/details/79321278 : pythonで提供された進捗バーを表示するためのmodule:tqdm
エラーメモ:
1、次のコードを実行します.
import numpy
from numpy import *
import matplotlib.pyplot as plt
dataset = [[-0.017612,14.053064],[-1.395634,4.662541],[-0.752157,6.538620],[-1.322371,7.152853],
           [0.423363,11.054677],[0.406704,7.067335],[0.667394,12.741452],[-2.460150,6.866805],
           [0.569411,9.548755],[-0.026632,10.427743],[0.850433,6.920334],[1.347183,13.175500],
           [1.176813,3.167020],[-1.781871,9.097953]]
dataMat = mat(dataset).T
plt.scatter(dataMat[0], dataMat[1], c='red', marker='o')
X = numpy.linspace(-2, 2, 100)
Y = 2.8*X+9
plt.plot(X, Y)
plt.show()

エラー:ValueError: Masked arrays must be 1-D解決方法:文:plt.scatter(dataMat[0],dataMat[1],c=‘red’,marker=‘o’)をplt.scatter(dataMat[0].tolist(), dataMat[1].tolist(), c='red', marker='o')に変更
詳細はブログを参照:https://blog.csdn.net/grinandbearit/article/details/78944738