pythonマシン学習knn識別数字1


1.まずデジタル識別の第一歩はデータを収集することであり、まず有名なMNISTデータセットデータセットのダウンロードサイトを見てみましょう.http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz: training set images (9912422 bytes) train-labels-idx1-ubyte.gz: training set labels (28881 bytes) t10k-images-idx3-ubyte.gz: test set images (1648877 bytes) t10k-labels-idx1-ubyte.gz:test set labels(4542 bytes)ディレクトリ図python 机器学习knn识别数字1_第1张图片
注意:
ダウンロードしたデータは解凍しないでください
2、このデータセット、トレーニングサンプル:合計60000個、そのうち55000個はトレーニング用、さらに5000個は検証テストサンプル:合計10000個3、データセット画素値a)pythonを用いてバイナリファイルを読み取る方法でmnistデータセットを読み取ると、読み込まれた画像画素値は0-255の間である.ラベルは0~9の数値です.b)TensorFlowのパッケージの関数を用いてmnistを読み取ると、読み込まれた画像画素値は0-1の間である.ラベルは、0~1の値からなる1*10のサイズの行ベクトルです.
mnist=input_data.read_data_sets('MNIST',one_hot=True)#    

2.MNISTのデータ状況を解析する
import  numpy as np
import cv2
from tensorflow.examples.tutorials.mnist import input_data
mnist=input_data.read_data_sets('MINST',one_hot=True)
print(mnist.train.images[1])#              ,       28*28   ,    
#                     .
aa=mnist.train.images[1]
bb=np.reshape(aa,(28,28))#    reshape       28*28     
print(bb)
cc=cv2.resize(bb,(128,128))#    ,  28*28128*128,        
#             28*28 
cv2.imshow("img1",cc*255)#    255             ,               
#255255

図の出力結果は、python 机器学习knn识别数字1_第2张图片