NDArrayガイド

5207 ワード

MXNETで最も主要なオブジェクトはmxnet.である.ndarrayまたはmxnet.nd(略称)パケットが提供する多次元配列.pythonの科学計算パッケージNumpyに詳しいならmxnet.ndarrayとnumpy.ndarryは多くの面で似ています.
基本的な多次元配列は、同じタイプの数値テーブルです.例を挙げると、3次元空間の1つの点の座標[1,2,3]は長さ3の1次元配列である.次の図は、2 D配列を示しています.1次元の長さは2、2次元の長さは3です.
[[0, 1, 2]
 [3, 4, 5]]

この配列のタイプをNDArrayと呼びます.NDArrayオブジェクトの重要なプロパティ:
  • ndarray.shape配列の次元.これは整数からなるtupleで、各次元の長さを表します.n行m列の行列について,そのshapeは(n,m)である.
  • ndarry.dtypeは、要素タイプを記述するnumpyオブジェクトです.
  • ndarray.size配列中の数の総数、すなわちshape中の要素の積
  • ndarray.contextは配列を格納するデバイスです.cpuもi-th gpu
  • とすることができる.
    配列を作成して配列を作成するには、さまざまな方法があります.例を挙げると、array関数を使用してpythonの通常のlistまたはtupleで配列を作成できます.
    import mxnet as mx
    # create a 1-dimensional array with a python list
    a = mx.nd.array([1,2,3])
    # create 2-dimensional array with a nested python list
    b = mx.nd.array([[1,2,3],[2,3,4]])
    {'a.shape':a.shape,'b.shape':b.shape}
    
    {'a.shape': (3L,), 'b.shape': (2L, 3L)}
    

    numpyを使用することもできます.ndarrayオブジェクト
    import numpy as np
    import math
    c = np.arrange(15).reshape(3,5)
    # create a 2-dimensional array from a numpy.ndarray object
    a = mx.nd.array(c)
    {'a.shape':a.shape}
    
    {'a.shape':(3L,5L)}
    

    オプションのパラメータdtypeを使用して、numpyタイプを受け入れる要素タイプを指定できます.デフォルトではfloat 32が使用されます.
    # float32 is used in default
    a = mx.nd.array([1,2,3])
    # create an int32 array
    b = mx.nd.array([1,2,3],dtype=np.int32)
    # create a 16-bit float array
    c = mx.nd.array([1.2,2.3],dtype=np.float16)
    (a.dtype,b.dtype,c.dtype)
    
    (numpy.float32, numpy.int32, numpy.float16)
    

    要素の値が大きさしか知らない場合は、プレースホルダの内容を作成して初期化できる関数がいくつかあります.
    # create a 2-dimensional array full of zeros with shape(2,3)
    a = mx.nd.zeros((2,3))
    # create a same shape array full of ones
    b = mx.nd.ones((2,3))
    # create a same shape array with all elements set to 7
    c = mx. nd.full((2,3),7)
    # create a same shape whose initial content is random and
    # depends on the state of the memory
    d = mx.nd.empty((2,3))
    

    印刷配列は印刷できるように、一般的にasnumpy関数を使用してNDArrayをnumpyに変換します.ndarray.Numpyでは、次のレイアウトを使用します.
  • 最後の次元
  • を左から右に印刷する.
  • 最後から2番目の次元
  • を上から下まで印刷する.
  • 残りも上から下へ印刷され、各シートは1つの空行で
  • 隔てられている.
    b = mx.nd.ones((2,3))
    b.asnumpy()
    
    array([[1.,1.,1.],
              [1.,1.,1.]],dtype=float32)
    

    基本操作は、配列上で算術演算子を使用して要素別に操作されます.新しい配列が作成され、結果が埋め込まれます.
    a = mx.nd.ones((2,3))
    b = mx.nd.ones((2,3))
    # elementwise plus     
    c = a+b
    # elementwise minus     
    d = - c
    # elementwise pow and sin,and then transpose      ,  sin,      
    e = mx.nd.sin(c**2).T
    # elementwise max       
    f = mx.nd.maximum(a,c)
    f.asnumpy()
    
    array([[ 2.,  2.,  2.],
           [ 2.,  2.,  2.]], dtype=float32)
    

    Numpyと似ていますが、*は要素別の積として使用され、行列と行列の積はdotを使用します.
    a = mx.nd.ones((2,2))
    b = a * a
    c = mx.nd.dot(a,a)
    {'b':b.asnumpy(),'c':c.asnumpy()}
    
    {'b': array([[ 1.,  1.],
            [ 1.,  1.]], dtype=float32), 'c': array([[ 2.,  2.],
            [ 2.,  2.]], dtype=float32)}
    

    +=と*=のような付与演算子は、新しい配列を作成するのではなく、既存の配列を変更するために使用されます.
    a = mx.nd.ones((2,2))
    b = mx.nd.ones(a.shape)
    b += a
    b.asnumpy()
    

    インデックスとスライスオペレータ[]が最初の次元に作用
    a = mx.nd.array(np.arange(6).reshape(3,2))
    a[1:2] = 1 #  2   ,    3 (             1)
    #a[0:2]  1   ,    3 
    a[:].asnumpy()
    
    array([[ 0.,  1.],
           [ 1.,  1.],
           [ 4.,  5.]], dtype=float32)
    

    私たちもsliceを使います.axisメソッドは特定の次元を切り取ります
    d = mx.nd.slice_axis(a,axis=1,begin=1,end=2) #        ,  2   ,    3 (              )
    d.asnumpy()
    
    array([[ 1.],
           [ 1.],
           [ 5.]], dtype=float32)
    
    

    shape操作は大きさが変わらない限り配列の形状を変えることができる
    a = mx.nd.array(np.arange(24))
    b = a.reshape((2,3,4))
    b.asnumpy()
    
    array([[[  0.,   1.,   2.,   3.],
            [  4.,   5.,   6.,   7.],
            [  8.,   9.,  10.,  11.]],
    
           [[ 12.,  13.,  14.,  15.],
            [ 16.,  17.,  18.,  19.],
            [ 20.,  21.,  22.,  23.]]], dtype=float32)
    

    メソッドconcatenateは、最初の次元に沿って複数の配列をスタックします.(彼らの形は同じでなければならない).
    a = mx.nd.ones((2,3))
    b = mx.nd.ones((2,3))*2
    c.asnumpy()
    
    array([[ 1.,  1.,  1.],
           [ 1.,  1.,  1.],
           [ 2.,  2.,  2.],
           [ 2.,  2.,  2.]], dtype=float32)
    
    

    次元を下げる配列をスカラーに下げることができます
    a = mx.nd.ones((2,3))
    b = mx.nd.sum(a)
    b.asnumpy()
    
    array([ 6.], dtype=float32)
    

    または特定の次元に沿って
    c = mx.nd.sum_axis(a,axis=1)#            
    c.asnumpy()
    
    array([ 3.,  3.], dtype=float32)
    

    ブロードキャストは、レプリケーションによって配列を伝播することができます.次のコードは、2次元に沿って伝播されます.
    a  = mx.nd.array(np.arange(6).reshape(6,1))
    b = a.broadcast_to((6,2))
    b.asnumpy()
    
    array([[ 0.,  0.],
           [ 1.,  1.],
           [ 2.,  2.],
           [ 3.,  3.],
           [ 4.,  4.],
           [ 5.,  5.]], dtype=float32)