NumPy入門学習(三)効率比較

1244 ワード

NumPyはfor-inと比較して効率的です
1.大規模配列を生成する効果
@timeit_test(number=1, repeat=1)
def list_test():
    my_list = list(range(1000000))


@timeit_test(number=1, repeat=1)
def ndarray_test():
    my_arr = np.arange(1000000)


list_test()  
ndarray_test() 
Time of 0 used: 0.04712673199999998
Time of 0 used: 0.0014547089999999985

2.数値演算の効果
@timeit_test(number=1, repeat=1)
def list_test():
    my_list = []
    for num in range(1000000):
        my_list.append(num * 2.0)


@timeit_test(number=1, repeat=1)
def ndarray_test():
    my_arr = np.arange(1000000)
    my_arr = my_arr * 2.0


list_test()
darray_test() 
Time of 0 used: 0.15243656000000003
Time of 0 used: 0.009769811999999989

3.データ処理の仕組み
import numpy as np

print(np.array([[1, 1, 1], [2, 2, 2], [3, 3, 3], [4, 4, 4]]).shape)
print(np.array([[1, 1, 1], [2, 2, 2], [3, 3, 3], [4, 4, 4]]).dtype)
print(np.array([[1, 1, 1], [2, 2, 2], [3, 3, 3], [4, 4, 4]]).strides)
(4, 3)
int64
(24, 8)

ndarrayは、データ型に応じて同質なデータブロックを多次元配列オブジェクトとし、スパン情報と組み合わせて配列を様々なステップでメモリ内で移動させることができる.Pythonリストの要素タイプは任意で、メモリに連続的に格納することはできません.次の要素はアドレス方式でしか見つかりません.