h5pyとnumpyの使い方
4603 ワード
はじめに
以下のコードは、google colab
で動かして確認している。
元データの作成
import h5py
import numpy as np
expression_matrix = np.random.rand(20000, 8)
sample_name = ['sample_' + str(x + 1) for x in range(8)]
書き込みの例
out_file = './h5pysample.h5'
outfh = h5py.File(out_file, 'w')
outfh.create_dataset('expmat', data = expression_matrix)
outfh.create_dataset('sample_name', data = sample_name)
outfh.flush()
outfh.close()
読み出しの例
in_file = './h5pysample.h5'
infh = h5py.File(in_file, 'r')
infh.keys()
## <KeysViewHDF5 ['expmat', 'sample_name']
expression_matrix_2 = np.array(infh['expmat'])
sample_name_2 = list(infh['sample_name'])
infh.close()
検索
HDF5データの検索で、テーブルリストに該当名称があるかないかは、grep
で検索できる。上でいうところのexpmat
等で存在するテーブルを確認することが出来る。
参考資料
-
HDF5 for Python
-
バイナリーデータファイルのフォーマット HDF を扱う Python ライブラリー
- 参考にしたけど、
Datasets
オブジェクトでは.value
が動かなかった。歴史的経緯があるのかもしれないが、わからない。
- 参考にしたけど、
Datasets
オブジェクトでは.value
が動かなかった。歴史的経緯があるのかもしれないが、わからない。
Author And Source
この問題について(h5pyとnumpyの使い方), 我々は、より多くの情報をここで見つけました https://qiita.com/sakaia/items/95f1fc27312ff8038801著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .