pythonプログラミング常用ノート

2238 ワード

データの読み込み、ファイルの読み込み、保存
           data      
  data=pd.DataFrame(pd.read_csv('LDA_data.csv'))

表がない
      name=['id','gender']
      user=pd.read_table('uer.dat',sep='::'【   】,header=None【     】,                      names=names【   】)```

user   DataFrame
>     pandas  
#        

      %timeit
#    

#Numpy
ndarray                              ,
      ,    
           
          

np=np.array(data)dataは、リスト、要素、辞書タイプ変換などのすべてのシーケンス型のオブジェクトであってもよい:float_arr=arr.astype(np.float 64配列スライス【【1,2,3】,【4,5,6】]では、区切られたインデックスリストで単一要素【0,2】または【0】【2】=』の3多軸スライス:【行スライス,列スライス】a:bは、下付きラベルがaからbまでであることを示し、:すべてを示し、aは単一行または一列配列がarr.Tを転置して軸変換計算マトリクス内積np.dot(arr.T,arr)要素レベル配列関数一元の関数:abs:絶対値、sqrt平方根、exp、log/sin/cos二元関数:add、multiplyの2つの配列要素が乗算され、powerの2つの配列の要素に対応するA^B
PANDAS
from pandas import Series,DataFrame Seriesは、データ(Numpyにおけるデータ型)のセットに関するデータラベルからなるインデックス(自動または指定)を含む1次元配列に類似するオブジェクトである....indexは、辞書Dataframe data={'name':[]'year}:['sfee','sfe']frame=DataFrame(data)パラメータ:DataFrame(data,columns=[],index=[])属性:frame['属性名']インデックスフィールドを使用して行:frame.ix['3']は、data=[['three','one']]axisが簡略な週、DataFrameの行が0、列が1値でvalue_をカウントする2つの列をとります.countsは、Seriesの各値が現れる頻度を計算するために使用されます.
pandasのデータロード、ストレージ、ファイル
分類:-テキストファイルの読み取り、ディスクストレージフォーマット-データベース内のデータのロード-web apiを使用してネットワークリソース関数を操作する:read_csv(デフォルトのカンマは区切り)、read_table(デフォルトのタブは区切り)区切りを指定します:sep=','関数パラメータ分類:-インデックスは1つ以上の列を返したデータFrame処理と、ファイルからユーザーが列名を取得するかどうかを示します-タイプデータ変換:カスタム値変換、欠落値タグ-反復:大きなファイルに対するブロック単位の反復を支持します-不規則データ:行、フッター、コメント
図形描画と可視化
導入:importmatpoltlib.pyplot as plt
その他の補足
組み込みシーケンス関数1、enumerate:1つのシーケンスを反復する場合、現在のインデックスを追跡する必要があることがよくあります.enumerate関数を使用すると、シーケンスの(i,value)メタグループeg:for i,value in enumerate(collection):iがインデックスsome_であるlist=[.....] mapping=dict((i,v)for i,v in enumerate(some_list))リストを辞書にマッピング
辞書
Pythonで最終的に必要とされる内蔵データ構造で、より一般的な名前はハッシュマッピングと呼ばれ、キー値のペアで構成され、キー値はそれぞれpythonオブジェクトです.DIYからのループmapping=dict(zip(range(5),reversed(range(5))の代わりにdict関数を使用して二元グループリストを直接処理する
setdefaultメソッドsetdefaultメソッドsetdefaultメソッドsetdefaultメソッドsetdefaultメソッドsetdefaultメソッドsetdefault