[AIFFEL蔚山第1期]Day 4はどう表現すればいいですか?配列と表
4215 ワード
学習目標
ポスト
9.データの表現方法配列と表
9.1近くに並ぶ~基本統計を計算してみましょうか?
->数字を足すだけ!
->入力を受け取るたびにカウントし、入力値の追加を続行します.合計
->厳密には、リストはダイナミック配列(Dynamic Array)
->アレイモジュールのアレイは同じサイズとタイプでなければなりません
-> Pythonのリストにはデータ構造listとarrayの利点が採用されている。
->数値が偶数の場合、中央の値が中央になります
->奇数の場合、中央の2つの値の平均値は
9.2ターミネーター登場!Numpyで一度にこのすべてを!
NumPy: Numerical Python
->科学計算とデータ分析用Pythonパッケージ
文字が
9.3データのマトリックス変換
a. matplotlib
b. PIL
9.4構造化データとは?
データ内部に独自のサブ構造を持つ
9.5構造化データとPandas
Pandas
一次元配列に類似した材料構造
-> pands.Series(配列形式,index=配列形式)
->シリーズ.index=タイル形式
->シリーズ=パンダ.シリーズ
->シリーズ.name=シリーズオブジェクト名
->シリーズ.index.name=シリーズオブジェクトのインデックス名
データ構造表に示すように、複数のコラム
シリーズからデータフレームへ
->データフレーム=pands.DataFrame(シリーズ)
シリーズとデータフレームの比較
データ・フレーム.index=配列形式
データ・フレーム.columns=配列形式(->シリーズの名前と同じ)
構造化データ表示法の整理
9.6 PandasでEDAを起動
EDA(Exploratory Data Analysis)
->データの参照、つまりデータの参照
パラメータとして
count(): NA를 제외한 수를 반환합니다.
describe(): 요약 통계를 계산합니다.
min(), max(): 최소, 최댓값을 계산합니다.
sum(): 합을 계산합니다.
mean(): 평균을 계산합니다.
median(): 중앙값을 계산합니다.
var(): 분산을 계산합니다.
std(): 표준편차를 계산합니다.
argmin(), argmax(): 최소, 최댓값을 가지고 있는 값을 반환합니다.
idxmin(), idxmax(): 최소, 최댓값을 가지고 있는 인덱스를 반환합니다.
cumsum(): 누적 합을 계산합니다.
pct_change(): 퍼센트 변화율을 계산합니다.
Reference
この問題について([AIFFEL蔚山第1期]Day 4はどう表現すればいいですか?配列と表), 我々は、より多くの情報をここで見つけました https://velog.io/@jeongkyeongmin/AIFFEL-울산-1기-Day-4-Data-어떻게-표현하면-좋을까-배열array과-표tableテキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol