pythonによるデータ分析(一)


前に书きます:1つの练习の长い2年半の生の信生として、shellに対して、python、Rはすべて少しできて、しかしすべて中途半端なレベルで、いつもシステムを深く勉强して自分でまたいつも怠け者で、自分の时间の手配をコントロールできません.2020年はもう半分過ぎて、自分もすぐに博士2年生になるので、これ以上ダラダラしてはいけません.着実に何かをしなければなりません.買った本は少なくないが、この「pythonを利用してデータ分析を行う」は1年以上も買ったが、まだいくつかの章を読んだことがある.中のコードさえ叩くのがおっくうだ.もう1冊の「流暢なpython」は、当時、顔寧先生にサインしたことがある(なぜこのブックマークを持っているのか聞かないでください.私も頭が痛いです.なぜ私が風を吸ってこれを持っているのか).少なくとも10分间の真剣な思考を経て、まず「pythonを利用してデータ分析を行う」をよく勉强し、毎日ここに勉强の心得を记录することにしました.以前はものをOneNoteに覚えていましたが、それはよくありません.他の人には见られなくても督促の役割はありません.flagを立てる:毎週6回更新し、自分の学習過程の心得と思考を記録し、この本の最初の10章を完成した後、「pythonデータ可視化の美」に転向し、2020年までに半吊りよりも強く、見ている人にも助けてほしい.Rについては...あまり考えすぎないでください.
始めよう!
1,ベースのpython数字タイプはintとfloatに分けられ,intは任意の大きさの数字を格納することができ,浮動小数点数floatは科学的カウント法で表すことができる.2 pythonの文字列は可変であり、1つの文字列を変更することはできません.3、多くのpythonオブジェクトはstr関数で文字列に変換できます.4、特殊な記号を含まないが、大量のスラッシュを含む文字列の前に「r」を付け、これらの文字が原生文字であることを示す.
>>>s = r'this \is \an \example'
>>>s
'this \\is \\an \\example'

5,文字列フォーマットformat()メソッドの使い方:.format()
>>>"{1}:   {0} CPU    {2}%".format("2020-7-2", "A", 66)
'A:   2020-7-2 CPU    66%'

テンプレート文字列の{} と呼び、フォーマットに対する構成は{:}であり、フォーマット制御フラグのフォーマット構成は以下の通りである.
:
<./>
ブートシンボル
塗りつぶしに使用する1文字
右揃え;^中央揃え
スロットの出力幅を設定
桁区切り
浮動小数点数精度または文字列の最大出力長
整数型b,c,d,o,x,X浮動小数点数型e,E,f,%
#  
>>>"{0:=^20}".format("PYTHON")
'=======PYTHON======='
#       
>>>"{0:,.2f}".format(12345.678)
'12,345.68'

6,forループでcontinueキーワードを使用するとcontinueの後ろのコードをスキップして次のループに入ることができる.breakキーを使用してforループを終了し、多層ループがある場合に最内層のループを終了します.passはpythonでは何も実行しないことを示し,まだ実装されていないコードとして使用できるプレースホルダである.7,range関数は反復器range(start , end, step)を返す.rangeは等差数列を生成し、生成された整数は開始を含むが終了を含まない.注意rangeはリストではなくリストに変換する必要があります.ステップは負であってもよく、このとき開始値も相応に変化する.
>>>range(0, 10)
range(0, 10)
>>>list(range(0, 10))
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>list(range(0, 10, 2))
[0, 2, 4, 6, 8]
>>>list(range(10, 0, -2))
[10, 8, 6, 4, 2]

8,三元式ではif-elseコードブロックを結合し、1行のコードまたは文でデータを生成できます.
value = true-expr if condition else false-expr

次のような効果が得られます.
if condition:
    value = true-expr
else:
	value = false-expr
	
#  
>>>age = 20
>>>"   " if age >= 18 else "   "
'   '

三元式は符号量を圧縮することができるが,複雑すぎる式は可読性を犠牲にする.
前の2章が終わる