pythonの稼働効率の向上/稼働時間の短縮方法

1527 ワード

最近pythonが入門したばかりで、ちょうど解決しなければならない問題があるので、pythonを使って実験をしなければならないので、つまずいているような気がしますので、自分でも前車の鑑をまとめました.
pythonは解釈言語です(上級言語は機械言語に翻訳する方式によってコンパイル性言語と解釈性言語に分けられる.コンパイル性言語とは、実行時にまずコンパイルされ、すなわち.exeのような実行可能なファイルを生成し、その後この.exeを実行する際にコンパイルされず、効率が高いことを指す.解釈性言語とは、翻訳の方式が解釈であり、コンパイルされないことを指す.ただし、実行ごとに解釈されるため、コンパイル言語よりも実行効率が低い)ため、実行効率が低い場合はできるだけ避ける必要があります.私のこの時間の実践に基づいて、いくつかの比較的直観的な経験を皆さんに紹介します.
1.データ構造は必ず対を選ぶ
辞書を使用できる場合はリストを使用しません.辞書はインデックスの検索とソートでリストよりはるかに高いです.私のデータセットは比較的に大きくて、百万のデータがあって、一部のコードは私がソートしなければならないので、最初はリストを選んだが、ソートが完了してから8分かかり、これは本当に遅すぎて、それから辞書を選んだ後、十数秒で結果が出た.この効果は私を驚かせた.
2.pythonでカプセル化されたモジュールライブラリを多用する
私が今使っている主なモジュールはnumpy、matplotlib、pandasの3つです.matplotlibはグラフィックライブラリです.これはあまり言いませんが、numpyとpandasは強いことに気づきました.numpyは主に計算に使われています.numpyというデータ型があります.ndarray.ndarrayは多次元の配列オブジェクトであり、ベクトル演算能力と複雑なブロードキャスト能力を持ち、実行速度が速く、空間を節約する特徴がある.ndarrayの特徴の1つは、すべての要素のタイプが同じであることです.このndarrayとlistリストの主な違いは以下の通りです.
list python      ,          
ndarray numpy       ,           

その具体的な使い方についてはhttps://www.cnblogs.com/sirkevin/p/5738185.html
ndarrayタイプはマトリクス演算に便利な関数が多く、pandasはビッグデータの処理においてより強力な能力を持っている.私のこの方面の主な応用はデータを保存することです.csvファイルと従.csvファイルに読み込むときにこのモジュールを使い、pandasのDataframeやSeriesを使い、データ演算を行うときに超便利です.具体的な使い方はhttp://blog.csdn.net/u010159842/article/details/53673124
3.先人を参考にするhttps://www.cnblogs.com/yd1227/archive/2010/11/23/1885186.html