どのように、私は機械学習を学んでいます-週1:パイソンとパンダ


目次:
─慶喜3年(1666年)9月5日
─慶喜3年(1666年)9月5日
唐辛子

─慶喜3年(1666年)9月5日
─慶喜3年(1666年)9月5日
唐辛子
─慶喜3年(1666年)9月5日
─慶喜3年(1666年)9月5日
唐辛子

─慶喜3年(1666年)9月5日
─慶喜3年(1666年)9月5日
─慶喜3年(1666年)9月5日
─慶喜3年(1666年)9月5日
唐辛子
唐辛子

─慶喜3年(1666年)9月5日
─慶喜3年(1666年)9月5日
唐辛子
─慶喜3年(1666年)9月5日
─慶喜3年(1666年)9月5日

私たちがやった後に実際の作業を行うことができ、それを行うことができるようにするために、我々はデータを分析するために、49457915円とそのライブラリを学ぶ必要があります.

Pythonを学ぶことは非常に簡単です、そして、あなたがプログラミング言語でどんな経験をするならば、簡単に、簡単にPythonを学んでください.あなたが必要なすべてを見つけることができるので、私は自分でそれをカバーしません.または、あなたが過熱したい場合は
ここで使用するのは、特にリストとmatrixesですが、難しいレベルではありません.これは、パンダにデータを表示する様々な方法の概要にすぎないので、恐れるな.

セットアップで見たように、Jupyterノートブックですべてを行います.ここでは、すべてのパッケージをインポートする必要があります.

パンダには2つの主要なデータ型があり、最初は一連のリストのパンダ名です.


さて、別のシリーズを作りましょう.


私たちがmatrixesについて話したとき、覚えています?これは単にパンダのdataframeで呼ばれるテーブルの技術名です.


しかし、常にデータを書くことは退屈で、効率的ではありません、我々は多分すべてのデータ、サンプルかどうかを持っています、そして、我々がそうする必要があるものはそれを輸入しています.
データを取得するために使用される最も一般的なファイルです.Excelファイルのようです.
私はすでにメインフォルダにCSVファイル“baseballchenプレーヤー”を入れているので、私はここでそれを見ることができます

今、データを扱うには、次のように入力しなければなりません.


一旦我々が我々のデータで働いたならば、我々は彼らを輸出したいかもしれません、そして、それをするために、それは非常に単純です.

しかし、私たちには問題があります、私たちには、それが一連のデータafameであるように、列のインデックスを表示する余分のコラムがあります.
これを解決するには、エクスポート関数を変更することができます



データを記述する前に、少しの詳細、関数と属性の違いを知る必要があります.
関数はパラメータを必要とするか、またはパラメータを必要としないかもしれないコードの一部であり、データを変更することができます.
属性は関数と似ていますが、可視化のためだけに使用され、アンダーライン演算が通常の関数と同じであっても、括弧は持ちません.

この属性を使用すると、二つのことがわかります.

最初に、サンプルにエラーがあり、引用符の間にある列の名前があります.
第二に、我々は現在使用しているデータの種類を知っている.
注:今、私は手動で引用符の間にすべてのデータを調整する必要がありました、そして、単にこのデータセットがちょうど10行であったので、それは単純でした、しかし、データセットでは、この種のエラーが重要であるかもしれません.

この属性は、データフレームのすべての列に表示されます.

しかし、常にこの属性を使用するのではなく、必要に応じて使用できる変数に与えることができます.


この関数は、我々が取り組んでいるデータセットに関する情報を提供します.
75457915円のメモリ使用量が含まれています.

この関数は、データファイルに関する多かれ少なかれ情報を表示しますが、より正確なオプションについては


パンダはデータを表示し、それらを選択する有用な機能の多くを提供し、最も有用な頭と尾です.

我々のDataFramame上のヘッド機能を呼び出すと、最初の5つの要素が表示されます.それは、我々が我々が取り組んでいるものの最初のN要素を見ることができるように、数さえ受け入れます

それはちょうど最初の3、5または7を表示するように行の何千もの大きなデータグラムを迅速に見ていることが役に立つかもしれないが私たちは何をするつもりだのアイデアを持つことができます.

頭の機能に非常に似ていますが、最初の代わりに、dataframeの最後の要素を示します.


この機能を説明するシリーズを作りましょう

関数を呼び出しましょう

非常に奇妙で状況的だが、まだ知って良い.

我々は、ILOCがすることを説明する前に、同じ配列を使用します

それはシリーズの第4の要素を返します.
LOCとILOCの両方とも正確なプロパティを持っています.Pythonでは文字列が続くと、[ start : stop : stepover ]の3つのパラメータを受け取ります.

特定の列を参照するには、2つのコマンドを入力できます.
括弧記法

またはドット表記

どちらも同じ動作をしていますが、それはただの優先度ですが、それらは、それらを使って特定の行を表示できるので、重要です.

これはどんなブール演算子でも動作し、特定の機能を持つ行、または行のグループを検索します.

次の週には、Pythonとパンダの2番目の部分を書いて、Numpyを見始めます.
次の時まで会いましょう