#14サイキレン氏によると、最初の機械はapp-予測ペンの品種を学ぶ


コースランニング

  • Pythonベースの他のマシン学習パッケージも、ネットワークスタイルに類似したAPIをサポートするために、最も簡単で最もPython化されたAPIを提供しています.
  • は、機械学習に多様なアルゴリズムと開発が容易なフレームワークとAPIを提供する.
  • 長期にわたる実証を経て、成熟したテープ・ライブラリは多くの環境で使用できます.
  • は主にNumpyとSchipyに基づいたライブラリを構築します.
  • 機械学習用語の整理

  • フィーチャー、プロパティ
  • フィーチャーは、データセットの一般的なプロパティです.
  • 機械学習は2次元または多次元データでもよく用いられるため,ターゲット値以外のすべての属性を特徴と呼ぶ.
  • ラベル、クラス、ターゲット(値)、決定(値)
  • 目標値または決定値は、学習データを指導するための正しいデータである.
  • アドバイザラーニングでは、分類はこの決定値をラベルまたはクラスとして指定します.
  • アドバイザラーニング-分類

  • サポート学習方法の1つ.
  • は、学習のための様々な特徴および分類決定値ラベル(Label)データ学習モデルの使用を学習に指示し、次いで、未知のラベルを個別のテストデータセットで予測する.
  • は、所与のデータを学習し、未知の答えを予測する方法である.
  • 所定のデータセットを学習=学習データセット
  • マシンラーニングモデルの予測性能を評価するために個別に指定されたデータセット=テストデータセット
  • ペンデータ分類予測プロセス

  • データセット分離:データを学習データとテストデータに分離します.
  • 学習
  • モデル:学習データに基づいて、MLアルゴリズム学習モデルを適用する.
  • 予測の実行:学習したMLモデルを用いて試験データの分類(すなわちペンの種類)を予測する.
  • 評価:予測結果をテストデータの実際の結果値と比較して、MLモデルの性能を評価する.
  • # 사이킷런 버전 확인
    import sklearn
    print(sklearn.__version__)
    
    # 필요한 모듈 로딩
    from sklearn.datasets import load_iris # iris 내장 데이터 셋을 불러옴
    from sklearn.tree import DecisionTreeClassifier # 결정트리 클래스타입
    from sklearn.model_selection import train_test_split # 학습데이터와 테스트 데이터를 분리하는.
    
    import pandas as pd
    
    # 붓꽃 데이터 세트를 로딩합니다. 
    iris = load_iris()
    
    # iris.data는 Iris 데이터 세트에서 피처(feature)만으로 된 데이터를 numpy로 가지고 있습니다. 
    iris_data = iris.data
    
    # iris.target은 붓꽃 데이터 세트에서 레이블(결정 값) 데이터를 numpy로 가지고 있습니다. 
    iris_label = iris.target
    print('iris target값:', iris_label)
    print('iris target명:', iris.target_names)
    
    # 붓꽃 데이터 세트를 자세히 보기 위해 DataFrame으로 변환합니다. 
    iris_df = pd.DataFrame(data=iris_data, columns=iris.feature_names)
    iris_df['label'] = iris.target
    iris_df.head(3)
    # 학습데이터와 테스트데이터로 분리
    X_train, X_test, y_train, y_test = train_test_split(iris_data, iris_label, 
                                                        test_size=0.2, random_state=11)
    
    # DecisionTreeClassifier 객체 생성 
    dt_clf = DecisionTreeClassifier(random_state=11)
    
    # 학습 수행 
    dt_clf.fit(X_train, y_train)
    # 학습이 완료된 DecisionTreeClassifier 객체에서 테스트 데이터 세트로 예측 수행. 
    pred = dt_clf.predict(X_test)
    pred
    from sklearn.metrics import accuracy_score
    print('예측 정확도: {0:.4f}'.format(accuracy_score(y_test,pred)))