2022年1月03日視覚認識とデータ分析

61941 ワード

ビジュアル認識データ解析 python UVC テキストリンク

画像処理の基本例

画像検出

エッジ検出

原理:微分により勃起変化率の大きい部分をエッジと判断する.
変化率なのでノイズに敏感->チークが必要

オリジナル画像

Sobelフィルタmag画像

import cv2
import numpy as np

src = cv2.imread('book.jpg',cv2.IMREAD_GRAYSCALE)
src = cv2.GaussianBlur(src, (5,5), 0,0, borderType= cv2.BORDER_ISOLATED)
dx = cv2.Sobel(src, cv2.CV_32F, 1, 0, delta =0)
dy = cv2.Sobel(src, cv2.CV_32F, 0, 1, delta =0)

mag = cv2.magnitude(dx, dy) #그레디언트 크기 dx, dy 합산?
mag = np.clip(mag, 0, 255).astype(np.uint8) # 합산 후 255 넘어가는 값 255이하로 조정
dst = np.zeros(src.shape[:2], np.uint8)
dst[msg > 192] = 255

# cv2.imshow('mag',mag)
cv2.imshow('dst',dst)
cv2.imshow('src',src)
cv2.waitKey(0)
cv2.destroyAllWindows()

Sobelフィルタdstイメージ

オリジナル画像をBlur処理後

Sobelフィルタmagイメージ

Sobelフィルタdstイメージ

Scharrフィルタmag
演算速度が高い

import cv2
import numpy as np

src = cv2.imread('book.jpg',cv2.IMREAD_GRAYSCALE)
src = cv2.GaussianBlur(src, (5,5), 0,0, borderType= cv2.BORDER_ISOLATED)
dx = cv2.Scharr(src, cv2.CV_32F, 1, 0, delta =0)
dy = cv2.Scharr(src, cv2.CV_32F, 0, 1, delta =0)

mag = cv2.magnitude(dx, dy) #그레디언트 크기 dx, dy 합산?
mag = np.clip(mag, 0, 255).astype(np.uint8) # 합산 후 255 넘어가는 값 255이하로 조정
# dst = np.zeros(src.shape[:2], np.uint8)
# dst[msg > 192] = 255

cv2.imshow('mag',mag)
# cv2.imshow('dst',dst)
cv2.imshow('src',src)
cv2.waitKey(0)
cv2.destroyAllWindows()

import cv2
import numpy as np

src = cv2.imread('book.jpg',cv2.IMREAD_GRAYSCALE)

laplacian = cv2.Laplacian(src, cv2.CV_8U, ksize=3)

cv2.imshow('mag',mag)
cv2.imshow('src',src)
cv2.waitKey(0)
cv2.destroyAllWindows()

Laplacianフィルタmag

ケネリーフフィルタmag

import cv2
import numpy as np

src = cv2.imread('book.jpg',cv2.IMREAD_GRAYSCALE)
src = cv2.GaussianBlur(src, (5,5), 0,0, borderType= cv2.BORDER_ISOLATED)

mag = cv2.Canny(src, 100, 200, apertureSize=3, L2gradient=True)

cv2.imshow('mag',mag)
cv2.imshow('src',src)
cv2.waitKey(0)
cv2.destroyAllWindows()

輪郭線検出p 300

import cv2

src = cv2.imread("chess.png")
dst = src.copy()

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

gray = cv2.cvtColor(src, cv2.COLOR_RGB2GRAY)
ret, binary = cv2.threshold(gray, 230, 255, cv2.THRESH_BINARY)
morp = cv2.morphologyEx(binary, cv2.MORPH_CLOSE, kernel, iterations=2)
image = cv2.bitwise_not(morp)

contours, hierarchy = cv2.findContours(image, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
cv2.drawContours(dst, contours, -1, (0, 0, 255), 3)
for i in range(len(contours)):
    cv2.putText(dst, str(i), tuple(contours[i][0][0]), cv2.FONT_HERSHEY_COMPLEX, 1.3, (255, 0, 0), 1)
    print(i, hierarchy[0][i])

cv2.imshow("dst", dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

多角形近似

src = cv2.imread("chess.png")
dst = src.copy()

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))

gray = cv2.cvtColor(src, cv2.COLOR_RGB2GRAY)
ret, binary = cv2.threshold(gray, 230, 255, cv2.THRESH_BINARY)
morp = cv2.morphologyEx(binary, cv2.MORPH_CLOSE, kernel, iterations=2)
image = cv2.bitwise_not(morp)

contours, hierarchy = cv2.findContours(image, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)

for i in contours:
    perimeter = cv2.arcLength(i, True)
    epsilon = perimeter * 0.05
    approx = cv2.approxPolyDP(i, epsilon, True)
    cv2.drawContours(dst, [approx], 0, (0,0,255),3)
    for j in approx:
        cv2.circle(dst, tuple(j[0]), 3, (255, 0,0), -1)
        
cv2.imshow("dst", dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

コーナー検出

import cv2
import numpy as np

src = cv2.imread("dummy.jpg")
dst = src.copy()

gray = cv2.cvtColor(src, cv2.COLOR_RGB2GRAY)
corners = cv2.goodFeaturesToTrack(gray, 100, 0.01, 5, blockSize=3, useHarrisDetector=True, k=0.03)

for i in corners:
    i = np.uint8(i)
    # cv2.circle(dst, tuple(i[0]), 3, (255, 0, 0), 5)
    # center = (int(i[0][0]), int(i[0][1]))
    # cv2.circle(dst, center, 3, (255, 0, 0), 5)

criteria = (cv2.TERM_CRITERIA_MAX_ITER + cv2.TERM_CRITERIA_EPS, 30, 0.001)
# 튜플임, 30은 반복횟수, 0.001은 정확도
# 기준(criteria) 설정
cv2.cornerSubPix(gray, corners, (5, 5), (-1, -1), criteria)
# criteria 기준으로 코너 픽셀 세밀화

# 점그리기
for i in corners:
    cv2.circle(dst, tuple(i[0]), 3, (0, 0, 255), 5)

cv2.imshow("dst", dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

機械学習

K-平均クラスタアルゴリズム

import numpy as np
import cv2

src = cv2.imread("egg.jpg")
data = src.reshape(-1, 3).astype(np.float32)

K = 3
criteria = (cv2.TERM_CRITERIA_MAX_ITER + cv2.TERM_CRITERIA_EPS, 10, 0.001)
retval, bestLabels, centers = cv2.kmeans(data, K, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
# 이미지 압출률, 라벨, 중심점 만들기

# 군집결과 이미지 만들기
centers = centers.astype(np.uint8)
dst = centers[bestLabels].reshape(src.shape)

cv2.imshow("dst", dst)
cv2.waitKey()
cv2.destroyAllWindows()

K-近隣アルゴリズム

新しいデータの入力時に分類する方法

じんこうニューラルネットワーク

fashion-mnist圧縮ファイルが必要

import numpy as np
import cv2

def loadTrainData(image_path, label_path):
    with open(image_path, 'rb') as image_data:
        images = np.frombuffer(image_data.read(), dtype=np.uint8, offset=16).reshape(-1, 784)

    with open(label_path, 'rb') as label_data:
        labels = np.frombuffer(label_data.read(), dtype=np.uint8, offset=8)

    return images, labels

label_dict = {
    0: "T-shirt/top",
    1:"Trouser",
    2:"Pullover",
    3:"Dress",
    4:"Coat",
    5:"Sandal",
    6:"shirt",
    7:"Sneaker",
    8:"Bag",
    9:"Ankle boot"
}

train_x, train_y = loadTrainData("./fashion-mnist/train-images-idx3-ubyte", "./fashion-mnist/train-labels-idx1-ubyte")
test_x, test_y = loadTrainData("./fashion-mnist/t10k-images-idx3-ubyte", "./fashion-mnist/t10k-labels-idx1-ubyte")

knn = cv2.ml.KNearest_create()
knn.train(train_x.astype(np.float32), cv2.ml.ROW_SAMPLE, train_y.astype(np.int32))

count = 500
retval, results, neighborResponses, dist = knn.findNearest(test_x[:count].astype(np.float32), k=7)

for idx, result in enumerate(results):
    print("index : {}".format(idx))
    print("예측값: {}".format(label_dict[int(result)]))
    print("실제값: {}".format(label_dict[test_y[idx]]))
    cv2.imshow("images", test_x[idx].reshape(28, 28, 1))
    key = cv2.waitKey(0)
    if key == ord('q') or key == 27:
        break
cv2.destroyAllWindows()


# cv2.imshow("images", train_x[0].reshape(28, 28, 1))
# cv2.waitKey()
# cv2.destroyAllWindows()

しんそうニューラルネットワーク

import cv2
import numpy as np

config = "tensorflow_model/graph.pbtxt"
model = "tensorflow_model/frozen_inference_graph.pb"
with open("tensorflow_model/labelmap.txt") as file:
    classNames = file.read().splitlines()

image = cv2.imread("umbrella.jpg")
net = cv2.dnn.readNetFromTensorflow(model, config) # 텐서플로 프레임 워크 읽기
inputBlob = cv2.dnn.blobFromImage(image, 1, (300, 300), swapRB=True, crop=False)
# 딥러닝을 위한 단일 블롭 생성

net.setInput(inputBlob) # 네트워크 입력
outputBlobs = net.forward() # 순전파수행, 네트워크 마다 출력되는 blob 구조가 다름
# print(outputBlobs.shape) # 1, 1, 100, 7

for prob in outputBlobs[0, 0, :, :]:
    # print(prob.shape) #(7,)
    # prob [1] : class
    # prob [2] : confidence(정확도, 일치율 등)
    # prob [3:7] : x1, y1, x2, y2 (blob 상자의 좌표, 상대위치)
    confidence = prob[2]
    # print(prob) # confidence가 0.9 이상일 때의 prob 값
    if confidence > 0.9:
        classes = int(prob[1])
        label = classNames[classes]

        x1 = int(prob[3] * image.shape[1])
        y1 = int(prob[4] * image.shape[0])
        x2 = int(prob[5] * image.shape[1])
        y2 = int(prob[6] * image.shape[0])

        cv2.rectangle(image, (x1, y1), (x2, y2), (0, 0, 255))
        cv2.putText(image, label, (x1, y1), cv2.FONT_HERSHEY_COMPLEX, 1.0, (0, 0, 255))

cv2.imshow("image", image)
cv2.waitKey()
cv2.destroyAllWindows()

6つの指数があり、0.98、すなわち98%の確率はpersonである.
傘

マッチング率を設定できます.

顔認識

Real-Time Face Recognition: An End-To-End Project Link :
Github Link :

conda create --name face python=3.9.7

conda activate face

pip3 install opencv-python or pip install opencv-python or conda install opencv-python

※下図のようにpythonを実行し、import cv 2を使用せずにpipをインストールします.

Pythonでリアルタイムの顔認識を検索
https://towardsdatascience.com/real-time-face-recognition-an-end-to-end-project-b738bb0f7348?gi=ea05c4defe71

PJT生成面が設定されていることを確認
インストールされていない場合は、Anacondalopipをインストールおよび設定する必要があります.

最終設定の完了

実行

運転時にマスクを外し、flipを削除すると顔が見つかります.

FaceCascadeオブジェクトとは?

私の顔で自分でデータを走ってから探してみます。

FacialRecognition\01_face_dataset.pyの実行

データセットフォルダの作成
パス参照コード.
flip機能はコメントされます.

02_face_training.pyの実行

実行後、写真のようにエラーが発生し、importのPILが必要ないことを示します.

注記の内容に従ってpip install pillowを設定します.

cv 2モジュールにはface属性がありません.

トレーニングフォルダの作成

成功

03_face_recognition.py

私の顔検査に成功しました~

インデックスビットにlistを入力できます。

import numpy as np
centers = np.array([[1,1,1], [127,127,127], [255,255,255]])
labels = np.array([[0],[1],[2],[1],[2]])

dst = centers[labels]
print(dst)

Reference

この問題について(2022年1月03日視覚認識とデータ分析), 我々は、より多くの情報をここで見つけました https://velog.io/@ansunny1170/2022-01-03-vision-인식-Data분석

テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。

Collection and Share based on the CC Protocol

Redmineにおけるユーザパスワードの暗号化アルゴリズム(コード付)

Ruby 二次元配列とは？