Machine Learning

Datasets

นำมาจากkaggle geometric shapes mathematicsเป็น dataset เกี่ยวกับรูปทรงเรขาคณิตจำนวน 8 ชุด ได้แก่ "Circle", "Kite", "Parallelogram", "Square", "Rectangle", "Rhombus", "Trapezoid", "Triangle" แบ่งเป็น 1,500 training samples, 500 validation samples 500 test samples จุดประสงค์คือ ต้องการให้ผู้ใช้สามารถวาดภาพและให้โมเดลทายว่ามันคือรูปทรงอะไร

Kaggle

การเตรียมข้อมูล

ทำการเตรียมข้อมูลโดยการปรับภาพให้เป็น สีขาวกับดำ เพื่อให้ง่ายต่อการแยก ทำทั้งชุดสำหรับเทรนและทดสอบ

การเตรียมข้อมูล.py

import os
import cv2
import numpy as np
import matplotlib.pyplot as plt

train_directory = path+'/dataset/train'
plt.figure(figsize=(15, 15))

for subfolder in os.listdir(train_directory):
  shapes_directory = os.path.join(train_directory, subfolder)

  for image_name in os.listdir(shapes_directory):
    image_path = os.path.join(shapes_directory, image_name)
    img = cv2.imread(image_path)
    gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    _, binary_img = cv2.threshold(gray_img, 200, 255, cv2.THRESH_BINARY)
    cv2.imwrite(image_path, binary_img)

Encode and Split Data for Training and Testing

encode ชุดข้อมูลให้เป็น 0 กับ 1 และปรับเป็น array 1 มิติ และทำการ encode label ทำทั้งชุดสำหรับเทรนและทดสอบ

Encoder_TrainData.py

train_directory = path+'/dataset/train'
X=[]
Y=[]

for subfolder in os.listdir(train_directory):
  shapes_directory = os.path.join(train_directory, subfolder)
  for image_name in os.listdir(shapes_directory):
    image_path = os.path.join(shapes_directory, image_name)
    img = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    pixel_values = img.flatten()
    X.append(pixel_values)
    Y.append(subfolder)

X=np.array(X)
X[X == 0] = 1
X[X > 200] = 0
X[X != 0] = 1

encodeLabel.py

mapping = {'rectangle': 0, 'parallelogram': 1, 'trapezoid': 2, 'square': 3,'circle': 4, 'kite': 5, 'triangle': 6, 'rhombus': 7}
Y = [mapping.get(x, -1) for x in Y]
Y_test = [mapping.get(x, -1) for x in Y_test]

Encoder_TestData.py

test_directory = path+'/dataset/test'
X_test=[]
Y_test=[]

for subfolder in os.listdir(test_directory):
  shapes_directory = os.path.join(test_directory, subfolder)

  for image_name in os.listdir(shapes_directory):
    image_path = os.path.join(shapes_directory, image_name)
    img = cv2.imread(image_path)

    gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    _, binary_img = cv2.threshold(gray_img, 200, 255, cv2.THRESH_BINARY)
    pixel_values = binary_img.flatten()
    X_test.append(pixel_values)
    Y_test.append(subfolder)

X_test=np.array(X_test)
X_test[X_test == 0] = 1
X_test[X_test > 200] = 0
X_test[X_test != 0] = 1

KNN (K Nearest Neighbors)

โมเดลแรกที่เลือกใช้คือ KNN n_neighbors = 5 การทำงาน โมเดลจะทำการเลือกจุดที่อยู่ใกล้ที่สุดจำนวน 5 จุด และเลือกผลลัพธ์ที่เหมือนกันมากที่สุดมาสรุปผล

KNN_MODEL.py

from sklearn.neighbors import KNeighborsClassifier
knn_model = KNeighborsClassifier(n_neighbors=5);
knn_model.fit(X,Y)
y_pred_knn = knn_model.predict(X_test)
conf_matrix_knn = confusion_matrix(Y_test, y_pred_knn)
accuracy_knn = accuracy_score(Y_test, y_pred_knn)
precision_knn = precision_score(Y_test, y_pred_knn, average="macro")
recall_knn = recall_score(Y_test, y_pred_knn, average="macro")
f1_knn = f1_score(Y_test, y_pred_knn, average="macro")

LR (LogisticRegression)

โมเดลที่สอง คือ LogisticRegression max_iter = 10000 เลือกใช้โมเดลนี้เพราะมีขนาดเล็กและทำงานได้ไวมีผลลัพธืที่ค่อนข้างสูง การทำงานจำแนกประเภท (Classification) โดยใช้ฟังก์ชัน Sigmoid ในการแปลงค่าของข้อมูลอินพุตให้เป็นค่าความน่าจะเป็น และตัดสินใจผลลัพธ์

LR_MODEL.py

from sklearn.linear_model import LogisticRegression
model = LogisticRegression(max_iter=10000)
model.fit(X, Y)
y_pred_LR = model.predict(X_test)
conf_matrix_LR = confusion_matrix(Y_test, y_pred_LR)
accuracy_LR = accuracy_score(Y_test, y_pred_LR)
precision_LR = precision_score(Y_test, y_pred_LR, average="macro")
recall_LR = recall_score(Y_test, y_pred_LR, average="macro")
f1_LR = f1_score(Y_test, y_pred_LR, average="macro")