패턴인식 개요

패턴인식 개요

패턴 인식

주어진 데이터의 집합에 대해 입력값을 바탕으로 하는 Classification. MNIST 처럼 이미지에서 숫자를 도출하는 것도 좋은 예

  • 구조적 방법 : 1은 하나의 직선에 가깝고 8은 원 두개.
  • 템플릿 매칭 : 패턴의 원형을 저장해 두고 데이타간의 거리를 계산
  • 기계학습

패턴 인식과 관련된 개념

1. 분류와 군집화

분류( Classification ) : MNIST로 숫자를 맞추는 형태

  • 베이지안 분류기, K 근접 이웃, 다층 퍼셉트(MLP), 서포트 벡터 머신
  • 지도학습

군집화( Clustering ) : 특성 고객층을 하나의 기준으로 분류하기 보다는 여러가지 기준이지만 뭉뚱그리는 것

  • K 편균 클러스터링, 계층적 군집화, 자기조직화 특징맵(SOM)
  • 비지도 학습

2. 데이터와 데이터 분포

여러가지 데이터들은 결국 컴퓨터에서 다루어질 수 있게 수치로 표현 되어야 한다. 이 숫자들을 1차원으로 나열하면 벡터, 차원이 높아지면 행렬이 되는데 이런 모임을 Tensorflow에서는 tensor 라고 지칭하고 딥러닝의 과정이 이 tensor가 움직이면서 나타나서 Tensorflow 를 이루게 된다.

  • 표본집합 추출
  • 특징추출
  • 분류와 결정경계

분류율과 오차

학습 오차 : 학습데이타에 대하여 분류 오차를 계산한 것

테스트 오차 : 실제 데이타의 오차

일반화 오차 : 확률분포함수를 이용한 분포에 따른 평균 오차값. 테스트 오차가 절대값 수치 미적용에 따른 왜곡을 가질 수 있으므로 사용한다

교차검증법을 통해 오차값을 얻어내기도 한다

3. 과다 적합(overfitting)

  • Classifier가 학습데이타에 대해서만 지나치게 적합한 형태로 결정경계를 형성하는 경우. train데이타의 범주를 벗어나는 경우는 제대로 분류하지 못하는 경우.
  • Machine Learning 스터디 (3) Overfitting

4. 활용분야

  • 문자 인식
  • 생체인식
  • 금융데이터
  • 생물정보
  • 뇌 신호 처리
  • 영상처리
  • 뇌 신호 처리

By Keen Dev on March 18, 2017.

Exported from Medium on May 31, 2017.

공유하기