🐣python

딥러닝의 이해

category
🐣python
URL
date
Feb 6, 2023
slug
deep-learning
author
status
Public
tags
Playdata_deep-learning & machine-learning
summary
딥러닝의 이해
type
Post
thumbnail
updatedAt
Mar 2, 2023 03:00 AM

인공지능(Artificial Intelligence)

  • [사례] : 바둑, 장기, 체스에서 인간을 이기는 인공지능 프로그램 병리 영상 속에서 정확히 암세포를 발견 인간과 자연스럽게 대화하는 AI 챗봇
  • [정의] : 인공 지능의 기본은 통계학과 확률론에 근거하여 판정분류를 하는 컴퓨터 프로그램
  • [특징] : 대량의 데이터를 학습해 판정과 분류의 정밀도가 높아져(최적화) 점점 지능이 높아짐
 

인공지능 vs 머신러닝 vs 딥러닝

  • 인공지능 : 지적 작업에 필요한 능력(지능)을 사람이 아닌 기계가 가질 수 있도록 하는 것이며 인간의 지적 능력을 컴퓨터를 통해 구현하는 기술의 총칭
  • 머신러닝 : 주어진 데이터를 기반으로 학습하여 패턴을 파악하고 이를 이용해 예측하거나 분류를수행
  • 딥러닝 : 머신러닝 알고리즘 중에 인공 신경망 구조를 기반으로 학습
    • notion image
       

머신러닝(Machine Learning)

  • 의의
    • 머신러닝(기계학습)은 “기계가 사람이 일일이 코드로 명시하지 안은 동작을 데이터로부터 학습하여 실행할 수 있도록 하는 알고리즘을 개발하는 연구 분야
    • 어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 떄 경험 E로 인해 성능이 향상되었다면 이 컴퓨터 프로그램은 작업T와 성능 측정 P에 대해 경험 E로 학습한 것
    • 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 분야
    • 과거 경험에서 학습을 통해 얻은 지식을 미래의 결정에 이용하는 컴퓨터 과학의 한 분야
    • 관측된 패턴을 일반화하거나 주어진 샘플을 통해 새로운 규칙을 생성
    •  
  • 일반 프로그램과 머신러닝 프로그램의 실행 방식 비교
notion image
 

머신러닝 학습 방법

1. 머신러닝 구분 > 지도학습 VS 비지도 학습

  • 학습의 의미
    • 선을 긋는 것, 깔끔하게 분류할 수 있는 선을 긋거나, 설명할 수 있는 선을 긋는 거
    • 학습에 의해 선을 그음으로써 미지의 데이터에 대한 예측이 가능, 즉 기존의 학습데이터에 나타나지 않은 상황까지도 일반화하여 처리
    •  
  • 지도학습(Supervised Learning)
    • 정답(레이블,label)에 근거한 학습 데이터에서 모델을 학습하여 데이터를 설명하는 하나의 함수(가설)을 유추하고 학습하지 않은 미래 데이터에 대해 예측을 만드는 머신러닝 방법
    • 학습 데이터는 입력 객체에 대한 속성을 벡터 형태로 포함 각각의 벡터에 대해 원하는 결과(종속값, 정답, 레이블)가 무엇인지도 포함되어 있음 학습데이터가 입력, 출력(대상) 벡터 쌍으로 제공
    • 유추된 함수 중 연속적인 값을 출력하는 것을 회귀 분석(Regression)이라고 하고, 이산적인 값을 출력하는 것을 분류(Classification)라고 함. (분류와 회귀의 차이 : 예측값(종속변수)의 형태(연속값,이산값))
    • 이미 정답이 있는 데이터를 컴퓨터에 학습시키는 방법
    •  
  • 머신러닝 지도학습 방식
notion image
 
  • 지도학습의 종류
    • 분류(classification) - 어떤 카테고리(종류) 중 하나를 예측 예) 강아지인지 고양이인지 예측, 스팸메일 예측, 명령 진단
    • 회귀(Regression) - 연속적인 값을 예측 예) 주택의 면적을 고려하여 주택의 가격을 예
    •  
  • 지도학습의 특징
    • 데이터 - 데이터에 특성(맛, 모양)과 레이블(과일이름)이 모두 포함되어 있다.
      • notion image
    • 지도학습 알고리즘 종류 - k-최근접 이웃 - 선형 회귀 - 로지스틱 회귀 - 서포트 벡터 머신(SVM) - 결정트리와 랜덤포레스트 - 신경망
    • 어떤 알고리즘을 사용? - 데이터나 목적에 따라 적합한 알고리즘을 찾아 사용
    •  
  • 비지도 학습(Unsupervised Learning)
    • 정답 데이터를 얻을 수 없는 문제를 학습
    • 지도학습이 아닌 학습, 훈련 데이터에 레이블이 없는 학습
    • 학습 데이터로 입력(특성 행렬)만 제공(정답이 없는 데이터 사용)
    • 수많은 사진을 보여주며 무엇이 사과인지 무엇이 포도인지 정답을 알려주지 않
notion image
  • 비지도 학습 기대 효과
    • 알려지지 않은 데이터 구조 탐색
 
  • 비지도 학습 종류
    • 군집화-유사한 그룹으로 클러스터링
    • 시각화와 차원축소 - 하나의 관측 샘플에 있는 많은 특성(고차원)의 수를 줄임(저차원)으로써 알고리즘의 성능을 개선하거나 시각화에 도움
    • 연관 규칙 학습
    • notion image
       
  • 관련 용어
    • 모델(model) : 학습을 통해 판단하는 알고리즘을 구현한 프로그램
    • 파라미터(parameter) : 데이터에 기반한 값으로 머신 러닝 모델의 특징
    • 하이퍼파라미터(hyperparameter) : 주어진 데이터로부터 구하는 것이 아니라, 외부의 사용자가 직접 입력
    • 최적의 파라미터를 구하고, 하이퍼 파라미터 튜닝을 통해 모델의 성능을 높임
    •  
  • 배경지식
    • 통계학
    • 선형대수
    • 벡터
    • 미분