케라스 창시자에게 배우는 딥러닝 (3장)


  • 다중 분류 문제

  • 회귀


딥러닝 프로그래밍 과정 정리


  • 데이터셋 로드

  • 데이터 전처리 : 특성 별로 스케일이 다르다면, 스케일을 동일한 범위로 맞춰줘야 한다(정규화 또는 표준화라고 한다). 테스트 데이터든, 새로운 데이터든 훈련 데이터로 스케일을 맞추어야 한다(테스트 데이터의 스케일, 새로운 데이터의 스케일이 각각 다를 수 있기 때문에 우리가 훈련시키는 훈련 데이터의 스케일로 통합한다). 스케일을 동일하게 맞추려면 특성마다 평균을 빼고 표준편차로 나눈다.

  • 모델 구성하기 : 샘플, 출력 클래스에 따라 모델의 매개변수를 정한다. (은닉층, 은닉 유닛의 개수)

  • 모델 컴파일 : 옵티마이저, 손실 함수, 모델 평가 기준 설정

  • 검증 데이터 세트 만들기 : 훈련 데이터에서 일부를 떼어내어 검증 데이터를 만든다. 그러나 샘플이 적다면, 어떤 데이터 포인트를 갖느냐에 따라 편향된 데이터 세트를 만들 수 있다. 이럴 땐 K-겹 교차 검증을 사용한다.

  • 학습

  • 손실, 정확도 측정 : 오버피팅되는 지점의 epoch 확인

  • epoch 조정

  • 재학습

  • 예측

​ ​

R 프로그래밍 시즌1 완강


  • solve함수 구현하기, 단위 행렬 반환하는 함수 만들기

  • 고유 벡터, 고유값

  • ggplot, 선형 모델

  • R markdown

아… 출석부가 한글로 되어있어서 R에서 읽을 수가 없다. 진짜 R 걸린다.. 후

+ 교수님 강의 자료에 tip이 있었다. 긋.


R 복습


  • setwd() : working directory 설정

  • ??pakage

  • ?function

  • getOption() : R 설정을 보고 싶을 때

  • R에서는 언더바 대신 .을 쓴다.

  • cat() : 콘솔에 출력될 때 나오는 큰따옴표를 없애준다.

  • seq() : 수열을 만들 때 사용한다. python의 range와 비슷하다.

  • 타입 캐스팅 ​: as.numeric과 같이 as.데이터타입

  • 루프 : lappy(), sapply(), tapply(). pandas의 apply와 쓰임이 같다.

  • subset : 특정 조건을 충족하는 row들을 반환. 이때 select 옵션으로 원하는 컬럼을 같이 지정할 수 있다.