[오늘의 공부] Keras - 다중 분류, 회귀, R programming(+한글 깨짐)

데이터셋 로드
데이터 전처리 : 특성 별로 스케일이 다르다면, 스케일을 동일한 범위로 맞춰줘야 한다(정규화 또는 표준화라고 한다). 테스트 데이터든, 새로운 데이터든 훈련 데이터로 스케일을 맞추어야 한다(테스트 데이터의 스케일, 새로운 데이터의 스케일이 각각 다를 수 있기 때문에 우리가 훈련시키는 훈련 데이터의 스케일로 통합한다). 스케일을 동일하게 맞추려면 특성마다 평균을 빼고 표준편차로 나눈다.
모델 구성하기 : 샘플, 출력 클래스에 따라 모델의 매개변수를 정한다. (은닉층, 은닉 유닛의 개수)
모델 컴파일 : 옵티마이저, 손실 함수, 모델 평가 기준 설정
검증 데이터 세트 만들기 : 훈련 데이터에서 일부를 떼어내어 검증 데이터를 만든다. 그러나 샘플이 적다면, 어떤 데이터 포인트를 갖느냐에 따라 편향된 데이터 세트를 만들 수 있다. 이럴 땐 K-겹 교차 검증을 사용한다.
학습
손실, 정확도 측정 : 오버피팅되는 지점의 epoch 확인
epoch 조정
재학습
예측

아… 출석부가 한글로 되어있어서 R에서 읽을 수가 없다. 진짜 R 걸린다.. 후

+ 교수님 강의 자료에 tip이 있었다. 긋. 한글깨짐 팁