데이터를 많이 줄래, 에포크를 많이 줄래?
many data vs. many epochs 학습이 잘되게 하는 법은 데이터를 늘이거나, 에포크를 늘이거나.즉 학습할 지식이 많거나, 반복학습으로 잘 익히거나.지식을 더 때려 넣을것이냐 vs 학습을 더 많이 시킬것이냐.정답은? 지식을 많이 주고, 에포크를 낮추는게 더 좋았다.(N = data 수, D = diversity. 10개로 1번 학습하면 d=1, 10번 학습하면 d=0.1) 그럼 데이터셋을 확장하려고 한다면, 어떻게 다양성을 증가시킬 수 있는가? 더 다양한 소스에서 데이터를 수집하거나, 다양한 언어로 수집하거나, 라벨링된 데이터를 추가로 수집하거나, 데이터셋 내의 불균형 문제를 해결해서 특정 클래스에 치우치는 것을 줄이거나, 혹은 생성모델이나 코드로 augmentation할 수 있다.하지만 우..
2024. 5. 21.
ISM PMI (구매관리자 지수)
정의 Purchasing Managers Index 미국 공급관리자협회가 미국 전역의 산업별 공급관리자를 대상으로 한 설문조사를 통해 발표됨 제조업 지수 / 서비스업 지수 로 나눠짐 MoM 계산방식 제조업 PMI: 설문 항목 중 5가지 (신규주문, 생산, 고용, 공급자배달, 재고) 지수의 가중치 적용 후 단순 평균으로 산출 서비스업 PMI: 설문 항목 중 4가지 (기업활동, 신규주문, 공급자배달, 고용) 지수의 가중치 적용 후 단순 평균으로 산출 중요도 ★★★★★ 미국의 경기 상황을 가장 신속하게 전달해주는 지표 미국 내에서 제조업 비중은 서비스업에 비해 훨씬 작으며, 계속해서 낮아지고 있음. 그러나, 제조업지수가 서비스업지수에 비해 경기 변동에 더 민감하게 반응하고, Cyclical 하기 때문에 더 중..
2024. 1. 12.