뉴럴넷(신경망)이 정답(타겟)의 평균에 수렴한다?
신경망을 학습시켰을 때 가장 실망스러운 순간은 목적함수에 따른 손실값이 줄지 않을 때이다. 그런데 이것의 원인이 될 수 있는 후보는 너무나도 많다! 문제가 데이터인지, 코딩 모듈인지, 모델인지, 이론인지 하나씩 다 경험적으로 확인해봐야 한다. 블랙박스를 다루고 있으므로 우리는 답도 보이지 않는 끔찍한 디버깅의 심연 속으로 빠지곤 한다. 하지만 만약 당신의 신경망의 출력을 까보았을 때, 출력값이 타겟의 평균에 수렴하고 있다면 희망이 있다. 이는 배치 사이즈가 충분히 크지 않기 때문일 수도 있다! 보통 손실값이 줄지 않는 경우 신경망의 출력을 까보게 된다. 많은 경우, 이 신경망은 정답의 평균값을 내고 있다. 이는 우리가 오지선다에서 3번으로 그냥 찍어버리는 것에 비유할 수 있다. 신경망의 입장에서는 도저히..
연구/정보
2021. 10. 22. 01:26