Classification1 [ML] 머신러닝 3주차 - Classification 10.08.2023 1. MINIST MNIST는 기계학습의 기본적이고 유명한 7만개의 수기로 쓴 0부터 9까지의 정수 이미지 데이터셋이다. 사이킷런에서는 이 데이터셋을 다운로드 받을 수 있도록 제공하고 있다. 각 인스턴스는 하나의 행이며, 각 피쳐가 하나의 컬럼이 된다. 이 데이터셋의 경우, 하나의 이미지는 784개의 피쳐를 가지고 있다.(28*28 픽셀이기 때문) 하나의 피쳐는 각 픽셀의 intensity를 의미한다. (0-255) MINIST데이터셋은 이미 트레이닝 데이터와 테스트 데이터로 나뉘어져 있다(6만, 1만) 그리고 이미 균형잡히게 섞여져 있음. 만약 그렇지 않다면 전체 파퓰레이션 반영을 못하게 되므로 셔플이 잘 되어있어야 함. 2. Training a Binary Classifier 이제.. 2023. 10. 8. 이전 1 다음