크롤링,스크레이핑 정리
크롤링,스크레이핑 정의: 우리는 데이터를 수집할 때, 어딘가에 요청하거나 웹에서 긁어온다는 표현을 쓰기도 합니다. 이때 긁어 온다는 말을 조금 더 정확하게, 전문적으로 표현한 것이 크롤링, 스크레이핑 입니다. 예를 들어 2010년부터 2019년까지 월마다 음원사이트의 인기차트 100순위 데이터를 직접 수집할 때, 오래된 데이터를 찾기위해 수많은 클릭과, 저장의 반복이 이루어질 것입니다. 이러한 단순반복 작업을 프로그램을 통해 자동화 시켜서 수행하는 작업을 크롤링이라고 합니다. 크롤링의 원리: 웹에 존재하는 데이터는 대부분 HTML 이라는 문서로 구조화 되어있습니다. 메모장 안에 텍스트를 통째로 구겨넣은 것이 아닌, 제목을 쓰는 공간, 내용을 쓰는 공간, 날짜를 쓰는 공간 모두 태그 라는 문법으로 구분되어..