[Python] Job Scrapper

 * 노마드코더 Python으로 웹 스크래퍼 만들기 강의를 통해 학습하실 수 있습니다.

 

필요한 모듈
모듈명 사이트 설명
requests https://requests.readthedocs.io/en/master/ Python을 위한 간단한 HTTP 라이브러리
BeautifulSoup https://www.crummy.com/software/BeautifulSoup/bs4/doc/ HTML 및 XML 파일에서 데이터를 꺼내기 위한 Python 라이브러리
csv
https://docs.python.org/3.8/library/csv.html  

 

개발 순서
 1. requests를 이용한 URL 호출 (indeed, statck_of_flow)
 2. 검색 키워드, 페이지 파라미터 찾기
 3. URL 호출로 HTML 전문 가져오기
 4. BeautifulSoup을 이용하여 필요한 데이터의 태그 검색하기
 5. 데이터 리스트 만들기
 6. CSV로 내려 받기

 

1 ~ 2. Request
LIMIT = 50
INDEED_URL = f"https://kr.indeed.com/jobs?limit={LIMIT}"
get_request = requests.get(f"{INDEED_URL}&q={keyword}")

 

3. HTML 전문 가져오기
html_parse = bs(get_request.text, 'html.parser')

 

4 ~ 5. 필요한 데이터 태그 검색하기

 - 페이지

 

 

 - job 관련 데이터

 

 

6. CSV 파일로 내려 받기

 

 

Flask를 이용한 Job List Data Crawling

 * 간단한 데이터는 Flask를 이용해 CSV파일로 만들고, 보다 큰 데이터는 Django를 이용해 프로젝트 작성 할 것

'Edu > Nomad Coders' 카테고리의 다른 글

[AWS - Django] 배포하기  (0) 2020.04.09
[Airbnb] 정리  (0) 2020.03.14

+ Recent posts