Web Scraping
- 네이버 영화 리뷰 스크래핑 함수 구현
- TEST Movie : 샹치와 텐 링즈의 전설
1 |
|
Page Parsing
- URL을 받아 페이지 가져와서 파싱한 두 결과 리턴
1 |
|
Movie Code
검색 페이지 접속
속성 확인
- 검사를 통해 가져와야 할 속성을 확인한다.
- ‘reult_thumb’ class에서 href를 가져와 ‘=’로 split한 뒤 추출한다.
1 |
|
Review list 생성
페이지 위치
- dictionary 형태
- ‘title’ class를 모두 가져와 for문으로 추출
- text : text화 시켜 ‘\n’을 기준으로 split한 후 선택
- star : em을 가져와 text만 추출 후 int화
1 |
|
리뷰 수
- 영화 이름과 총 스크래핑할 리뷰 수를 받아 해당 수만큼 항목이 담긴 리스트 리턴
1 |
|
페이지 수
- 영화 이름과 총 스크래핑할 페이지 수를 받아 해당 페이지만큼 항목이 담긴 리스트 리턴
1 |
|
평균 별점
- 리뷰 리스트를 받아 평균 별점을 구해 리턴
1 |
|
Exeport SQLite
- 영화제목, 페이지 수를 받아 스크래핑한 뒤 DB에 저장
1 |
|