BeautifulSoup과 urllib를 이용하여 위키 문헌에 있는 윤동주 작가의 작품 목록을 가져오기이다.
개인적으로 좋아하는 작가기도 하고 학교의 대선배기도 한 윤동주 작가의 작품을 이번 기회에 볼 수 있었다.
'파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문' 책의 내용이다.
======================== Python ========================
### 위키 문헌에 공개돼 있는 윤동주 작가의 작품 목록 가져오기
from bs4 import BeautifulSoup
import urllib.request as req
# 위키 윤동주 페이지를 받아와서 BeautifulSoup을 이용해 parsing한다.
url = "https://ko.wikisource.org/wiki/%EC%A0%80%EC%9E%90:%EC%9C%A4%EB%8F%99%EC%A3%BC"
res = req.urlopen(url)
soup = BeautifulSoup(res, "html.parser")
# div#mw-content-text 아래에 있는
# div.mw-parser-output 아래에 있는
# ul 태그 아래에 있는
# li 태그 아래에 있는
# a 태그를 모두 선택한다.
a_list = soup.select("div#mw-content-text > div.mw-parser-output > ul > li > a")
# 출력한다.
for a in a_list:
name = a.string
print("-", name)
======================== Python ========================
'데이터 분석 > 데이터 분석 프로젝트' 카테고리의 다른 글
[기상청 콘테스트] 해면 기상 상태에 따른 선박 사고 위험도를 측정하는 모델을 개발 - 1(데이터 전처리) (0) | 2018.07.12 |
---|---|
[MTG 프로젝트] MTG Goldfish에서 현재 스탠다드 메타 덱 카드 자료를 수집하고 정량적으로 분석하기 - 1 (데이터 수집단계) (1) | 2018.07.08 |
[데이터 분석] 기상데이터를 이용하여 단위 면적 다양파 생산량을 예측 분석(기상청) - 1(분석 전 단계) (0) | 2018.07.01 |
[설문조사 분석] Python으로 분석한 Kaggle 2017 Survey -5 (0) | 2018.06.28 |
[설문조사 분석] Python으로 분석한 Kaggle 2017 Survey -4 (0) | 2018.06.27 |