웹 크롤링시 필수적인 패키지.
requests 패키지를 이용해 요청후 응답온 HTML 데이터를 조작할수 있음.
원하는 html 태그를 검색하거나, css 선택자를 검색하여 원하는 데이터를 뽑아낸다.
무단으로 임의의 홈페이지에 크롤링을 하면 위법행위가 될수 있으니 미리 확인하고 해야한다.
robots.txt 파일이 있는지 확인해야하고, 그 파일에 저장된 규약이 어디까지 허용하는지 확인해야함.
www.crummy.com/software/BeautifulSoup/bs4/doc/
searchadvisor.naver.com/guide/seo-basic-robots
ko.wikipedia.org/wiki/%EB%A1%9C%EB%B4%87_%EB%B0%B0%EC%A0%9C_%ED%91%9C%EC%A4%80
'{Programing} > Python' 카테고리의 다른 글
Cheat Sheet : Math Funtions (0) | 2023.02.04 |
---|---|
Python Cheat Sheet (0) | 2023.02.04 |
Requests (0) | 2021.05.12 |
keras (0) | 2021.05.10 |
tensorflow (0) | 2021.05.10 |
댓글