Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Ethereum
- web
- web3
- ERC165
- git
- 트랜잭션
- ethers
- 스마트 컨트랙트
- JavaScript
- 블록체인
- 솔리디티
- Docker
- github
- solidity
- 제어의역전
- NFT
- tcp
- web3.js
- Python
- 이더리움
- Programming
- geth
- ERC20
- erc721
- 네트워크
- server
- blockchain
- truffle
- erc
- MySQL
Archives
- Today
- Total
목록urllib (1)
멍개의 연구소
크롤러 개발 라이브러리, 프레임워크
크롤러는 주로 파이썬을 통해개발을 합니다.javascript에서도 chreeio와 같이 크롤러를 할 수 있도록 해주는 라이브러리가 있으나, 비동기 적인 특성 때문에 코드의 작성이 상당히 어려운 부분이 있습니다. 그래서 다양한 라이브러리 제공하는 파이썬을 많이 사용합니다. 크롤러는 크게 2종류의 모듈을 사용합니다. 1. 웹 페이지 요청하는 모듈 2. 요청후 응답 받은 html 돔을 제어 할 수 있는 모듈(파서) 파이썬에서는 웹 페이지 요청을 하는 라이브러리로 requests와 urllib를 사용을 합니다. 파서 모듈로 BeautifulSoup(bs4)를 사용합니다. 우선 requests와 urllib는 요청하는건 같은데 내부적으로 텍스트를 처리하는 방식, 에러를 처리하는 방식이 다릅니다. urllib의 4..
서버/크롤러
2017. 5. 10. 08:44