Python|Python爬虫 小白入门笔记汇总( 二 )


需要注意的是urllib不能自动判断重定向 , 需要自己解析重定向的链接并重新请求 。
如果你只是爬取一般的网页 , 那么Python自带的urllib库足够用了 , 如果是想要爬取异步加载的动态网站 , requests库会方便很多 。
requests库
功能强大的爬取网页信息的第三方库 , 可以进行自动爬取HTML页面及自动网络请求提交的操作 。



requests库的主要方法:



Response对象



requests库爬取豆瓣短评示例:



爬虫案例:中国高校排名


最后:
想要学习资料的小伙伴 ,动动手指点点赞+关注我 , 最后私信我“1”哦
以上项目列表希望可以给你的Python学习带来帮助
【Python|Python爬虫 小白入门笔记汇总】