在线客服
扫描二维码
下载博学谷APP
扫描二维码
关注博学谷微信公众号
在爬虫开发中,我们进场要使用urllib中的urlopen()和request.get()方法请求或获取一个网页的内容。Urliopen打开的UIR网址,url参数可以是一个字符创url或者是一个request对象,返回的网页内容实际上市没有被解码的。下面就具体为大家分享一下urlopen()的内容吧。

Urlopen介绍
urllib.request.urlopen()函数用于实现对目标url的访问。其函数原型如下:urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)
其中url是需要打开的网址;data是Post提交的数据;timeout:设置网站的访问超时时间。同时需要说明的是直接用urllib.request模块的urlopen()获取页面,page的数据格式为bytes类型,需要decode()解码,转换成str类型。
函数参数介绍
1. url 参数:目标资源在网路中的位置。可以是一个表示URL的字符串(如:https://www.boxuegu.com);也可以是一个urllib.request对象。
2. data参数:data用来指明发往服务器请求中的额外的参数信息(如:在线翻译,在线答题等提交的内容),data默认是None,此时以GET方式发送请求;当用户给出data参数的时候,改为POST方式发送请求。
3. cafile、capath、cadefault 参数:用于实现可信任的CA证书的HTTP请求。(基本上很少用)
4. context参数:实现SSL加密传输。(基本上很少用)
返回处理方法详解
urlopen返回对象提供方法:
read() , readline() ,readlines() , fileno() , close() :对HTTPResponse类型数据进行操作。
info():返回HTTPMessage对象,表示远程服务器返回的头信息。
getcode():返回Http状态码。如果是http请求,200请求成功完成;404网址未找到。
geturl():返回请求的url。
版本区别
python2和python3在导入urlrequest的方式是不一样的。
python2中:import urllib2
而python3里面把urllib分开了,分成了urlrequest和urlerror,在这里我们只需导入urlrequest即可。from urllib.request import urlopen
以上就是为大家介绍的python爬虫开发中的urlopen()的介绍。现在python编程语言应用率越来越高,也因此越来越多的朋友加入到python的学习之中。Python具有极其广泛的应用:人工智能、数据分析、爬虫、全站开发、自动化运维、自动化测试等等。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
Python爬虫入门教程 零基础高效学习Python爬虫技术
Python简单易学,爬虫技术,不需要你系统地精通一门编程语言,也不需要高深的数据库技术,从实际的项目中去学习这些零散的知识点。掌握正确的方法,在短时间内做到能够爬取主流网站的数据,其实非常容易实现。
11321
2019-08-08 16:07:57
python网络爬虫培训班怎么样
python网络爬虫培训班怎么样?能学到东西吗?很多想转型做python开的的比较适合选择专业的python网络爬虫培训班,这样可以系统的学习专业知识,比较好的python培训班还有相关的项目实战项目,比如博学谷的Python+人工智能在线就业班,学习完可以掌握服务器端程序开发、web系统设计与开发、爬虫系统、数据分析、数据挖掘、机器学习、图像识别、深度学习等技术知识。
9648
2019-06-24 16:25:46
python开发中元组是什么?元组定义
python开发中元组是什么?元组(tuple)是关系数据库中的基本概念,关系是一张表,表中的每行(即数据库中的每条记录)就是一个元组,每列就是一个属性。 在二维表里,元组也称为行。
14676
2019-06-28 14:30:30
Python爬虫框架有哪些?
在大数据时代,掌握数据就掌握了企业发展的方向。爬虫作为抓取互联网数据的一个途径,成为企业需求量非常大的岗位之一。一般情况下小型的爬虫需求直接使用request库+BS4就可以解决了。稍微复杂一点的可以使用selenium解决JS的异步加载问题。而如果遇到大型的爬虫需求,则需要考虑使用框架了。下面我们来一起学习以及各框架。
9505
2019-07-15 17:57:58
如何入门学习Python爬虫
爬虫是一种技术实现的功能,大部分编程语言都可以实现爬虫,但是对于初学者来说,想要快速学习爬虫技术,建议大家学习Python爬虫。
5639
2020-08-24 14:17:37
热门文章
- 前端是什么
- 前端开发的工作职责
- 前端开发需要会什么?先掌握这三大核心关键技术
- 前端开发的工作方向有哪些?
- 简历加分-4步写出HR想要的简历
- 程序员如何突击面试?两大招带你拿下面试官
- 程序员面试技巧
- 架构师的厉害之处竟然是这……
- 架构师书籍推荐
- 懂了这些,才能成为架构师 查看更多
扫描二维码,了解更多信息
