• 在线客服

  • 扫描二维码
    下载博学谷APP

  • 扫描二维码
    关注博学谷微信公众号

  • 意见反馈

原创 Python知识点解析之urlopen()详解

发布时间:2019-07-15 19:06:33 浏览 12610 来源:博学谷资讯 作者:枫调

      在爬虫开发中,我们进场要使用urllib中的urlopen()request.get()方法请求或获取一个网页的内容。Urliopen打开的UIR网址,url参数可以是一个字符创url或者是一个request对象,返回的网页内容实际上市没有被解码的。下面就具体为大家分享一下urlopen()的内容吧。

     

    Python知识点解析之urlopen()详解

     

      Urlopen介绍

     

      urllib.request.urlopen()函数用于实现对目标url的访问。其函数原型如下:urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

      其中url是需要打开的网址;dataPost提交的数据;timeout:设置网站的访问超时时间。同时需要说明的是直接用urllib.request模块的urlopen()获取页面,page的数据格式为bytes类型,需要decode()解码,转换成str类型。

     

      函数参数介绍

     

      1. url 参数:目标资源在网路中的位置。可以是一个表示URL的字符串(如:https://www.boxuegu.com);也可以是一个urllib.request对象。

      2. data参数:data用来指明发往服务器请求中的额外的参数信息(如:在线翻译,在线答题等提交的内容),data默认是None,此时以GET方式发送请求;当用户给出data参数的时候,改为POST方式发送请求。

      3. cafilecapathcadefault 参数:用于实现可信任的CA证书的HTTP请求。(基本上很少用)

      4. context参数:实现SSL加密传输。(基本上很少用)

     

      返回处理方法详解

     

      urlopen返回对象提供方法:

      read() , readline() ,readlines() , fileno() , close() :对HTTPResponse类型数据进行操作。

      info():返回HTTPMessage对象,表示远程服务器返回的头信息。

      getcode():返回Http状态码。如果是http请求,200请求成功完成;404网址未找到。

      geturl():返回请求的url

     

      版本区别

     

      python2python3在导入urlrequest的方式是不一样的。

      python2中:import urllib2

      而python3里面把urllib分开了,分成了urlrequesturlerror,在这里我们只需导入urlrequest即可。from urllib.request import urlopen

     

      以上就是为大家介绍的python爬虫开发中的urlopen()的介绍。现在python编程语言应用率越来越高,也因此越来越多的朋友加入到python的学习之中。Python具有极其广泛的应用:人工智能、数据分析、爬虫、全站开发、自动化运维、自动化测试等等。

    申请免费试学名额    

在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!

上一篇: 每天自学Python一小时多久可以掌握?自学Python的常见错误方式 下一篇: 怎样解决数据库高并发的问题

相关推荐 更多

热门文章

  • 前端是什么
  • 前端开发的工作职责
  • 前端开发需要会什么?先掌握这三大核心关键技术
  • 前端开发的工作方向有哪些?
  • 简历加分-4步写出HR想要的简历
  • 程序员如何突击面试?两大招带你拿下面试官
  • 程序员面试技巧
  • 架构师的厉害之处竟然是这……
  • 架构师书籍推荐
  • 懂了这些,才能成为架构师
  • 查看更多

扫描二维码,了解更多信息

博学谷二维码