在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
有时候大家需要保存下载百度图片,但是在数量很大的情况下,一张一张地下载就显得很繁琐麻烦。那么,有没有一种方法可以把搜索到大量的百度图片直接下载到本地电脑中呢?当然有,答案就是利用Python。下面我们主要从方案思路和代码演示两个方面,来看看如何利用Python批量下载百度图片。
一、方案思路
1、获取图片的url链接
首先,打开百度图片首页,如下图url中的index。
接着,把页面切换成传统翻页版(flip),因为这样有利于我们爬取图片!如下图所示:
对比了几个url发现,pn参数是请求到的数量。通过修改pn参数,观察返回的数据,发现每页最多只能是60个图片。
注:gsm参数是pn参数的16进制表达,去掉无妨。
然后,右键检查网页源代码,直接(ctrl+F)搜索 objURL。
这样,我们就找到了需要图片的url了。
2、把图片链接保存到本地。
现在,我们要做的就是将这些信息爬取出来。网页中有objURL,hoverURL…但是我们用的是objURL,因为这个是原图。那么,如何获取objURL?用正则表达式!那我们该如何用正则表达式实现呢?其实只需要一行代码。
二、代码演示
1、获取图片url代码:
2、保存图片到本地代码:
3、主函数代码:
使用说明:
总结一下利用Python批量下载百度图片的要点,首先打开百度图片首页,观察URL变化,页面切换成传统翻页版,然后发送请求,获取响应。接着解析网页,使用正则表达式。最后,创建本地文件夹,根据图片URL链接,保存到本地。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
如何快速实现爬虫从入门到精通
爬虫技术是现在互联网最常用的技术手段之一,甚至很多公司设置专门的爬虫工程师。而且爬虫工程师的薪资水平已经达到10-30K之间。掌握爬虫技术就为自己未来职业发展增加了一项必要的技能。那跨行业,或者零基础的情况下,如何快速实现爬虫从入门到精通水平呢?
7750
2019-07-24 18:34:32
Python爬虫一般用什么框架比较好?
Python爬虫一般用什么框架比较好?一般来讲,只有在遇到比较大型的需求时,才会使用Python爬虫框架。这样的做的主要目的,是为了方便管理以及扩展。本文将向大家推荐十个Python爬虫框架,它们分别是Scrapy、Crawley、Portia、newspaper、python-goose、Beautiful Soup、mechanize、selenium、cola和PySpider。
7885
2019-10-21 16:51:17
零基础学习Python 基础知识入门篇
众所周知,Python是一门集优雅、明确和简单于一体的编程语言,近来随着Python语言在各个行业领域的广泛运用,Python的学习者是越来越多。本文为大家整理了零基础小白入门Python的必需要学习的一些基础知识,内容包括标识符、关键字、引号、编码、输入输出、缩进、多行、注释、数据类型等等。有学习需要的小伙伴赶紧看下去吧!
6127
2019-11-03 22:23:49
为什么学习Python?
近年来,不论是在职的程序员群体,还是新入行互联网的新同学,越来越多的人开始学习Python,而对于很多没有接触过Python的同学而言,总是会提问:为什么学习Python?针对不同的人群学习Python的需求是不同的。
4378
2020-05-15 17:49:21
拷贝文件夹cp和mv命令选项怎么使用?
拷贝文件夹cp和mv命令选项怎么使用?拷贝文件是我们办公文件中比较常用的命令,开发过程也需要掌握拷贝文件命令选项,今天我们就一起来学习一下。
3604
2022-03-08 11:40:55