在线客服
扫描二维码
下载博学谷APP
扫描二维码
关注博学谷微信公众号
如今,网络爬虫早已被广泛应用在爬取网页上。虽然有许多编程语言都可以写爬虫,但是Python绝对是最好的选择。这是因为Python作为一种新手友好的语言,上手简单的同时标准库齐全,还有丰富的各种开源库,开发效率更是不用说,高于绝大多数语言。那么如何利用Python爬取网页呢?或者换句话说,怎样编写Python语言使用网络爬虫呢?

1、编写执行代码
首先,你要安装requests和BeautifulSoup4,然后执行如下代码.
import requests
from bs4 import BeautifulSoup
iurl = 'http://news.sina.com.cn/c/nd/2017-08-03/doc-ifyitapp0128744.shtml'
res = requests.get(iurl)
res.encoding = 'utf-8'
#print(len(res.text))
soup = BeautifulSoup(res.text,'html.parser')
#标题
H1 = soup.select('#artibodyTitle')[0].text
#来源
time_source = soup.select('.time-source')[0].text
#来源
origin = soup.select('#artibody p')[0].text.strip()
#原标题
oriTitle = soup.select('#artibody p')[1].text.strip()
#内容
raw_content = soup.select('#artibody p')[2:19]
content = []
for paragraph in raw_content:
content.append(paragraph.text.strip())
'@'.join(content)
#责任编辑
ae = soup.select('.article-editor')[0].text
2、观看视频学习
如果大家觉得光是文字不足以弄清Python爬取网页的技巧,也可以免费观看博学谷的学习视频。该课程视频主要讲述利用Python语言实现网络爬虫的技巧,学完这门课程后,大家可以学习到scrapy的操作,制作属于自己的爬虫,并了解网页解析的技巧。下面是视频课程主要内容:
第一章 网络爬虫简介
(1)网络爬虫的定义
(2)URL的概述
(3)url请求的基本操作
(4)百度贴吧小爬虫-上
(5)百度贴吧小爬虫-下
(6)正则表达式
第二章 scrapy制作小爬虫
(1)内涵段子小爬虫上
(2)回顾
(3)内涵段子小爬虫下
(4)scrapy制作小爬虫上
(5)scrapy制作小爬虫下
相信大家看完博学谷的网络爬虫课程,就能轻松利用Python爬取网页。对Python爬虫感兴趣的同学,还在等什么,现在就上博学谷官网,开始观看视频学习吧!
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
python网络爬虫培训班怎么样
python网络爬虫培训班怎么样?能学到东西吗?很多想转型做python开的的比较适合选择专业的python网络爬虫培训班,这样可以系统的学习专业知识,比较好的python培训班还有相关的项目实战项目,比如博学谷的Python+人工智能在线就业班,学习完可以掌握服务器端程序开发、web系统设计与开发、爬虫系统、数据分析、数据挖掘、机器学习、图像识别、深度学习等技术知识。
9916
2019-06-24 16:25:46
如何利用Beautiful Soup抓取网页数据?
BeautifulSoup作为掌握爬虫技能的必学工具,其最主要的功能就是抓取网页数据。那么,我们应该如何利用Beautiful Soup抓取网页数据呢?简单来讲,就是先导入Beautiful Soup类,然后传递初始化参数,并初始化,最后获取实例对象,操作对象获取解析、提取数据。下面我们来看看博学谷的《Python爬虫之Beautiful Soup教程》。
9204
2020-03-19 17:02:56
如何利用Python批量下载百度图片?
有时候大家需要保存下载百度图片,但是在数量很大的情况下,一张一张地下载就显得很繁琐麻烦。那么,有没有一种方法可以把搜索到大量的百度图片直接下载到本地电脑中呢?当然有,答案就是利用Python。下面我们主要从方案思路和代码演示两个方面,来看看如何利用Python批量下载百度图片。
8920
2020-04-20 10:22:36
学习Python能实现哪些实际功能?
如今,学习Python早已不仅仅是编程开发者的职业需求,而是成为人人都必须具备的一项基础技能。这其实是因为Python的强大实用性,使它几乎无所不能。那么,学习Python能实现哪些实际功能呢?下面我们就一起来看看,Python可以实现的一些有意思的实际功能。
7604
2020-06-04 11:07:38
如何入门学习Python爬虫
爬虫是一种技术实现的功能,大部分编程语言都可以实现爬虫,但是对于初学者来说,想要快速学习爬虫技术,建议大家学习Python爬虫。
5801
2020-08-24 14:17:37
