在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
随着大数据时代的来临,ETL工程师逐渐出现在大众的视野中,那么ETL工程师是干什么的呢?直白一点说,ETL工程师又叫数据库工程师,需要掌握各种流行的编程语言,每天的工作就是和数据库打交道,下面详细介绍一下ETL工程师的工作内容,以便于大家进一步了解这个职业。
ETL是什么意思?
ETL中三个字母分别代表的是Extract、Transform、Load,即抽取、转化、加载。数据抽取:从源数据系统抽取目的数据系统需求的数据;数据转换:将从源数据源获取的数据按照业务需求,转换成目的数据源要求的形式,并对错误、不一致的数据进行清洗和加工;数据加载:将转换后的数据装载到目的数据源。
ETL工程师主要干什么?
ETL工程师的主要工作内容有:从事系统编程、数据库编程与设计。ETL原本是作为构建数据仓库的一个环节,负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。因为以前经常是将业务系统的数据取出来放到数仓中,按照星型或雪花型建模。
ELT 的核心思想就是要利用下游数据存储性能大幅提升和机器学习应用的灵活性的优势,在数据流转的过程中不做过于复杂的计算。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
ETL是数据仓库中的非常重要的一环。它是承前启后的必要的一步。相对于关系数据库,数据仓库技术没有严格的数学理论基础,它更面向实际工程应用。所以从工程应用的角度来考虑,按着物理数据模型的要求加载数据并对数据进行一些系列处理,处理过程与经验直接相关,同时这部分的工作直接关系数据仓库中数据的质量,从而影响到联机分析处理和数据挖掘的结果的质量。
数据仓库是一个独立的数据环境,需要通过抽取过程将数据从联机事务处理环境、外部数据源和脱机的数据存储介质导入到数据仓库中;在技术上,ETL主要涉及到关联、转换、增量、调度和监控等几个方面;数据仓库系统中数据不要求与联机事务处理系统中数据实时同步,所以ETL可以定时进行。但多个ETL的操作时间、顺序和成败对数据仓库中信息的有效性至关重要。
ETL工程师岗位职责:
1、海量数据的ETL开发,抽取成各种数据需求。
2、参与数据仓库架构的设计及开发 。
3、参与数据仓库ETL流程优化及解决ETL相关技术问题。
4、熟悉主流数据库技术,如oracle、Sql server、PostgeSQL等。
5、精通etl架构,有一定的etl开发经验,了解日常作业的部署和调度。
6、会数据etl开发工具,如Datastage,Congos,Kettle等。
以上就是ETL工程师的工作内容介绍,希望大家看完以上的内容,能够大概明白ETL工程师是干什么的。相信依靠着大数据技术,ETL工程师在市场上会越来越吃香,
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
学大数据具体可以干什么的?有前途吗?
当大数据的浪潮席卷而来的时候,不少想抓住机遇做时代弄潮儿的小伙伴纷纷转入大数据的怀抱。对此小编想说,学大数据自然是前途无量的,大数据的技术目前已经在各个行业有充分的应用。本文将从大数据的应用行业、技术和具体职位,全面分析“学大数据具体可以干什么的,有前途吗”。
9459
2019-08-01 18:21:38
程序员常用数据库有哪些?
数据库就是数据存储的仓库,任何互联网产品都需要使用数据库保存运营过程中所产生的各种数据。SQL是一种数据库查询语言和程序设计语言,主要就是用于管理数据库中的数据,如存取数据、查询数据、更新数据等。在大数据技术不断提升与应用的市场背景下,数据库技术也得到很大的发展,目前数据库产品非常多,最常用的数据库有:Oracle、DB2、MongoDB、SQLServer、MySQL等。
9449
2019-12-05 18:48:08
云计算、AI大数据技术在智慧交通方面的应用
云计算、AI大数据技术在智慧交通方面的应用,缓解拥堵,智能信号控制系统及时调整信号时长;加强监控范围有效查处违章行为,打击违法车辆降低交通事故发生;协同指挥防止后续交通堵塞;对路况及时发布,引导司乘人员错开高峰路段就近调整路线等。
8002
2020-02-21 10:34:00
机器学习和数据科学工程师的区别是什么?
机器学习和数据科学工程师的区别:机器学习利用人工智能使计算机无需编程就能学习。数据科学深入研究数据并理解示例、模式和行为的科学。机器学习只是数据科学家掌握的诸多技能中的一项而非全部。
5527
2020-03-13 17:26:38
大数据开发离线计算框架知识点总结
大数据开发离线计算框架知识点总结,大数据在带来发展机遇的同时,也带来了新的挑战,催生了新技术的发展和旧技术的革新。大数据离线计算技术应用于静态数据的离线计算和处理,框架设计的初衷是为了解决大规模、非实时数据计算,更加关注整个计算框架的吞吐量。
5833
2020-07-16 16:41:14