博学谷 > 免费课 > kettle 8.2数据仓库零基础快速入门(一)

kettle 8.2 快速入门实战

kettle 8.2数据仓库零基础快速入门(一)

ETL工程师,在数据仓库类职位中占有很大比例,而且薪水都不差。IT人一下子转型数据分析师可能跳跃度比较大难度高,先转型数据仓库/ETL工程师再择机往更高处走是合理选择之一。在ETL软件中,使用最多的是开源的Kettle,完全免费,功能和性能不弱于datastage这类商业ETL软件,使用Kettle和其它开源数据平台软件,例如Mysql集群,Hadoop集群等组合在一起,是性价比极高的架构选择。

主讲:大数据高级讲师 | 课程时长:15课时| 学习人数:813人 | 难度: 基础

该课程已下架,请查看其它课程

课程简介

ETL工程师,在数据仓库类职位中占有很大比例,而且薪水都不差。IT人一下子转型数据分析师可能跳跃度比较大难度高,先转型数据仓库/ETL工程师再择机往更高处走是合理选择之一。在ETL软件中,使用最多的是开源的Kettle,完全免费,功能和性能不弱于datastage这类商业ETL软件,使用Kettle和其它开源数据平台软件,例如Mysql集群,Hadoop集群等组合在一起,是性价比极高的架构选择。

适学人群

1 对数据仓库感兴趣的高校学生和教师

2 在职的IT人员

学完收获

使用kettle完成数据的抽取、清洗、加载

课程亮点

全面讲解:全面讲解了开发中使用的模块

实战学习:先理论后案例动手实战学习

全新软件:采用了kettle8.2来进行教学

主讲内容

Kettle简介:

kettle、转换、作业、Step、Hop

Kettle输入

Excel输入、Get data from XML、JSON input、文本文件输入、生成记录、自定义常量数据、表输入

Kettle输出

Excel输出、Microsoft Excel输出、SQL文件输出、删除、插入/更新、文本文件输出、更新、表输出

Kettle转换

Concat fields、值映射、列拆分为多行、列转行、剪切字符串、去除重复记录、唯一行(哈希值)、增加常量、增加序列、字段选择、字符串操作、字符串替换、拆分字段、排序记录、行扁平化、行转列、计算器

Kettle应用

写日志、替换NULL值

Kettle流程

Switch/case、中止、空操作(什么也不做)、过滤记录

Kettle脚本

Java代码、JavaScript代码、执行SQL脚本

Kettle查询

HTTP Client、数据库查询、数据库连接、流查询

Kettle连接

合并记录、记录关联(笛卡尔积输出)、记录集连接

Kettle统计

分组

Kettle映射

映射(子转换)、映射输入规范、映射输出规范

Kettle作业

作业、参数

课程效果

猜你还感兴趣

  • 大数据前置技能提升课

    大数据前置技能提升课

    入行或转型大数据必备技能

    ¥59.00 142人学习
  • Hive视频教程

    Hive视频教程

    本视频是大数据学科的中级教程,将会为您讲述Hive的具体内容,相信通过本视频你会更加了解大数据学科。 Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载,这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。

      免费 482人学习
  • 大数据hadoop入门教程

    大数据hadoop入门教程

    本视频是大数据学科的入门教程,将会为您讲述hadoop的具体内容,对大数据感兴趣的你一定不要错过哦。Hadoop实现了一个分布式文件系统,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS放宽了POSIX的要求,可以以流的形式访问文件系统中的数据。

      免费 868人学习
  • 云计算大数据之zookeeper教程

    云计算大数据之zookeeper教程

    ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是以Fast Paxos算法为基础的,Fast Paxos作了一些优化,通过选举产生一个leader (领导者),只有leader才能提交proposer,具体算法可见Fast Paxos。

      免费 536人学习
  • 大数据职业规划课

    大数据职业规划课

    本课程是由传智播客资深就业指导老师,针对有Java基础的学员所开展的大数据学科的职业规划公开课,课程通过对行业前景、现状的分析,学习路径的规划,助力学子明确职业发展方向,有准备的求职。

      免费 455人学习
  • 云计算大数据在线就业班