原创 大数据领域好用的开源软件推荐

发布时间:2019-08-16 17:35:18 浏览 2472 来源:博学谷资讯 作者:照照

    相信大家都明白开源软件的重要性,好用的开源软件真的是太多了。本文就主要针对大数据领域,给大家推荐十款好用的开源软件,即HBase、Hadoop分布式文件系统、HiveSpark、Redis、SpagoBI、Lucene、HDP、CDH、HPCC。

     

    大数据领域开源软件推荐

     

    1、HBase

     

    HBase是为有数十亿行和数百万列的超大表设计的,这是一种分布式数据库,可以对大数据进行随机性的实时读取/写入访问。它有点类似谷歌的Bigtable,不过基于Hadoop和Hadoop分布式文件系统(HDFS)而建。

     

    2、Hadoop分布式文件系统(HDFS)

     

    HDFS是面向Hadoop的文件系统,不过它也可以用作一种独立的分布式文件系统。它基于Java,具有容错性、高度扩展性和高度配置性。支持的操作系统:Windows、Linux和OS X。

     

    3、Hive

     

    Apache Hive是面向Hadoop生态系统的数据仓库。它让用户可以使用HiveQL查询和管理大数据,这是一种类似SQL的语言。

     

    4、Spark

     

    作为MapReduce之外的一种选择,Spark是一种数据处理引擎。它声称,用在内存中时,其速度比MapReduce最多快100倍;用在磁盘上时,其速度比MapReduce最多快10倍。它可以与Hadoop和Apache Mesos一起使用,也可以独立使用。支持的操作系统:Windows、Linux和OS X。

     

    5、Redis

     

    Redis现在由Pivotal赞助,这是一种键值缓存和存储系统。提供收费支持。要注意:虽然该项目并不正式支持Windows,不过微软在GitHub上有一个Windows派生版。支持的操作系统:Linux。

     

    6、SpagoBI

     

    Spago被市场分析师们称为“开源领袖”,它提供商业智能、中间件和质量保证软件,另外还提供Java EE应用程序开发框架。该软件百分之分免费、开源,不过也提供收费的支持、咨询、培训及其他服务。

     

    7、Lucene

     

    基于Java的Lucene可以非常迅速地执行全文搜索。据官方网站声称,它在现代硬件上每小时能够检索超过150GB的数据,它含有强大而高效的搜索算法。开发工作得到了Apache软件基金会的赞助。

     

    8、HDP

     

    HDP是Apache Hadoop分发版。Hortonworks Data Platform(HDP)用于创建安全的企业数据湖,为企业提供实现快速、实时商业洞察力所需的分析信息。HDP是一个开源大数据的生态系统。

     

    9、CDH

     

    CDH是Apache Hadoop分发版。CDH除没有HDP那样开放开源外,其它都很类似。CDH文档都组织、整理的不错,可作为了解、学习大数据、Apache Hadoop的一个重要资源。

     

    10、HPCC

     

    在Apache Hadoop & Spark统治的大数据市场,HPCC显得弥足珍贵,值得更多关注。HPCC 包括以下核心组件:Thor (the Data Refinery Cluster);Roxie (Rapid Online XML Inquiry Engine, the Query Cluster);ECL (Enterprise Control Language)ECL IDE;ESP (Enterprise Services Platform)。HPCC在安全、身份和风险管理有众多成功案例。

     

    以上十款大数据领域好用的开源软件就推荐到这里了。当然啦,好用的开源软件的还有很多,小编会陆续整理出来。希望本篇文章能够对大家有所帮助。

    申请免费试学名额    

在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!

上一篇: 学大数据学得想哭?大数据真有这么难学吗? 下一篇: 学云计算大数据必看的六本经典书籍推荐

相关推荐 更多

热门文章

  • 带有参数的装饰器怎么使用?
  • 闭包的作用是什么?闭包如何使用?
  • 闭包读取函数内部变量函数的基础知识分享
  • 35岁不是程序员职场中的绊脚石
  • 直播电商产品经理的职业前景怎么样?
  • 产品经理和研发多年互喷的原因在哪?
  • SaaS产品需求优先级如何定?
  • 征服色彩 设计师必知的色彩心理感应
  • 私域流量运营的核心技巧是什么?
  • Python在线学习可以吗?靠不靠谱?
  • 查看更多

扫描二维码,了解更多信息

博学谷二维码