博学谷 > 资讯 > 人工智能 > 2019年有用的五个机器学习项目

原创 2019年有用的五个机器学习项目

发布时间:2019-07-25 10:19:22 浏览 3242 来源:博学谷资讯 作者:照照

    人工智能在当下是热门话题,随着它的发展,越来越多的人投入了学习人工智能的大军。现在网络上的开源项目也越来越多,学习者该选择哪些机器学习项目呢?小编精选了用Python实现且含有潜在新的机器学习想法的五个项目,供大家选择:

     

    机器学习项目

     

    一、实时损失曲线图(Live Loss Plot)

     

    在训练模型的时候最好不要只关注最终的结果,耐心观察整个训练过程,查看每个epoch的训练结果,弄清楚模型的训练曲线是否正常,是否出现过拟合等现象。

     

    PiotrMigda等人开发了一个Python源代码包,可以为Keras,PyTorch和其他框架提供实时训练损失的曲线。

     

    当使用的是Keras深度学习框架时,实时损失曲线图可以简单地通过以下回调函数调用:

     

    二、Parfit

     

    该项目由Jason Carpenter开发,他是旧金山大学数据科学专业的硕士,目前是Manifold的机器学习实习生。

     

    该项目是用于并行化Sklearn机器学习模型的拟合和灵活评分的数据包,具有可视化的功能。一旦导入该数据包,就可以自由使用bestFit()或其他功能。

     

    三、Yellowbrick

     

    Yellowbrick是一款促进机器学习模型选择的视觉分析和诊断工具。具体来说,Yellowbrick是一套名为“展示台(Visualizers)”的视觉诊断工具,它扩展了scikit-learn API,以便人为地指导模型选择过程。简而言之,Yellowbrick将scikit-learn与matplotlib结合在一起,且具有模型生成可视化的效果。

     

    四、textgenrnn

     

    textgenrnn为文本生成任务带来了一个额外的抽象层,目的是用几行代码就可以轻松地在任何文本数据集上训练任意大小和复杂的文本生成神经网络。

     

    该项目建在Keras深度学习框架之上,拥有以下选择功能:

     

    1、一种现代神经网络架构,利用新技术作为注意力加权和跳跃嵌入来加速培训并提高模型质量;

     

    2、能够在字符级或字级上训练并生成文本;

     

    3、能够配置RNN大小,RNN层数量以及是否使用双向RNN;

     

    4、能够训练任何通用输入文本文件,包括比较大的文件;

     

    5、能够在GPU上训练模型,然后可以用CPU生成文本;

     

    6、能够在GPU上训练时利用强大的CuDNN实现RNN,与典型的LSTM实现相比,大大加快了训练时间;

     

    五、Magnitude

     

    Magnitude是一个快速、简单的矢量嵌入实用程序库。它也是一种功能丰富的Python软件包和矢量存储文件格式。通过Plasticity以快速、高效的方式开发机器学习模型。它主要是为Gensim提供一个更简单、更快捷的替代方案,但也可以用作NLP之外域的通用关键向量存储。

     

    该项目提供了各种流行的嵌入模型的链接,这些嵌入模型已经以.magnitude格式准备好以供使用,还包括将任何其他文字嵌入文件转换为相同格式的说明。

     

    此外,Github上有更多的信息,包括熟悉的用于使用预先训练的简化库的起步和运行的所有信息。

     

    以上就是小编整理的2019年有用的五个机器学习项目,大家都了解了吗?马上动手实践一下吧,毕竟这些项目光了解是没多大用的,还是要大家上手练习啊!

    申请免费试学名额    

在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!

领取成功
领取失败
上一篇:零基础自学5G攻略 下一篇:AI换脸技术原理分析

相关推荐 更多

最新文章

扫描二维码,了解更多信息