在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
人工智能在当下是热门话题,随着它的发展,越来越多的人投入了学习人工智能的大军。现在网络上的开源项目也越来越多,学习者该选择哪些机器学习项目呢?小编精选了用Python实现且含有潜在新的机器学习想法的五个项目,供大家选择:
一、实时损失曲线图(Live Loss Plot)
在训练模型的时候最好不要只关注最终的结果,耐心观察整个训练过程,查看每个epoch的训练结果,弄清楚模型的训练曲线是否正常,是否出现过拟合等现象。
PiotrMigda等人开发了一个Python源代码包,可以为Keras,PyTorch和其他框架提供实时训练损失的曲线。
当使用的是Keras深度学习框架时,实时损失曲线图可以简单地通过以下回调函数调用:
二、Parfit
该项目由Jason Carpenter开发,他是旧金山大学数据科学专业的硕士,目前是Manifold的机器学习实习生。
该项目是用于并行化Sklearn机器学习模型的拟合和灵活评分的数据包,具有可视化的功能。一旦导入该数据包,就可以自由使用bestFit()或其他功能。
三、Yellowbrick
Yellowbrick是一款促进机器学习模型选择的视觉分析和诊断工具。具体来说,Yellowbrick是一套名为“展示台(Visualizers)”的视觉诊断工具,它扩展了scikit-learn API,以便人为地指导模型选择过程。简而言之,Yellowbrick将scikit-learn与matplotlib结合在一起,且具有模型生成可视化的效果。
四、textgenrnn
textgenrnn为文本生成任务带来了一个额外的抽象层,目的是用几行代码就可以轻松地在任何文本数据集上训练任意大小和复杂的文本生成神经网络。
该项目建在Keras深度学习框架之上,拥有以下选择功能:
1、一种现代神经网络架构,利用新技术作为注意力加权和跳跃嵌入来加速培训并提高模型质量;
2、能够在字符级或字级上训练并生成文本;
3、能够配置RNN大小,RNN层数量以及是否使用双向RNN;
4、能够训练任何通用输入文本文件,包括比较大的文件;
5、能够在GPU上训练模型,然后可以用CPU生成文本;
6、能够在GPU上训练时利用强大的CuDNN实现RNN,与典型的LSTM实现相比,大大加快了训练时间;
五、Magnitude
Magnitude是一个快速、简单的矢量嵌入实用程序库。它也是一种功能丰富的Python软件包和矢量存储文件格式。通过Plasticity以快速、高效的方式开发机器学习模型。它主要是为Gensim提供一个更简单、更快捷的替代方案,但也可以用作NLP之外域的通用关键向量存储。
该项目提供了各种流行的嵌入模型的链接,这些嵌入模型已经以.magnitude格式准备好以供使用,还包括将任何其他文字嵌入文件转换为相同格式的说明。
此外,Github上有更多的信息,包括熟悉的用于使用预先训练的简化库的起步和运行的所有信息。
以上就是小编整理的2019年有用的五个机器学习项目,大家都了解了吗?马上动手实践一下吧,毕竟这些项目光了解是没多大用的,还是要大家上手练习啊!
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
什么是自动机器学习?它有哪些用处?
随着人工智能的技术的崛起,深度学习的概念开始流行起来,那么谈到深度学习就不得不提自动机器学习。可能还有许多人会问:什么是自动机器学习?它有哪些用处?下面就我们一起了解自动机器学习吧!
7712
2019-09-08 18:58:53
AI技术在医学领域的发展前景分析
伴随人工智能技术热潮的再次崛起,医学领域与AI技术的结合被认为是最有发展潜力的领域。可以看到人工智能多年来的厚积薄发,在人脸语音识别、深度学习等领域的深入发展,使得AI技术在医学领域不断获得突破性进展。下面我们来看看AI技术在医学领域的发展前景分析。
7520
2020-02-25 16:05:20
如何入门机器学习?新手指导建议
机器学习是一门涉及多门学科的交叉学科,作为人工智能近期突破的核心技术之一,机器学习的概念最近被炒的很火,平心而论想要入门机器学习对新手来讲并非易事。尤其是目前的培训市场鱼龙混杂,就算自学也还是要面对无从下手的大量学习资料。因此本文将给到大家一些关于入门机器学习的指导建议,大家可以在看完之后少走一些弯路。
4846
2020-03-31 15:15:34
机器学习中的聚类算法有哪几种?
目前,聚类算法被广泛应用于用户画像、广告推荐、新闻推送和图像分割等等。聚类算法是机器学习中一种“数据探索”的分析方法,它帮助我们在大量的数据中探索和发现数据的结构。那么机器学习中的聚类算法有哪几种呢?下面我将为大家一一介绍常见的几种聚类算法,分别是高斯聚类模型、基于密度的聚类算法、凝聚层次聚类和均值漂移算法。
9864
2020-04-03 19:00:35
2021年开源就业报告来了!它透露了以下几个信息
Linux 基金会发布了《2021 年开源就业报告》,来自全球 200 多名招聘经理和 750 名开源专业人士对开源圈中的种种变化和挑战进行了前沿分析和专业解读,与此同时,报告中还为求职者提供了专业的指导意见,比如哪种技术最具有市场价值,哪些证书能够帮助大家在求职的过程中脱颖而出,以及各领域对具体技术需求的详细数据分析等。下面小谷就跟大家总结一下报告的主要内容:
3626
2021-09-24 18:08:49