先打个广告:欢迎关注我的公众号,参与 文史大挑战 趣味题目。使用方法见 这篇文章 。
正文开始:
这个系列是我通过阅读 Scikit-learn 的文档,结合自己的理解和掌握的知识,重新把文档描述出来。希望能加深自己的理解,希望能帮到有需要的人。
学习材料:https://scikit-learn.org/stable/tutorial/basic/tutorial.html
生活中的例子
以人类的学习过程为例:我们小时候学习 4 这个符号,给我们的学习样例是:
对于学习数字的人类幼崽来说,上面这个图片就是训练样本,学习的内容是把这个图案和 4 这个符号关联起来。
当我们学会后,会在生活中见到多种多样的 4,比如说:
当我们从上面每张图里都能正确的认出 4 时,就证明我们已经成功学习了 4 这个符号,能正确的将符号 4 和 这些图案所携带的信息关联起来。
概念
一般来讲,学习问题是以 $n$ 个采样数据为基础,预测未知数据的属性。
训练数据集:带有已知标签信息的数据集,比如上节中学习用的图案 4.
测试数据集:无标签信息,需要使用算法预测标签的数据集,比如上节中多种多样的 4.
概述
Scikit-learn 是一个 Python 的库,将机器学习算法与已有的一些科学计算库(NumPy, SciPy, matplotlib)紧密结合,充分利用了这些科学计算库的优点和便捷性,通过 统计方法 以实现 上述目标
如果您对本文有疑问或者寻求合作,欢迎 联系邮箱 。邮箱已到剪贴板
给个免费的赞吧~
精彩评论
本站 是个人网站,采用 署名协议 CC-BY-NC 授权。
欢迎转载,请保留原文链接 https://www.lfhacks.com/tech/scikit-learn-0/ ,且不得用于商业用途。