机器学习入门,如果上来就看各种算法,什么神经网络,卷积神经网络,我保证你会云里雾里。最好的方法其实是在站在顶层上了解各种概念,不要纠结于具体实现,这样对机器学习有一个整体的概念就不会迷失方向。要不你想参加什么培训班,都可能被忽悠。
##人工智能、机器学习与深度学习? 先对这些名词了解。
人工智能 > 机器学习 > 深度学习
人工智能范围很广,只要是能做某些智能活动的程序都是人工智能。人类的智能活动可以是语言、运动、知觉、学习等等,语言对应的就是自然语言处理,运动对应机器人,知觉可以是语音识别,其中的学习就是机器学习了。深度学习是机器学习的一个分支,你应该听说过深度人工神经网络、卷积神经网络等等,这些就属于深度学习,在入门阶段你可以把深度学习理解成多层的神经网络,AlphaGo就用到了深度学习相关算法。
##机器如何学习 谈到学习,当然要有老师先训练,即便人类也不可能从一无所知的小孩自学成才,而且学会了公式还要做习题巩固。所以机器学习当然也需要先人为的进行训练,人类学习的训练方式可以是做习题,机器的学习的训练方式就是数据。我们根据数据是否有标签能进一步划分学习方法,这个标签就相当于人类学习用的习题的答案,如果数据都有标签就是监督式学习,没有标签就是无监督式学习,数据有的有标签有的没有那就是半监督式学习。 当然作了题不给我答案,我只能把题目分个类了。
一、无监督式学习
非监督式学习问题可以进一步分为聚类问题和关联问题。(注意聚类与分类的区别,就像化学中的相似相溶原理,自主地想属于自己的集合靠拢;而分类则是我们根据一定的标准进行划区分)
聚类问题:聚类学习问题指的是我们想在数据中发现内在的分组,比如以购买行为对顾客进行分组。 关联问题:关联问题学习问题指的是我们想发现数据的各部分之间的联系和规则,例如购买X物品的顾客也喜欢购买Y物品。 一些流行的非监督式学习算法的例子:
聚类问题的k-means算法 关联规则学习问题中的Apriori算法
二、监督式学习
在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景如分类问题和回归问题。
通常,这类预测问题可以用回归模型(regression)进行解决,回归模型定义了输入与输出的关系,输入即现有知识,而输出则为预测。
常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)