终极算法读书笔记

Author: Steven Date: May 14, 2018 Updated On: May 13, 2019
Categories: 科研笔记
Tags: 机器学习
1.1k words in total, 3 minutes required.

机器学习的五个学派和其主算法

  • 符号学派(symbolists)
    • 将学习看作逆向演绎(inverse of deduction),并从哲学、心理学、逻辑学中寻求洞见;
    • 主算法:逆向演绎
  • 联结学派(connectionists)
    • 对大脑进行逆向分析,灵感来源于神经科学和物理学;
    • 主算法:反向传播
  • 进化学派(evolutionaries)
    • 在计算机上模拟进化,并利用遗传学和进化生物学知识;
    • 主算法:遗传算法
  • 贝叶斯学派(bayesians)
    • 认为学习是一种概率推理形式,理论根基在于统计学;
    • 主算法:贝叶斯推理
  • 类推学派(analogizers)
    • 通过对相似性判断的外推(extrapolating)来进行学习,并受心理学和数学最优化的影响;
    • 主算法:支持向量机

在机器学习领域存在不同思想的学派,主要学派包括符号学派、联结学派、进化学派、贝叶斯学派、类推学派。每个学派都有其核心理念以及其关注的特定问题。在综合几个学派理念的基础上,每个学派都已经找到该问题的解决方法,而且有体现本学派的主算法。

对于符号学派来说,所有的信息都可以简化为操作符号,就像数学家那样,为了解方程,会用其他表达式来代替本来的表达式。符号学者明白你不能从零开始学习:除了数据,你还需要一些原始的知识。他们已经弄明白,如何把先前存在的知识并入学习中,如何结合动态的知识来解决新问题。他们的主算法是逆向演绎,逆向演绎致力于弄明白,为了使演绎进展顺利,哪些知识被省略了,然后弄明白是什么让主算法变得越来越综合。

对于联结学派来说,学习就是大脑所做的事情,因此我们要做的就是对大脑进行逆向演绎。大脑通过调整神经元之间连接的强度来进行学习,关键问题是找到哪些连接导致了误差,以及如何纠正这些误差。联结学派的主算法是反向传播学习算法,该算法将系统的输出与想要的结果相比较,然后连续一层一层地改变神经元之间的连接,目的是为了使输出的东西接近想要的东西。

进化学派认为,所有形式的学习都源于自然选择。如果自然选择造就我们,那么它就可以造就一切,我们要做的,就是在计算机上对它进行模仿。进化主义解决的关键问题是学习结构:不只是像反向传播那样调整参数,它还创造大脑,用来对参数进行微调。进化学派的主算法是基因编程,和自然使有机体交配和进化那样,基因编程也对计算机程序进行配对和提升。

贝叶斯学派最关注的问题是不确定性。所有掌握的知识都有不确定性,而且学习知识的过程也是一种不确定的推理形式。那么问题就变成,在不破坏信息的情况下,如何处理嘈杂、不完整甚至自相矛盾的信息。解决的办法就是运用概率推理,而主算法就是贝叶斯定理及其衍生定理。贝叶斯定理告诉我们,如何将新的证据并入我们的信仰中,而概率推理算法尽可能有效地做到这一点。

对于类推学派来说,学习的关键就是要在不同场景中认识到相似性,然后由此推导出其他相似性。如果两个病人有相似的症状,那么也许他们患有相同的疾病。问题的关键是,如何判断两个事物的相似程度。类推学派的主算法是支持向量机,主算法找出要记忆的经历,以及弄明白如何将这些经历结合起来,用来做新的预测。

每个学派对其中心问题的解决方法都是一个辉煌、来之不易的进步,但真正的终极算法应该把5个学派的5个问题都解决,而不是只解决一个。

引用