在机器学习的学习之路上,SVM是ML童鞋们在分类问题上一定会遇到的一个学习方法,SVM这一章将SVM按训练数据的线性可分性分为由简到繁分为三种模型:线性可分支持向量机(linner support vector machine in linearly separable case)线性支持向量机(linear support vector machine)以及非线性支持向量机(non-linear support vector)。在实际工程中,面对不同规模的数据集时,在小型数据集上,SVM有时仅需小量的训练数据,就可以得到比较好的训练结果,而这正是因为SVM的特性-支持向量,下面通过思维导图先简单介绍下SVM:

来自台湾国立清华大学的Elvis Saravia等研究人员提出了一种基于图论(graph-based)的机制来提取丰富情感(rich-emotion)的相关模式(pattern),用来加强对语料库的线上情感表达进行深入分析。论文实验结果表明,所提出的情感分析框架DeepEmo比目前大多数的情感分析框架的F1-score都要高(仅次于Volvoka(2016)),而且其提出的富集模式(enriched patterns)也被证实了具有很高的领域适用性。

本章主要讲了决策树学习算法的三个部分:特征选择、树的生成方式和树的剪枝以及三种决策树算法:ID3、C4.5、CART

Tips:决策树的东西比较多(这章啃了一个星期才啃完 (lll¬ω¬)),我们平时使用的Sklearn里面的决策树用的就是CART算法,所以这章的重点就在于CART的两种树模型(回归树、分类树),ID3和C4.5可作为了解。