分类模型

机器学习 2343 Views

大家好,这里是“黑龙江大学自然语言处理实验室”。我们将成为大家了解科研,了解自然语言处理的一个很好的途径。如果大家有什么意见或者看法,都可以和我留言的。欢迎大家提问,多多互动~

本文源自新浪博客

点击“阅读原文”即可查看该链接

分类模型是文本分类的核心技术,大体上文本分类模型可以分为两种:基于规则的文本分类和基于统计的文本分类。在基于规则的分类技术中首先需要根据某种假设建立起可用于分类的规则,该规则包括了文本的表示方法,类别的表示方法,文本与类别的映射方式等等,之后通过训练过程来完成规则的完善和调整,训练后则可以使用该规则来决定文本的类别完成分类。决策树decision tree神经网络,支持向量机support vector machine等都是属于基于规则的分类方法(有争议,因为明显svm是基于统计学习理论的,但同时svm跟NN关系密切).基于规则的分类方法理论基础强,合理性高,而且分类的规则易于为人们所理解,也易于改写成其他形式。但基于规则的分类方法实用性很差。这是因为现实中的数据集颇为庞大,在此种情况下,训练时规则的建立调整过程效率会很低。应用规则完成分类的效率也较差,此时基于规则的分类方法往往显得力不从心。责任编辑:张钰

您可以查找公众号:hlju_nlp 或扫描如下二维码,即可关注“黑龙江大学自然语言处理实验室”:

如未说明则本站原创,转载请注明出处:NULL » 分类模型