您现在的位置是:主页 > 365日博 > 基于Dirichlet混合过程的半监督分类模型研究。

基于Dirichlet混合过程的半监督分类模型研究。

时间:2019-10-30 12:39  来源:365bet足球盘赔率  阅读次数:

基于Dirichlet混合过程的半监督分类模型研究。
梁振峰
[概述]在机器学习领域,大多数机器学习算法都是基于这样的假设,即数据样本是独立且均匀分布的。
其次,在实际情况下,使用唯一的分类模型来预测未知样品的标签。在许多情况下,几乎没有概括能力。
非参数贝叶斯方法根据数据样本的分布来自适应地调整模型的结构,适应数据样本不独立且分布均匀的特点,消除了传统贝叶斯模型的缺陷。它们可以有效地避免,它们很大程度上取决于先验的假设。
此外,使用非参数贝叶斯的模型在半监督领域的研究成果很少。
从这个角度出发,该文档提出了用于分类半监督Dirichlet混合过程(SDPMC)的通用模型框架。
通过建立Dirichlet混合过程和分类模型的合并,可以根据数据分布的特征将分类器分为几个子分类模型。
该算法的特征如下。
1)模型框架是生产模型,基于贝叶斯框架,该生产模型可以反映更多的数据信息特征。
(2)模型框架不是将混合过程与Dirichlet分类器合并的简单线性叠加过程,而是通过使概率最大化来共同学习Dirichlet混合过程和局部分类模型过程。作为客观的训练模型。
(3)模型框架可以自然扩展到半监督场景:通过半监督集成,可以将监督和半监督集成到半监督应用场景中,标记为样本,标记为框架未使用的样本训练模型将被更频繁地使用,并且归纳分类器的能力将得到提高。
这是因为SDPMC是通用模型框架。
在本文中,为了验证性能,我们选择多元Logistic回归模型作为分类器,并构建结合了半监督学习场景的混合Dirichlet过程和多元Logistic回归模型作为示例模型。SDMPC
最后,使用图形模型领域中常用的测试后推导方法完成整个模型的推导和验证。使用常见的蒙特卡洛马尔可夫链采样算法(例如吉布斯采样或汉密尔顿采样)对模型中的隐藏变量进行采样。
在实验场景比较中,与其他分类算法相比,各种训练样本之间的精度实验和关系实验具有一定优势。
[学分]:中山大学[学年]:硕士学位[研究生学位]:2013[分类号]:TP181
下载全文
更多类似的文献