您现在的位置是:主页 > bet36365在线备用 > 基于Dirichlet混合过程的半监督分类模型研究。
时间:2019-10-11 13:10 来源:365bet娱乐场 阅读次数:
基于Dirichlet混合过程的半监督分类模型研究。 梁振峰 [概述]在机器学习领域,大多数机器学习算法都是基于这样的假设,即数据样本是独立且均匀分布的。 其次,在实际情况下,使用唯一的分类模型来预测未知样品的标签。在许多情况下,几乎没有概括能力。 非参数贝叶斯方法根据数据样本的分布来自适应地调整模型的结构,适应数据样本不独立且分布不均匀的特点,有效地消除了贝叶斯模型的缺陷。可以避免。传统上很大程度上依赖于先验假设。 此外,使用非参数贝叶斯的模型在半监督领域的研究成果很少。 从这个角度出发,本文档提出了用于分类半监督Dirichlet混合过程(SDPMC)的通用模型框架。 通过建立Dirichlet混合过程和分类模型的合并,可以根据数据分布的特征将分类器分为几个子分类模型。 该算法的特征如下。 1)模型框架是生产模型,基于贝叶斯框架,该生产模型可以反映更多的数据信息特征。 (2)模型框架不是用于合并混合过程和Dirichlet分类器的简单线性叠加过程,而是通过最大化概率,共同学习Dirichlet混合过程和局部分类模型过程如果作为客观训练模型。 (3)模型框架可以自然地扩展到半监督方案:半监督集成将监督和半监督半监督应用方案集成在一起,并标记带有标签的样本和框架未经训练的样本训练模型被更频繁地使用,并提高了归纳分类器的能力。 这是因为SDPMC是通用模型框架。 在本文中,为了验证性能,我们选择多元Logistic回归模型作为分类器,并构建混合Dirichlet过程和多元Logistic回归模型并结合半监督学习场景作为SDMPC的示例模型。 最后,使用图形模型领域中常用的测试后推导方法完成整个模型的推导和验证。使用通用的蒙特卡洛马尔可夫链采样算法(例如吉布斯采样和汉密尔顿采样)对模型中的隐藏变量进行采样。 在实验场景比较中,与其他分类算法相比,不同训练样本之间的精度实验和关系实验具有一定的优势。 [学分]:中山大学[年级]:硕士学位[年级]:2013[分类号]:TP181 下载全文 更多类似的文献 |