
公众号
网站访问量
基于贝叶斯优化极端梯度提升树的电缆状态分类研究
佘维;王欣;陈斌;吕钟毓;张海丽;田钊;针对多分类问题中样本类间不均衡引起的电缆状态分类准确性不高的问题,提出一种基于贝叶斯优化极端梯度提升树的电缆状态分类方法。首先,利用贝叶斯优化对极端梯度提升树算法里面的超参数进行训练,获取最优超参数配置。其次,将最优超参数配置应用于极端梯度提升树算法中,得到Bo-XGBoost分类模型。最后,通过实例验证该分类方法相较于SVM、TabNet、LightGBM等方法有更高的准确性,可为电缆状态分类提供一种新方向。
融合不确定性建模的行程时间与置信区间估计
申泽楷;郭晟楠;毛潇苇;吕聪康;贾宇欣;林友芳;万怀宇;针对智能交通系统中行程时间估计的不确定性量化的难题,提出一种全局-局部不确定性感知行程时间估计方法(global and local uncertainty-aware travel time estimation, GLUTTE)。首先,通过多任务学习策略建模整体路线与各局部路段的行程时间关系及其不确定性。其次,采用多粒度分位数回归方法,综合考虑全局和局部特征,提供准确的置信区间估计。实验结果表明,所提方法能够有效量化不确定性,同时保证准确性并提供可靠的置信区间,从而提升结果的可用性和可信度。
基于粒球邻域粗糙集的三支高斯混合聚类
邵春梅;万仁霞;苗夺谦;赵杰;为了解决高维数据集中冗余信息影响三支高斯混合模型聚类效果的问题,将粒球邻域粗糙集的理论融入三支高斯混合聚类模型中,提出一种基于粒球邻域粗糙集的三支高斯混合聚类模型。首先,使用k-means聚类生成满足纯度要求的粒球集,再在粒球生成正域不变约束下进行属性约简,提取关键属性。其次,使用三支高斯混合模型对约简后的数据进行聚类,将对象划分到类簇的核心域或边界域。在7个UCI公共数据集上的对比实验结果表明,所提模型不仅继承了三支高斯混合聚类模型优越的聚类性能,具有更高的准确率、轮廓系数和更低的戴维森堡丁指数,其对类簇边界部分的刻画也更加准确。此外,由于所提模型对高维空间进行了属性约简处理,使得其具有更小的时间复杂度。
基于Cai-伪残差与变量独立性的因果定向方法
牛瑞琪;原泽鹏;翟岩慧;赵延新;李德玉;针对基于约束的因果关系发现方法中的马尔科夫等价类问题及函数因果模型对噪声的非高斯性假设问题,使用Cai-伪残差的三个定理,提出了Cai-伪残差因果定向算法。首先,假设变量之间关系线性且不限制噪声类型,在此条件下,对于贝叶斯网络的三种结构,Cai-伪残差与变量间的独立性表现出不同的结果。其次,利用基于约束的方法构建马尔科夫等价类之后,通过不同结果进一步发现并区分三种结构,对马尔科夫等价类中部分未定向的边进一步定向。最后,在不同因果网络构成的线性高斯数据集和线性非高斯数据集上分别进行了实验,结果表明,所提算法不仅显著减少了马尔科夫等价类中无向边的数量,同时也有效地提高了因果关系定向的准确性。
基于贝叶斯网络群的压缩语音量化索引调制隐写分析方法
高飞鹏;杨洁;针对压缩语音量化索引调制隐写分析中传统贝叶斯网络方法在低嵌入率下检测准确率不高的问题,提出了一种基于贝叶斯网络群的隐写分析方法。首先,构建用于描述语音码元自身、帧内和帧间相关性的贝叶斯网络群,通过整体样本学习构建条件概率表;其次,以每个子网络的推理结果构造个体样本的特征向量,并利用这些特征训练支持向量机(support vector machine, SVM)模型;最后,实现对未知样本的隐写分类。实验结果表明,在10 s中英文语音数据集上,以20%嵌入率进行多种隐写方法实验,所提方法的检测准确率较传统贝叶斯网络方法和深度学习方法分别提升了至少18.01个百分点和2.32个百分点。同时,检测1 s语音的平均时长为2.72 ms,满足了实时检测要求。
基于集成学习的三支决策模型
王迪;钱进;郑明晨;三支决策是解决复杂决策问题的一种有效方法,但现有的三支决策模型大多基于单个决策标准,可能无法高效地处理决策问题。因此,为解决这一问题,提出了一种基于集成学习的三支决策模型。首先,在决策过程中采用不同的决策标准来获得不同的三支决策结果。之后受悲观多粒度粗糙集思想的启发,利用集合之间的基本操作求解三个决策区域的共识集合。其次,根据对象的相似度,利用k-means算法将不一致集合划分为三个互不相交的子集。最后,分别将这些子集加入各自的共识集合中获得最终的三支决策结果。根据不同数据集上的实验结果可知,所提出的模型与其他传统三支决策模型相比,分类精度和综合评价指标更高,并且有更小的边界区域占比。