网络首发
基于大语言模型的因果分析类案检索方法
王凌志;周裕林;秦永彬;黄瑞章;陈艳平;林川;类案检索作为保障司法公正与统一的核心技术,为案件判决提供了重要支撑,但现有方法多侧重文本统计特征与表层文本语义,不仅存在难以有效应对文本过长、信息冗余的问题,还忽视了司法裁判中的因果逻辑。因此,提出基于大语言模型的因果分析类案检索方法,通过“事实重建、行为事实提取、行为因果发现”三阶段流程,先对案件事实进行重构,再通过结合知识图谱进行因果分析抽取行为过程,利用反事实推理捕捉行为间因果关系,最后,由大语言模型对行为事实进行因果要素推理,从而发现案件事实中的深层因果逻辑。实验结果表明,所提方法相较于基线模型在P@5、P@10、MAP、NDCG@10、NDCG@20、NDCG@30指标上表现良好,有效验证了因果分析在类案检索任务中的应用价值。
基于结构引导的视觉文档问答
马文康;李宗民;刘玉杰;刘培刚;视觉语言模型在处理结构复杂的文档图像时,常忽略其潜在的结构信息。为此,提出Struct-InternVL,一种结构感知的增强型文档视觉语言小模型。该方法通过结构与布局感知变换裁剪文档图像,去除噪声并保留关键信息;随后在多尺度上引入结构信息把图像划分为多个子图,并通过共享的视觉特征提取器提取结构化视觉信息;最终将特征输入视觉语言模型完成问答。Struct-InternVL有效融合结构与布局信息,提升了模型在复杂文档场景下的理解能力,具备小巧高效,易于集成等优势。
一种随机优化的半监督图聚类算法
何卓文;徐忠城;王学伟;胡恩良;聚类分析中的半监督图聚类问题属于非凸优化问题,当监督信息为大规模随机型数据时,传统的批处理优化方法将不再适用。针对此类问题,提出了一种带方差缩减的非凸随机优化算法,并证明了该算法的局部线性收敛性。实验结果表明,对于约束个数小于10 000的数据集,所提算法远优于随机梯度下降法(SGD)和自适应矩估计(Adam),而在约束个数等于10 000的Sports数据集上,所提的算法比SGD和Adam算法的平均RI指数分别提升8.31和2.96个百分点,平均NMI指数分别提升22.5和10.62个百分点,平均纯度分别提升5.52和1.52个百分点。
一种基于矢量化和GPU加速的快速调和映射算法
李思沅;钱坤;李映华;卫之恒;宋俊蓉;徐昊;杨明;调和映射是三维几何模型中常用的参数化技术,已得到广泛应用。传统调和映射算法通过求解基于离散Laplace-Beltrami算子的稀疏线性方程组来构建参数化。然而,该过程在矩阵构建阶段需要循环遍历网格元素(边、顶点与面),且线性方程组的求解也会耗时较长,导致计算复杂度随模型规模增大呈指数增长。为突破这一计算瓶颈,研究者通过可并行矩阵运算重构调和映射计算流程。该方案充分利用图像处理器(graphics processing unit,GPU)架构固有的并行特性,借助大规模并行计算实现高效的硬件加速。实验结果表明,该GPU加速方法显著提高计算效率,且优势随分辨率的提升愈发明显。这为大规模三维几何模型的调和映射提供了一种新途径,并为需要实时参数化的交互式应用提供新的可能。
黄河流域城市新质生产力研究综述
魏伟;周芳;丁双莹;李涛;张伟;黄河流域城市发展对于实现国家生态保护与高质量发展战略具有重要意义,以黄河流域城市新质生产力为研究对象进行了系统综述。首先,从基本概念、理论来源、主要差异三方面剖析新质生产力理论内涵。其次,对其研究现状进行挖掘,发现现有评价体系主要从生产力三要素和功能属性进行构建,其测度方法从传统模型向空间计量、前沿智能算法等演进,流域城市新质生产力整体呈现“东高西低,核心城市引领”的时空格局。再次,总结了流域城市新质生产力发展面临区域发展不均衡、产业结构单一、创新投入不足及生态超载等问题。最后,提出构建跨区域创新网络、加强中西部数字基建、强化绿色技术攻关等建议。
基于改进YOLO的装甲目标毁伤状态估计方法
宋轩;李新家;徐旺旺;佘维;针对战场上装甲目标毁伤状态检测所面临的图片背景复杂、毁伤程度各异及毁伤特征多变等挑战,提出一种轻量级装甲目标毁伤状态评估方法——挤压-激励(squeeze-and-excitation, SE)与特征融合增强的YOLO模型。首先,通过在Focus模块中添加SE注意力机制,设计了SE-Focus特征提取模块,通过增强关键特征和减少信息冗余来提升模型在复杂环境下的适应性和检测效果。其次,融合加权跨尺度双向特征金字塔网络(bi-directional feature pyramid network,BiFPN)的多尺度特征融合优势与深度可分离卷积(depthwise separable convolution,DSConv)的高效计算特性,在保留BiFPN的优异跨尺度特征交互能力的同时,借助DSConv的特性降低模型复杂度与运算成本。最后,引入SIoU损失函数,增强模型的鲁棒性及训练稳定性。在装甲目标毁伤坦克数据集上的实验结果表明,在参数数量不变的情况下,所提模型相比原模型mAP50提高1.8个百分点,召回率提高1.9个百分点,mAP50-95提高1.7个百分点,验证了改进策略的有效性。
基于跨域融合和动态损失的睡眠呼吸暂停检测
李奇;刘方姿;张航;武岩;赵文丽;针对睡眠呼吸暂停检测中存在的特征表示单一化、跨域关联建模不足以及数据类别不平衡等问题,提出一种融合多视图表征与动态聚焦代价敏感损失函数的检测方法。首先,将不同时长心电信号通过格拉姆角和场映射为图像,构建时序-空间双视图。其次,构建双分支混合网络,结合自适应门控LSTM在时序建模方面的能力与ResSwin Transformer在图像空间特征提取方面的优势,并引入跨域注意力机制实现特征融合。最后,引入动态聚焦代价敏感损失函数来缓解数据类别不均衡的问题。在Apnea-ECG数据集上的实验结果表明,所提方法在片段睡眠呼吸暂停检测中达到了91.2%的准确率、89.2%的灵敏度和92.4%的特异性,在个体睡眠呼吸暂停检测中三项指标均达到100%,显著优于现有方法。
基于思维链与时空类案辅助的刑期预测方法
田合海;余帅;秦永彬;黄瑞章;陈艳平;韩德毅;在法律人工智能领域,刑期预测任务面临准确率提升缓慢和模型可解释性不足的双重挑战。为解决上述问题,提出一种融合思维链推理与类案分析的刑期预测方法,旨在模拟司法实践中定性与定量结合的量刑思维方式。该方法构建了一个三阶段推理框架:第一阶段,依据法条确定量刑起点区间;第二阶段,结合犯罪事实特征推导出基准刑范围;第三阶段,引入时空维度的类案对比,实现结果的精细化微调。在各阶段的方法中引入one-shot思维链推理机制,显式提取并对比法条与案例的关键特征,从而实现推理路径的透明化与可解释化。实验结果表明,所提方法在公开法律数据集上取得了显著的性能提升,验证了其有效性与实用性。
基于动态感知曲线调整策略的自适应低光照图像增强方法
王春萌;赵建行;针对现有低光照增强方法在复杂光照场景下泛化能力有限和参数自适应性调整不足的缺陷,提出一种基于动态感知曲线调整策略(DPCAS)的无参考低光照图像增强方法。DPCAS包括轻量化特征感知模块(LFPM)和动态曲线调整模块(DCAM)。LFPM采用轻量化架构及多尺度双重注意力机制进行特征提取和聚合,DCAM采用动态迭代机制自适应地调整映射曲线参数,二者共同实现局部细节增强与全局曝光校正间的动态平衡。另外,提出一种自适应分配多损失函数权重的两阶段训练机制,实现更稳定的收敛和更精准的目标优化控制。在多个有参考与无参考测试集的定性和定量实验表明,主观质量优于多种现有的低光照图像增强方法,并且在通用定量指标如PSNR、SSIM和NIQE等方面也表现优异,同时具有较高的运行效率。消融实验验证了LFPM、DCAM及自适应调整损失函数机制的有效性。
基于FakeDetect-MobileNet模型的虚假图像检测研究
王军;李怡豪;吕鹏祥;深度伪造技术的快速发展对虚假图像检测提出了准确性与计算效率的双重挑战。针对传统深度学习模型计算复杂度高、难以在移动设备实时部署的问题,提出轻量级检测模型FakeDetect-MobileNet。该模型基于MobileNetV3架构,采用两阶段训练策略:第一阶段冻结预训练特征提取层仅训练分类层;第二阶段全网络微调。同时,采用数据增强和多种正则化技术防止过拟合,提升模型泛化能力。实验结果表明,在Kaggle Deepfake Images数据集上,FakeDetect-MobileNet实现了97.34%的检测准确率,模型参数量仅3.99×106,CPU端推理速度达11 frame/s。与主流模型相比,参数量分别比EfficientNetB0和DenseNet121减少25.7%和50.7%,推理延迟分别降低31%和58%。该模型在保持高检测精度的同时大幅降低资源消耗,特别适合移动设备部署。研究成果为社交媒体内容审核和新闻图像验证等实时应用场景提供了新的思路。