- 崔梦天;罗婕妤;王锡;
随着开源软件规模和复杂度的不断提升,软件设计和开发的难度显著增加,软件缺陷的数量也迅速增长.缺陷分派是软件开发中确保质量的关键任务,近年来深度学习领域提出了多种自动化或半自动化的分派方法.然而,这些方法仍存在诸多局限.传统分派方法主要挖掘缺陷报告的文本特征,忽视了缺陷间的依赖关系及其引发的阻塞问题,而缺陷阻塞不仅会降低修复效率,甚至可能导致修复进程停滞.为解决缺陷阻塞问题并降低跨项目的认知成本,提出了一个依赖关联的多目标缺陷分派优化模型.该模型构建缺陷依赖树并更新缺陷优先级,调整缺陷修复顺序.同时,模型引入非支配排序遗传算法,平衡认知成本与修复偏好两个目标,向开发人员推荐排序后的最佳缺陷集合.实验结果表明,该方法在Eclipse和Mozilla数据集上的部分阻塞缺陷修复时间方面取得了显著优化效果.
2025年03期 v.51;No.229 288-297页 [查看摘要][在线阅读][下载 1322K] [下载次数:17 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 谢琪;刘彦辰;
自动重复软件缺陷检测是缺陷处理流程中的关键环节,其性能直接影响缺陷解决的整体效率.针对现阶段研究中预训练模型的长度限制问题和特征单一问题,提出一种强化文本长程依赖和多特征融合的重复软件缺陷报告检测方法.该方法通过结合BiLSTM-Attention机制与Longformer预训练模型,增强对篇章级文本的长程语义信息捕捉能力,从而提取更准确的语义相似度特征.其次,针对结构化元数据类别信息,构建特征提取网络以抽取类别相似度特征.最终,将上述特征与词组重叠特征融合后训练分类模型,以实现高效的重复缺陷报告检测.通过在Bugzilla、JIRA和GitHub平台的Eclipse、NetBeans、OpenOffice、Hadoop和VSCode项目上进行实验,结果表明,与基线方法相比,所提方法在F1分数和Accuracy上分别平均提升了2.40%和2.12%,在跨平台场景下实现了更优的检测性能.
2025年03期 v.51;No.229 298-307页 [查看摘要][在线阅读][下载 2381K] [下载次数:26 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 陈涛;殷锋;郭伟超;
命名实体识别通过识别史料中的人名、地名、事件等实体,能够构建结构化知识库,促进历史信息的语义关联,助力历史事件的重构与分析.由于中文史料中标注语料稀缺,少样本问题较为突出.对此,在自适应裕度元学习三元组网络框架中集成数据增强技术,并使用针对中文的基于双向编码器表示的稳健优化的双向编码器表征预训练模型(robustly optimized bidirectional encoder representations from transformers pretraining approach for Chinese, Chinese-RoBERTa)优化中文长文本语义表征能力,提出融合数据增强的自适应裕度三元组网络命名实体识别方法.实验表明,本方法在少样本场景下表现显著,在5-way 1-shot任务和5-way 5-shot任务中F1值分别达到86.68%和92.78%,验证了其在低资源中文史料场景下的有效性.提出的方法解决了中文史料命名实体识别标注数据稀缺的少样本问题,同时为更广泛的低资源历史文本信息抽取任务提供有益参考.
2025年03期 v.51;No.229 308-314页 [查看摘要][在线阅读][下载 1426K] [下载次数:97 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 杨淑淇;谭颖;
医疗保健和神经科学界长期致力于从大脑活动中解码语言信息.脑机接口在支持获得性脑损伤患者通过大脑信号重新与周围环境建立交流方面获得了突破性进展.然而,获取脑信号的方式无法长期地维持且提取到的脑信号中存在大量噪声,因此提高数据的信噪比具有重要意义.近年来,人工智能在提取和汇聚大量原始数据特征方面展现出了卓越的性能.总结了一系列基于深度学习从人类大脑信号中解码语音的特征提取技术.首先对这些技术涉及的深度学习方法进行了介绍,接下来对这些技术的具体应用进行了列举,最后对如何更好将人工智能技术应用于解码大脑语音信息做出了展望.
2025年03期 v.51;No.229 315-322页 [查看摘要][在线阅读][下载 1190K] [下载次数:82 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 任书仪;李英玲;蔡牧昕;
人岗匹配是通过计算求职者简历与招聘信息的匹配度,进而判断求职者是否适合招聘职位.现有的在线招聘平台通过对求职者与职位进行精准匹配,以实现自动的人岗匹配推荐.但是,已有方法大多聚焦于非结构化文本信息,仅依据求职者简历文本信息与职位发布文本信息来计算相似度,忽略了结构化数值信息以及历史招聘的经验(即历史成功招聘信息)的重要性,导致推荐的精度不够准确.因此,提出基于协同注意力神经网络的人岗匹配模型(CoAttenFit),通过结构化编码将简历的数值信息进行映射,利用协同注意力生成语义特征、使用图神经网络提取历史招聘特征,最后通过特征融合计算简历与职位的匹配度.提出的方法与当前具有代表性的8个基线方法进行比较,在准确率、精确度、召回率和F1值结果平均值上,比基线分别高出10%~27%、6%~27%、12%~20%、9%~17%.实验结果表明,提出的方法能够有效提高人岗匹配的准确率,从而降低资源和时间消耗.
2025年03期 v.51;No.229 323-331页 [查看摘要][在线阅读][下载 773K] [下载次数:215 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]