近日,来自大众点评技术部/搜索与内容智能团队组建的BlackPearl队伍,参加了KDD 2024 OAG-Challenge Cup赛道的、、三道赛题,以较大优势包揽了该赛道全部赛题的冠军。
今年,KDD 2024 OAG-Challenge Cup 的三道赛题,提出的是针对学术数据挖掘领域中的论文同名消歧、论文源头追溯、学术论文检索三个经典难题。团队同学创新性地采用大模型来解决这三个问题,他们基于大模型,提出自反馈增强、嫁接学习等技术,在效果上显著优于其他队伍,在排行榜上均取得较大领先。
在WhoisWho(同名消歧任务)任务中,团队出了基于自反馈增强的迭代式大模型文本聚类方法,该方法构建的大模型文本聚类方案能够有效处理结构化信息并实现端到端直接输出聚类结果。最终以83%的gAUC指标明显超越传统机器学习方案,赢得了赛题冠军。
在PST(论文源头追溯)任务中,团队利用嫁接学习的思想将BERT-Like模型的复杂文本语义匹配能力嫁接到LLM中,提高样本置信度。同时,团队构建了一套基于RAG的自动特征工程链路,缓解了复杂语义文本普通存在的文本多、信息杂、数据脏的问题。在最终评价指标MAP上利用7B单模型效果超出ChatGPT+RAG方案10%。
---------- END ----------
|
|
|
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...