2024中国网络大会将于11月8日-10日在兼具水乡温婉与江海豪迈的江苏苏州张家港举办。本届大会由CCF主办,CCF网络与数据通信专委会、CCF互联网专委和苏州大学联合承办,主题是“算网融合·数智赋能·发展新质生产力”。
ChinaNet
2024中国网络大会将于11月8日-10日在兼具水乡温婉与江海豪迈的江苏苏州张家港举办。本届大会由CCF主办,CCF网络与数据通信专委会、CCF互联网专委和苏州大学联合承办,主题是“算网融合·数智赋能·发展新质生产力”。
已邀请十余位院士专家组成指导委员会,多位中国科学院院士、中国工程院院士将莅临大会作主旨报告,同时还邀请了百位CCF/ACM/IEEE会士、国家级人才等国内外顶级学者做分享交流,以及来自沙钢、华为、阿里等行业头部企业高管将参会。
https://ccf.org.cn/chinanet2024
2024年CCF AIOps挑战赛(第七届)是智能运维AIOps领域的旗舰赛事,也是CCF互联网专委会的重要年度赛事。本次AIOps挑战赛主题为“基于检索增强(RAG)的运维知识大模型问答挑战赛”, 大会经过激烈的初赛和复赛,从1300+选手,700+队伍中遴选出十强队伍,这些队伍将会在论坛现场分享他们在大模型问答领域的优秀方案并现场评比和颁奖。十强队伍方案答辩后,我们将开展AIOps研讨会,我们邀请了领域资深专家一起探讨AIOps与LLM技术的交汇点,探索如何借助先进的大语言模型提升网络的智能决策力,实现自动化配置与故障自愈。同时,我们将讨论时序大模型(Time-Series Foundation Model)和大模型在日志解析的应用(Log Foundation Model)。最后,我们邀请SIGCOMM和NSDI大模型运维(LLMOps)相关学者,介绍大语言模型训练万卡集群中软硬件及RDMA网络的监控、诊断和优化。
论坛日程
论坛主席及嘉宾介绍
主席
裴昶华
中国科学院计算机网络信息中心副研究员,国科大杭州高等研究院讲席教授
个人简介:裴昶华,中国科学院计算机网络信息中心副研究员,国科大杭州高等研究院讲席教授,中国科学院引进青年人才,从事运维大模型、智能运维,AI for Networking交叉学科研究,相关成果获得MIT Technology Review 和Hacker News报道,论文发表在FSE、WWW, SIGKDD, SIGIR, INFOCOM, CIKM, WSDM, RecSys, IWQoS等国际会议上,Google Scholar引用超3000。获得2023年ISSRE最佳论文奖(通信作者),2019年RecSys最佳论文奖提名。担任ICLR,NeurIPS,SIGKDD,WWW审稿人。担任中国计算机学会2024(第七届)CCF国际AIOps挑战赛程序委员会主席。承担中国科学院“十四五”网信专项智能运管工程建设项目,国家重点研发计划青年科学家项目多模态网络与通信实验验证和平台建设项目。
共同主席
张圣林
南开大学副教授、博士生导师
个人简介:张圣林,南开大学副教授、博士生导师,入选南开大学“百青计划”。主要研究方向为智能运维。在ATC, WWW, VLDB, KDD, ASE, FSE等国际会议和JSAC, TC, TOSEM, TSC等国际期刊发表高水平论文60余篇。主持国家自然科学基金项目2项,横向项目14项(与华为、字节跳动、腾讯等合作)。获中国电子学会科技进步一等奖(第3完成人)、天津市科技进步一等奖、ISSRE 2023/2018最佳学术论文奖、清华大学优秀博士学位论文、华为“最佳技术合作教授”、南开大学“良师益友”、麒麟软件“校企合作突出贡献”奖等荣誉。担任CCF A/B类国际会议程序委员会委员12次。中国计算机学会高级会员,YOCSEF天津AC副主席(2023-2024),互联网专委常委,软件工程专委、服务计算专委执行委员。
嘉宾
王敬宇
北京邮电大学长聘教授
个人简介:王敬宇,北京邮电大学长聘教授,省高层次人才计划,从事算力网络、大模型的交叉学科研究,6GANA TG5主席,主持国家自然科学基金重点类项目,国家973课题等科研与产业化项目20余项,发表ToN、NSDI、ASPLOS等高水平学术论文200余篇,荣获AAAI 2023杰出论文奖,出版学术专著3部,授权发明专利50项,ITU-T、ETSI、TMF等组织参与标准化10余项,牵头发布白皮书3本。主持研发的网络智能化系统规模应用,获国家科技进步奖二等奖1项 ,中国通信学会一等奖2项,全球AITrans、ACM MM、SemEval、MMSys、ICCV挑战赛冠军。
报告题目:大模型赋能网络配置自动生成与故障诊断
摘要:构建网络专属大模型,即支持多模态网络数据的大语言模型,利用其生成式特质,自动生成网络配置命令,赋能自智网络闭环。基于软件定义网络控制平面之上引入知识平面,利用网络外部知识,体现历史规律和因果推理,提升网络决策的智能性。汇报北邮自研的知识定义网络的原型系统,利用知识实现对更多输入形式的理解,并支持顶层意图的向下分解,降低顶层用户表达需求时专业知识要求,增加自修复错误策略的过程,实现自智网络故障自愈恢复。
裴丹
清华大学计算机系长聘副教授、博士生导师
个人简介:裴丹,清华大学计算机系长聘副教授、博士生导师。主要研究方向是基于机器学习的智能运维(AIOps)和网络时间序列智能。在智能运维领域发表了200余篇学术论文和30多项专利授权,Google学术引用过万次。获中国电子学会科技进步一等奖。是CCF国际AIOps挑战赛的创办者和CCF OpenAIOps社区发起人,其中挑战赛已成功举办七届。担任计算机网络领域旗舰期刊IEEE/ACM Transactions on Networking编委,并曾担任IEEE计算机网络领域旗舰会议ICNP 2022的技术程序委员会主席。
报告题目:网络空间中的时间序列智能
摘要:时间序列智能,作为感知、认知真实世界的运行状态状态、并决策的人工智能技术的一部分,是解决AIOps挑战的一项关键基础技术。在AIOps中,时间序列分析具有多任务(预测、异常检测、分类、因果推断等)、多细分模态(一元、多元、图结构、表结构等)的特点,对传统时序机器学习方法带来巨大挑战,导致其在现实中无法即插即用、落地挑战性大。本报告将分享时间序列智能在AIOps领域中的“小模型”和基础模型的近期研究进展和落地应用,并探讨如何训练即插即用、低成本推理的时间序列基础模型,以更好赋能AIOps。
康昱
微软DKI(数据,知识,智能)团队首席研究员,复旦大学计算机科学学院行业硕导,香港中文大学名誉副研究员
个人简介:康昱,微软DKI(数据,知识,智能)团队的首席研究员,复旦大学计算机科学学院的行业硕导,香港中文大学的名誉副研究员。专注于为智能云服务提供数据驱动的智能化技术。将人工智能,大数据和云计算相结合,在云计算运行过程中产生的大数据上应用人工智能技术。在软件工程(SE)领域的顶级会议上发表过多篇论文。曾担任过多个产业和研究项目的负责人,包括国家自然科学基金(NSFC)项目。自2018年加入微软后,参与并领导多个研究项目以提高云服务质量(例如可靠性、性能、软件开发质量)。这些研究技术已经融入了基础云平台服务,支持所有微软在线服务,包括Azure,M365,Teams等。
报告题目:基于大语言模型的大规模云计算系统故障定位
摘要:尽管在自动化故障管理方面取得了进展,但关键和复杂的故障往往难以通过自动化手段解决,仍需要人工干预。DKI Cloud Intelligence/AIOps研究团队多年来始终致力于利用AI技术来增强整个云计算服务质量,提升故障管理效能。大型语言模型(Large Language Model, LLM)在许多自然语言处理任务中展现了强大的能力,作为一个持续发展的趋势,它将重新定义我们的思维和工作方式。近年来,利用LLM帮助云计算日常故障管理。本次报告将首先展示LLM在AIOps场景中的局限性。接着,介绍用来弥补云使用和基础LLM之间差距的创新框架。最后,将详细讲解如何利用LLM增强整个故障管理生命周期,包括故障监测、评估、诊断、分诊和缓解。方法在实际应用中已被证明有效,显著提升了微软在线服务的可靠性。
贺品嘉
香港中文大学(深圳)助理教授,国家级青年人才
个人简介:贺品嘉,香港中文大学(深圳)助理教授,国家级青年人才。博士毕业于香港中文大学,在苏黎世联邦理工学院任职博士后三年。研究方向为智能运维、智能化开发、可信人工智能、软件测试等。近年来在ICSE, FSE, ICLR等顶级会议期刊发表学术论文40余篇。获得ISSRE最有影响力论文奖,IEEE开源软件服务奖。谷歌学术引用超5000次。主导的自动化日志分析开源项目LogPAI在GitHub上被star 4000余次,并被450多个学界业界组织下载6万余次。担任期刊TOSEM的副编辑,也在四大软件工程顶会担任程序委员会成员。
报告题目:基于大语言模型的日志解析
摘要:本次报告主要介绍近期提出的两个日志解析框架。其中,DivLog利用LLM的上下文学习能力,在无需额外模型训练的情况下对日志进行解析。通过选择多样性高的日志样本,生成目标日志模板。尽管DivLog带来了显著的精度提升,频繁调用LLM导致的效率问题仍需解决。为此,进一步提出了LILAC框架。LILAC继承了上下文学习的优势,并通过自适应解析缓存机制,存储并优化LLM生成的日志模板,减少重复查询。同时,LILAC通过分层候选采样算法,确保了高质量的示例选择,并自适应更新缓存,保持解析结果的一致性与稳定性。
张娇
北京邮电大学长聘教授,国家青年人才计划获得者
个人简介:张娇,北京邮电大学教授,国家青年人才计划获得者。2014年获得清华大学博士学位,曾于加州大学伯克利分校联培一年。长期致力于云数据中心网络、网络传输协议研究。在ACM SIGCOMM、USENIX NSDI、ACM EuroSys、IEEE/ACM Trans. On Networking等网络领域重要会议/期刊发表学术论文70余篇,授权国家发明专利30余项。主持国家重点研发计划(青年科学家项目)、装发预研项目、国家自然科学面上/青年基金和华为、字节跳动创新基金等20余项。担任ACM CoNext、IEEE/ACM IWQoS重要网络国际会议分项联合主席及Multimedia、INFOCOM、ICPP等技术委员会委员。获中国计算机学会优秀博士学位论文奖、北京市优秀博士毕业生、首届中国科协青年人才托举工程、中国通信学会技术发明一等奖/特等奖和中国电子学会创新团队奖等荣誉。
报告题目:面向大规模RDMA网络的端网故障管理技术研究
摘要:RDMA网络规模增大导致网络故障非常频繁,给智算业务性能带来严重影响。因此,面向大规模RDMA网络的高效故障定位系统成为保障智算业务性能的关键。然而,现有网络故障定位系统难以适应大规模RDMA网络。本报告将首先介绍大规模RDMA网络故障定位系统的研究意义及挑战;然后展示报告人在RDMA主机内网络瓶颈定位、大规模RDMA网络端到端网络故障定位的研究工作。
钱坤
阿里云高级技术专家
个人简介:钱坤,阿里云高级技术专家,博士毕业于清华大学计算机系。研究领域主要包括高性能智算网络、高性能存储网络和跨集群传输网络中的性能和稳定性优化。负责阿里云智算集群网络的监控和稳定性系统建设。先后在国际顶级会议如 SIGCOMM、OSDI、NSDI等累计发表论文10余篇。
报告题目:大规模训练集群的网络监控和运维
摘要:GPT的巨大成功带来了大模型训练的新兴浪潮。大模型训练需要组织大量GPU进行持续数月的迭代。这样的训练模式为大模型训练集群的稳定性保障带来了很大挑战。此次报告从大模型训练的特征出发,揭示训练过程中训练集群网络面临的特殊稳定性挑战。并结合实际生产过程中的稳定性问题定位经验,介绍阿里云大规模智算集群的网络监控和运维体系。
参会二维码
说明:
本次会议通过CCF会议管理系统缴费,退费遵守《CCF关于会议注册费的退费规定》
团体报名享最低八折优惠
团报二维码
团报表格下载
张家港站(高铁站)到主会场(约15-20分钟)
苏州(高铁站)到主会场(约1小时)
苏南硕放机场到主会场(约45~55分钟)
上海虹桥机场到主会场
公路1小时50分钟;
上海虹桥机场和上海虹桥高铁站在一起,虹桥高铁站有直达张家港高铁站的高铁,约1小时。
上海浦东机场到主会场约2小时28分钟
旅游资源
日程信息实时更新,以大会最终公布为准。
获取更多关于2024 CCF中国网络大会(CCF ChinaNet2024)信息,请登录大会官网:https://ccf.org.cn/chinanet2024
点击“阅读原文”,进入大会官网!
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...