文末有礼| 快手技术年度盘点：满载干货，祝您蛇年大吉！

新年初始，万象更新

过去一年，快手技术秉承着创新与突破的精神，不断探索技术的新边界，用科技的力量点亮生活的每一个角落。从大模型到大数据处理，从前端动效到后端架构治理，每一次技术的革新都为我们的用户带来了更加丰富和便捷的体验。

现在，让我们一同回顾那些令人振奋的创新实践，感受技术力量如何塑造我们的世界。

文末还有惊喜福利等待大家领取哦！

（点击文章标题即可阅读原文）

一、创新突破

2024年，AI浪潮奔涌，快手踏浪而行。

快手始终坚定AI战略，将AI作为业务升级的新引擎，持续推动算法创新，不断突破模型能力，发布一系列行业领先的自研大模型，包括语言处理大模型”快意“、视频生成大模型“可灵”、图片生成大模型”可图“、推荐系统大模型”SIM“以及代码生成大模型“Kwaipilot”。

更为重要的是，这些大模型已广泛应用于短视频、直播、商业化等多业务场景，同时孵化了如可灵AI、飞船、AI小快、AI关小芳及Kwaipilot等多个创新应用，极大丰富了用户的互动体验及内容创作能力，并推动了短视频行业的技术进步和发展。

可灵大模型（Kling）是快手自研的视频生成大模型（包含文生视频、图生视频），结合多项自研技术创新，生成的视频不仅运动幅度大且合理，还能模拟物理世界特性，具备强大的概念组合能力和想象力。

可灵AI始终保持着高速迭代升级、效果持续领先，目前已形成App、Web端（中、英文版）、快手站内小程序等多端跨平台产品矩阵。截止2024年12月10日，可灵AI已有超过600万用户，累计生成6500万个视频和超过1.75亿张图片。

详细内容可查看可灵AI2024年终回顾视频。

扩展阅读：

Kwaipilot 应用快手自研的代码生成大模型，提供智能编码助手、智能问答引擎和智能体应用开发平台三大AI研发产品，将大模型能力贯穿研发全生命周期。目前快手全库新增代码AI代码生成率达20%。通过构建代码形式化表征和逻辑推理，实践MoE 架构，在多个 benchmark 达到 SOTA。

近期Kwaipilot团队也开源了Code Embedding模型OASIS，以及 Kwai-Coder-DS-V2-Lite-Base 代码生成模型。

扩展阅读：

快手自研交换机是2021年初开始立项，坚持软件自主可控 / 硬件生态开放的整体战略，历经三年磨砺，发布扛鼎之作『快手自研51.2T交换机』，是首家引入多元化交换芯片并在数据中心网络中规模化部署！更是首家采用国产化交换芯片并规模部署落地！

二、技术共建

人工智能和音视频技术作为驱动数字经济迈向高质量发展的引擎，展现出巨大活力。这一年，快手积极携手全国高校、中国计算机学会及政府部门，深化技术合作与交流。

3月，未来高新视频智能技术创新中心成果汇报会暨创新联合体揭牌仪式在快手举办。7月，中国计算机学会与快手联合发布“CCF-快手大模型探索者基金”。11月，快手与清华大学联合申报的“内容推荐相关技术项目”荣获“钱伟长中文信息处理科学技术奖”一等奖……

2024年3月1日，未来高新视频智能技术创新中心成果汇报会暨创新联合体揭牌仪式在北京快手科技举办。来自北京市科委、中关村管委会、市经信局、海淀区政府的相关领导及高校和科研院所的专家学者与会，共同见证高新视频智能技术的最新成果。

2024年7月6日，中国计算机学会（CCF）联合快手正式发布“CCF-快手大模型探索者基金”并启动申报。CCF和快手希望通过为全球学者搭建产学研合作平台，促进学术界与工业界的深度合作。

‍

在中国中文信息学会2024学术年会上，快手与清华大学联合申报的“内容推荐相关技术项目”，凭借其技术创新性和先进性，荣获“钱伟长中文信息处理科学技术奖”一等奖。

三、技术落地

快手深知，技术的价值不仅体现在于其本身的先进性上，更在于如何精准地将其融入业务实践的每一个环节，从而释放出前所未有的潜力。

在过去的一年里，快手凭借敏锐的洞察力，深入挖掘用户的多元化需求，率先推出快手vp版app。与此同时，快手始终聚焦于行业内的重要与核心技术难题，结合自身丰富实践经验，总结并沉淀了一套系统的解题思路和方法论，并将经验提炼并泛化技术到一般情况，为推动整个行业的进步与发展贡献自己的力量。

6月28日国行版的Vision Pro开售，快手同步推出了快手vp版app，成为国内首批登陆Apple Vision Pro的短视频平台。

基于visionOS操作系统进行了深度的定制化开发，快手vp版app带来了全新的交互体验，其特色功能包含沉浸模式、环绕弹幕、手势3D点赞动效！这样让刷视频乐趣倍增！

针对无状态服务，业界已拥有成熟解决方案，但对于有状态服务（如数据库、Redis）是否适合容器化与K8s托管，仍存在争议。快手探索性地将超大规模的Redis集群迁移至Kubernetes上，通过分层架构设计、动态拓扑感知与服务发现等措施提升资源利用率，进而带来成本优化等收益。

03‍‍

快手 AIP 团队总结了一套超大规模集群下大语言模型训练方案。该方案在超长文本场景下，在不改变模型表现的情况下，训练效率相较 SOTA 开源方案，有显著的吞吐提升。通过细致的建模，可保证 Performance Model 十分接近真实性能，基于此 Performance Model，解决了大模型训练调参困难的问题。

本文深入探讨文生图大模型的行业发展趋势，引导您从零开始构建中文文生图基础大模型的全过程，同时提供一套科学严谨的方法来准确评估此类模型的表现，进一步地，将指导您如何识别并选取ROI最高的文生图大模型应用场景。通过解析快手在文生图大模型领域的实践案例，展现这一前沿技术如何在具体业务中发挥巨大作用，从实战中汲取经验与灵感。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

05‍‍

在大模型浪潮下，快手商业化技术团队围绕商业化B端业务场景，自研了一款集知识管理、团队协作与智能答疑于一体的创新产品——销帮帮智能客服，并在此基础上，进一步沉淀打造了SalesCopilot技术平台。

06‍

早在2020年初，快手系统软件团队开始进行自研技术的探索，凭借对业务场景需求的深刻洞察及技术趋势的精准预判，成功构建了一套独特的“四横四竖”架构的系统软件技术体系，并积累了一系列创新技术与性能优化方法论，这些成果广泛涵盖Java协程、编译器优化、操作系统改进等多个关键领域。

07‍

快手“六自由度-子弹时间视频技术”依托于快手多年的音视频技术积累和迭代，展现出三大独特优势：鲁棒性强、渲染速度快、视觉效果好。正是凭借这些技术优势，该项技术成功打破了地域与领域的壁垒，得以在国际顶级赛事、快手电商生态等多个领域中大放异彩。

四、开源协同

秉持“源于社区，回馈社区”的坚定理念，快手将内部经过大规模实践检验的项目开源，这些项目涵盖了人工智能、大数据等多个领域，项目一经发布，便迅速得到了开源社区的广泛关注和好评。未来，快手继续践行开源精神，积极推动技术迭代与创新，为技术社区带来了更加深远的价值与贡献。

快手开源LivePortrait可控人像视频生成框架，能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上，极速生成肖像动画。效果惊艳，获HuggingFaceCEO点赞，强势登顶排行榜！

在WAIC期间，快手开源文生图大模型可图（Kolors）。可图支持中英文双语，生成效果比肩Midjourney-v6水平，支持长达256字符的文本输入，具备英文和中文写字能力。

2024年6月，快手开源图像生成视频技术I2V-Adapter。I2V-Adapter是基于Stable Diffusion的文生视频扩散模型的轻量级适配模块，该模块能够在不需要改变现有文本到视频生成（T2V）模型原始结构和预训练参数的情况下，将静态图像转换成动态视频。

五、顶会成果

在刚刚过去的2024年，快手在国际顶尖学术会议上大放异彩，于CVPR、SIGGRAPH、KDD、SIGIR、ACL、USENIX ATC等重量级会议及期刊上发表60余篇高质量论文，研究领域广泛，涵盖文生图评估方法、视频质量评估、视频修复增强、3D生成、跨域检索、跨域序列推荐、去噪推荐、文生视频等多个前沿话题。

不仅如此，快手在国际学术竞赛的舞台上也展现出卓越实力，在“NeurIPS 2024 Auto-Bidding in Large-Scale Auctions”竞赛中，与来自全球的1500多支顶尖队伍同场竞技，最终一举斩获双料冠军，尽显强劲实力。此外，快手还积极举办学术竞赛，在CVPR成功举办了短视频质量评价学术竞赛，为推动相关领域的学术交流与发展贡献了重要力量。

在2024年机器学习顶会——NeurIPS 2024的「NeurIPS 2024 Auto-Bidding in Large-Scale Auctions」（大规模拍卖中的自动出价）赛事中，快手商业化算法团队从千余支队伍中脱颖而出，包揽了通用和AIGB（AI-Generated Bidding）两个赛道的第一名，成为本次赛事最大赢家。

2024年3月，智能媒体计算实验室联合快手在第九届NTIRE研讨会上举办首届短视频质量评价学术竞赛。本次挑战赛吸引了共计200多个团队报名，历时3个月，经过开发、测试、最终提交等阶段的激烈角逐，SJTU MMLab、IH-VQA和TVQE三支队伍斩获大赛前三名。

作为计算机视觉领域的三大顶会之一，CVPR的投稿量逐年攀升，官方发文称，今年共提交了11532份有效论文，2719篇论文被接收，录用率为23.6%。创历史新高！其中，快手8篇论文入选CVPR2024，涵盖文生图评估方法、视频质量评估、视频修复增强、3D生成、跨域检索等多个方向，欢迎大家共同交流讨论。

国际计算语言学年会是由国际计算语言学协会主办的学术盛会，每年举办一次。作为计算语言学和自然语言处理领域最具影响力的会议之一，快手凭借其在人工智能领域的深厚积累，成功入选四篇论文。这些研究涵盖了快手独立自研的快意大语言模型在多轮对话、复杂推理、RLHF等领域的深入探索与最新进展，以及MoE在搜索技术上的创新应用。

六、技术交流

2024年，快手积极参与CNCC、ISSTA、CVPR等众多学术顶尖会议，以及WAIC、QCon、AICon等一系列行业盛会。在这些平台上，快手不仅展示了最新技术实践，还分享了深刻的行业洞察，通过这一系列的交流与互动，持续促进产学研合作，推动行业共同创新、发展与繁荣。

作为中国计算机领域级别最高、规模最大的学术盛会，2024中国计算机大会在浙江横店举行。此次大会以“发展新质生产力，计算引领未来”为主题，万余名专家学者、企业技术精英齐聚，探索分享计算领域理论、技术和产业前沿问题，展示中国学术界、企业界最新成果。

在大会上，快手代表先后出席大会“AI+影视创作”、“大模型与超级智能的演进路径”等超级论坛和第三届CCF产学合作发展论坛，并举办2024年度CCF-快手大模型探索者基金开题交流会，持续探索AI技术助力行业发展、产业升级的新路径。

在维也纳举办第33届软件测试与分析国际研讨会（ISSTA）上，快手在会议期间举办一系列学术交流活动，这一活动汇聚了软件工程领域的众多顶尖专家、学者，共同聚焦探讨大模型技术如何为软件工程领域注入新活力，开辟新的发展机遇。在晚宴活动上，快手技术副总裁陈彬、快手代码大模型团队Kwaipilot 的负责人张皓天也先后致辞、分享快手在软件工程领域的研究成果和应用。

在2024年西雅图举办的CVPR会议上，快手惊艳亮相，向全球与会者隆重展示了自研视频生成大模型可灵、图像生成大模型可图以及快手在视频处理与编码领域的最新研究成果。此外，快手举办了CVPR 2024 群星闪耀精英晚宴，与世界各地的学术精英展开交流与探讨，共同擘画科技改变世界的宏伟蓝图。

7月WAIC期间，快手大模型首次集中亮相，全方位呈现快手大模型矩阵全景、基座模型技术创新、应用概况与落地情况等。快手同时邀请学术界、产业界和投资界的知名学者、专家，共同探讨视频生成技术带来的机遇。

在AICon 上海站上，快手作为大会的内容共创伙伴，与众多开发者共同交流探讨大模型应用中的关键技术创新以及产品落地实践中的经验与心得。快手“大模型家族”集中亮相，快手Kwaipilot团队专家也在现场为参会人员面对面解读基于 MoE 架构的 Kwaipilot 预训练代码自研大模型背后的奥义。

技术的发展永无止境，而快手技术将继续携手前行，以用户需求为导向，以创新为动力，不断拓宽技术的边界，为用户带来更多惊喜。

在新的一年里，我们将继续与您同行，分享快手技术的最新动态，探讨科技的未来趋势。让我们携手并进，共同期待快手技术在新的一年里绽放更加耀眼的光芒。

福利时刻

快手技术「春节限定红包皮肤」全新上线！

祝大家蛇年吉祥如意，好运连连！

限量5000个

2025年1月15日17:30起

点击下方红包即可领取，先到先得！

END