恭
贺
新
禧
快手技术团队
新年伊始,万象更新
快手技术团队总结了快手在过去一年令人振奋的技术干货,期待龙年到来之际与您共同回顾,也为新的一年注入创新和进步的力量!
竞赛获奖
01
SL200芯片荣获“匠心产品奖”
伴随各行业视频化转型,4k超高清在短视频、长视频、广电、高质量监控等领域的应用越来越广泛。SL200芯片采用了快手多项自主创新技术,对4K/8K超高清视频进行了针对性的优化,实现了业界领先的清晰度和流畅度,并达到极高的编解码密度。凭借行业领先的视频处理性能与智能视频处理技术,历经层层评选环节,快手智能视频处理芯片StreamLake-200(后文简称“SL200芯片”)荣获“匠心产品奖”。
同年,由莫斯科国立大学举办的MSU2022世界编码器大赛硬件编码器成绩全部揭晓。快手StreamLake首款自研智能视频处理芯片StreamLake - 200(后文简称SL200芯片)夺得4K和1080P赛道24项指标中的16项第一!
02
快手获SSI-Challenge和PLC-Challenge双料世界冠军
在国际声学、语音与信号处理顶会联合微软发起的2024语音信号质量增强挑战赛(SSI-Challenge)上,快手音视频团队荣获SSI-Challenge两个赛道冠军,在基于P.804标准的降噪、混响、频谱染色、响度、音质修复等多个子项的主观评价均显著领先其他参赛队伍。
技术共建
01
清华快手联合提出首个持久性内存参数服务器系统
PetPS 是业界首个支持持久性内存的参数服务器系统,实现了面向工业级搜推广模型的嵌入向量存储与查找,目前已部署于快手推荐业务,为行业内首次在推荐系统中应用实践 PM 技术,成功应对了每日超百亿次视频推荐的访问压力。根据我们内部的成本分析,与 DRAM 参数服务器相比,PetPS 可以在不影响服务性能的同时,降低约 30% 的机器成本 (TCO)。
02
快手未来媒体智能联合实验室成立
4 月 22 日上午,快手与高瓴人工智能学院联合成立的中国人民大学 - 快手未来媒体智能联合实验室启动了签约仪式,中国人民大学 - 快手未来媒体智能联合实验室将围绕多模态大模型、AIGC、数字人和搜推广等主题展开全面探索。契合国家重大战略的发展需求,面向未来进行技术布局和联合研发,继往开来再创新的辉煌。
技术落地
01
快手联合阿里云,应对百万级秒杀的弹性调度
为了解决大促秒杀尖峰时刻的资源不足问题,快手建立了弹性容器云能力。通过使用弹性容器云,快手可以在大促秒杀期间快速扩展容器实例,以应对突然增加的流量和请求。当流量和请求减少时,弹性容器云又可以自动收缩容器实例,以节省资源成本。这种弹性伸缩能力可以帮助快手更好地应对业务的突发变化,提高系统的可靠性和可用性。
02
虚拟+现实智能试戴助珠宝零售企业实现数智化转型
为提升用户试戴体验,“星坊智链”数智化运营综合系统中接入了StreamLake AR虚拟试戴SDK,研发推出的三维仿真展示与交互系统,构建了虚实结合的交互场景,优化了用户购物体验,助力珠宝零售企业提升业绩。查看试戴效果
03
业内首次!快手直播盛夏巅峰之夜应用全链路4K+HDR直播技术
2023快手直播盛夏巅峰之夜在上海举行,在4小时的直播中,快手首次采用了全链路4K+HDR直播技术,实现了从清晰度到光影色彩的全面提升,为观众呈现了一场极致的视觉盛宴,这也是该项技术在业内大型直播活动中的首次应用。
04
白盒化架构优化项目,成本节约数亿元
快手内部白盒化项目通过拆开服务架构、看清内部合理性,实现业务领域架构和系统架构的进一步优化。2023年,通过白盒化的方式驱动业务成本节约数亿元,同时在稳定性、研发效率、可扩展性、用户体验和质量等多维度取得收益。基于相关沉淀,资源预算制定得以用白盒化方式开展,整个过程更加高效合理。
05
快手GPU虚拟化和混部项目
GPU为CPU之外的第二大计算资源,利用率提升将带来巨大的资源成本节约。基于此,快手系统软件和容器云、服务器团队一起从0到1建设了快手的GPU虚拟化和混部技术,并在短时间内获得突破。补齐了离混部、显存避让等关键能力上的缺失,同时在业内首创同一资源池内多类型资源动态转化。目前落地规模、性能、稳定性、维护效率综合达到国内一梯队水平。
06
视频质量分KVQ上线,每日模型被调用数亿余次
2023年3月,KVQ-V5正式全量上线。每日模型被调用数亿余次,服务于点播/直播全链路环节,并为算法/策略提供清晰度优化方向。KVQ现已成为音视频核心指标之一,其性能在多个测试场景已超过人眼水准,并落地多个知名互联网企业。
07
快手智能云乌兰察布数据中心正式投运
为积极响应国家“东数西算”战略号召,23年7月快手智能云乌兰察布数据中心举行剪彩仪式。该项目是快手首个自建超大规模互联网数据中心,由快手研发线技术团队自主研发并独立完成整体概念设计,将成为国内最大的专为人工智能和大数据建设的数据中心,这标志着快手在人工智能基础设施领域迈出了关键一步,也是快手发展历程的重要节点。
技术交流
01
快手虚拟演播助手(KVS)亮相英特尔处理器新品分享会
2月8日,在英特尔中国全新第13代酷睿™移动处理器新品分享会上,快手虚拟演播助手(Kuaishou Virtual Studio,以下称为KVS)精彩亮相。现场展示了英特尔中国与KVS的合作视频,内容以快手官方虚拟主播关小芳在直播各场景中的互动、“带货”为核心,呈现虚拟人创作开发能力,展现了酷睿HX旗舰产品的高效性能。
02
NVIDIA GTC 2023 |快手展示数字人直播等多项前沿技术和解决方案
在NVIDIA GTC 2023大会上,来自快手的多位技术专家展示了一系列前沿技术及解决方案:涵盖了从视频画质提升、数字人直播及互动解决方案,到定制性能优化新框架、针对大型推荐模型的性能优化,以及多模态超大模型在短视频场景落地等多个话题。
03
NVIDIA GTC 2023 |多模态超大模型在快手短视频场景下的落地
在NVIDIA GTC 2023 大会上,快手的技术专家张胜卓、韩青长、李杰以多模态超大模型在快手短视频场景下的落地为例,分享了多模态超大模型落地过程中的难点、技术解决方案和性能收益。快手多模态超大模型,采用的是类 T5 的 Encoder + 多 Decoder 架构,通过 Encoder 接受图像、文本多模态语料,学习特征提取能力;通过 Decoder 输出上下文 Embedding 向量,为下游任务提供用户特征信息。
04
快手音视频亮相LiveVideoStackCon
3月底,快手音视频亮相LiveVideoStackCon,展示了一站式音视频+AI解决方案。活动现场,StreamLake举办了品牌专场。快手音视频技术团队进行了主题演讲,结合行业发展最新动态,聚焦极致体验,分享了在媒体处理、媒体传输协议、播放器等方向的最新进展与落地应用。
05
快手亮相全国信息检索学术会议CCIR 2023,举办学术论坛分享业界成果
由中国中文信息学会主办,信息检索专委会、清华大学承办的第二十九届全国信息检索学术会议(CCIR 2023)在北京成功举办,快手赞助本届大会并联合举办“短视频推荐算法前沿技术研究”学术论坛,与到会100多位专家学者、研究生同学们分享交流了短视频领域推荐技术前沿发展与趋势,得到与会者的积极参与和热烈讨论。
06
数字人、编码硬件、AIGC 快手亮相第二届全球数字贸易博览会
第二届全球数字贸易博览会11月份在杭州国际博览中心开幕。本届数贸会首次在国家一类展会中推出了”丝路电商“馆,作为参展的平台企业之一,快手带着自己的数字人、AIGC产品,以及视频云品牌StreamLake的硬件与技术,落座本次数贸会的“丝路电商”展馆。
顶会成果
论文成果
SPRING FESTIVAL
在过去的2023年,快手在 AAAI、ACM、ACM KDD等国际顶会上表现抢眼,交付20余篇顶会论文,涉及强化学习优化长期奖励、观看时长离散化、文本视频匹配、文本图像检索、文生视频、跨模态学习、图像生成、图像超分、图像分割、个性化网络、超长序列建模、时长预估、生成流网络、长期用户交互、图对比学习等话题
01
UNEX-RL:在多阶段推荐系统中通过单向执行强化长期奖励
| 论文简介:近年来,人们对利用强化学习(RL)来优化推荐系统中的长期奖励越来越感兴趣。由于工业推荐系统通常被设计为多阶段系统(粗排/精排/重排等),单个智能体的强化学习方法在同时优化多个阶段时面临巨大挑战。不同的阶段有不同的观察空间,因此不能用单个agent来建模。基于此我们提出了一个新的基于单向执行的多智能体强化学习(UNEX-RL)框架,来更好的优化多阶段推荐系统中的用户长期奖励。与单智能体RL算法相比,使用UNEX-RL进行实验取得了用户在线使用时长提升0.558%的显著收益,突出UNEX-RL在工业推荐系统中的有效性。
02
CREAD:视频推荐系统中基于分类-修复框架和误差自适应离散化的观看时长预测
| 论文简介:在视频推荐系统中,观看时长是用户满意度的重要指标。然而,将观看时间作为目标变量的预测往往受到其高度不平衡分布的阻碍,比如样本不均衡问题,对于较大的目标值,样本量很少,对于较小的值,样本过多。为了应对这一挑战,我们提出了一种 Classification-Restoration framework with Error-Adaptive-Discretization(CREAD)的框架。CREAD框架包括三个模块:离散化、分类和恢复。通过充分的理论研究及离线评估,目前该框架已在在线视频平台快手应用程序上应用,通过A/B测试,用户的视频观看时长显著增加了0.29%。这些结果突出了CREAD框架在视频推荐系统中观看时长预测的有效性。
03
FashionERN: 一种用于电商融合检索的增强-过滤模型
| 论文简介:电商场景下的融合检索旨在根据输入的商品参考图像和来自用户的修改文本共同检索目标图像。现有针对融合检索的研究多使用在大规模非电商数据集上预训练的对称编码器(例如CLIP)。易出现“视觉主导”的现象,基于此本文提出了一种面向电商场景的增强-过滤融合检索模型,通过增强文本语义以及过滤视觉语义来缓解“视觉主导”的现象。“主导率”指标取得了明显优化,能更精准、全面地满足用户的修改需求。实验结果表明,本文方法在4个常用数据集上均达到了领域最佳水平。
SPRING FESTIVAL
SPRING FESTIVAL
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...