→阶跃星辰发布首个开源能在手机上落地的端侧Agent12月17日,阶跃星辰升级发布了全新的AI Agent系列模型Step-GUI,包括云端模型Step-GUI、首个面向GUI Agent的MCP协议,以及业内首个支持手机部署的开源端侧模型Step-GUI Edge。Step-GUI目前已经可以在淘宝、微博、抖音、小红书、闲鱼等超过200个APP场景中执行任务。业内人士认为,GUI底层模型技术的爆发将加速终端设备的Agent化趋势,2026年或将成为重塑终端入口体验及市场格局的关键窗口期。→Oceanpayment推出AI Agent支付方案近日,Oceanpayment正式推出AI Agent Payment Solution,面向AI Agent与对话式商业场景,提供安全、合规的支付能力,帮助商户更好地连接AI驱动的交易入口,实现无缝交易体验。该方案是一套面向AI Agent场景的支付解决方案。支持AI助手在对话或自动化流程中发起支付请求,并由Oceanpayment提供统一的支付处理、风控与合规保障,实现多场景下的无缝交易体验。→前OpenAI研究员姚顺雨加入腾讯 任首席AI科学家12月17日,腾讯宣布升级大模型研发架构,新设AI Infra部、AI Data部、数据计算平台部,前OpenAI研究员姚顺雨(Vinces Yao)出任“CEO/总裁办公室”首席AI科学家,直接向总裁刘炽平汇报,并兼任AI Infra部及大语言模型部负责人。姚顺雨2024年加入OpenAI,曾主导AI Agent与任务执行系统研发。此次架构升级中,AI Infra部聚焦分布式训练与高性能推理,AI Data部负责数据及评测体系,数据计算平台部推进大数据与机器学习融合,三大部门将共同支撑腾讯大模型算法研发与场景落地。12月18日,字节跳动旗下火山引擎举办FORCE原动力大会,火山引擎总裁谭待宣布豆包助手API正式登陆火山方舟平台,首批开放日常沟通、联网搜索等核心能力,并同步推出“AI节省计划”,企业用量越大折扣越高,最高可削减47%调用成本。→OpenAI推出全新版本的ChatGPT Images图像生成工具OpenAI最新宣布推出全新版本的ChatGPT Images图像生成工具。据OpenAI官网指出,新版ChatGPT Images采用了GPT Image 1.5模型 ,与GPT Image 1模型相比,影像输入与输出成本降低了20%,生成速度最高提升至4倍。 此外,今次ChatGPT也会提供专门的Images空间,有数十种预设的滤镜与提示,还会定期更新热门范例。12月17日,爱诗科技与阿里云在北京阿里朝阳科技园正式签署全面合作协议,双方将在人工智能基础设施及大模型服务领域展开深度合作。根据协议,阿里云将为爱诗科技提供涵盖计算、存储、网络及大模型平台在内的全栈AI技术支持,全面支撑其自研视频生成大模型PixVerse的训练与推理任务。→亚马逊与OpenAI洽谈电商合作 ChatGPT拟变购物中心12月17日报道援引知情人士透露,美国电商巨头亚马逊与人工智能公司OpenAI就电商合作展开谈判。OpenAI计划将ChatGPT升级为购物中心,通过向零售商导流抽取佣金,并同步向亚马逊推销企业版ChatGPT,目前谈判仍在进行,具体条款可能调整。知情人士称,双方尚未确定合作是否涉及ChatGPT功能嵌入,或仅支持亚马逊自研AI购物工具;若亚马逊参与融资,将推动OpenAI启动更大规模筹资。12月17日,苹果公司开源名为SHARP的新型AI模型,可将单张2D照片在一秒内转换为逼真的3D场景。该技术基于3D高斯泼溅原理,利用神经网络预测3D高斯球的位置与外观,实现快速建模。相比传统方法速度提升三个数量级,并在LPIPS和DISTS指标上表现更优,支持真实相机移动模拟。目前模型已发布于GitHub,侧重邻近视角重建,不生成遮挡区域,有望推动移动端3D内容与空间计算发展。12月18日,OpenAI宣布开发者可向ChatGPT平台上传自研应用程序。此举允许开发者将定制化应用集成至ChatGPT生态系统,提升功能扩展性与用户体验。该功能面向全球开发者开放,旨在丰富ChatGPT的应用场景并推动AI技术的协同创新。具体审核机制与上线流程已同步发布。
12月17日,亚马逊宣布,负责通用人工智能(AGI)业务的高管普拉萨德(Rohit Prasad)将于年底离职。亚马逊首席执行官贾西(Andy Jassy)已任命公司云业务高级副总裁、任职 27年的资深员工德桑蒂斯(Peter DeSantis)接管重组后的人工智能部门。该部门将整合亚马逊的通用人工智能、定制芯片研发以及量子计算团队。贾西称,公司之所以对人工智能团队进行重组,是因为认为相关技术发展已迎来拐点。
12月18日,谷歌宣布推出Gemini3 Flash,进一步扩展其Gemini3模型系列。该新模型在性能与效率之间实现更好平衡,旨在满足高并发、低延迟的AI应用需求。此次发布由谷歌在其官方渠道公布,标志着其在生成式AI领域的持续布局。Gemini3 Flash将面向全球开发者和企业用户开放,用于文本生成、代码编写等多场景任务。
12月18日,荷兰人工智能基础设施供应商Nebius宣布推出Nebius AI Cloud 3.1版本。该平台将集成下一代英伟达Blackwell Ultra计算技术,并提升运营能力,旨在为用户提供更高效的全栈人工智能云计算服务。此次升级有助于加速大规模AI模型训练与推理,满足日益增长的算力需求。
12月17日,Cloudflare与京东云宣布达成合作,旨在加速全球开发者在AI推理方面的部署与扩展。此次合作将在北京及全球范围内展开,双方将整合技术资源,提升云计算与网络服务能力。通过京东云的基础设施与Cloudflare的全球网络,开发者可更高效地运行AI推理任务,降低延迟并提升性能。合作原因在于应对日益增长的AI应用需求,帮助开发者实现快速扩展。此举将推动全球AI生态发展,为各类企业提供更敏捷的解决方案。12月17日,宁德时代宣布其全球首条实现人形具身智能机器人规模化落地的新能源动力电池PACK生产线在中州基地正式投运。由千寻智能研发的人形机器人“小墨”已能精准完成电池接插件插接等复杂作业,替代传统依赖人工的EOL与DCR最终测试工序。该机器人搭载端到端视觉-语言-动作模型,具备高柔性、高精度操作能力,插接成功率超99%,单日工作量达人工三倍。此举标志着具身智能在智能制造领域实现关键突破,推动电池生产向更高安全、效率与一致性迈进。
→MiniMax和智谱AI,均于本周初获得了中国证监会备案MiniMax和智谱AI,均于本周初获得了中国证监会备案,并参与了港交所的上市聆讯。12月17日,腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部及数据计算平台部,以强化大模型研发体系与核心技术能力。此次调整旨在整合资源,提升AI基础设施与数据处理效能。Vincent Yao出任CEO/总裁办公室首席AI科学家,向总裁刘炽平汇报;同时兼任AI Infra部与大语言模型部负责人,向技术工程事业群总裁卢山汇报,推动技术研发与战略落地。
12月18日,字节跳动旗下AI编程工具TRAE CN企业版正式发布。该产品在字节内部有超92%工程师使用,个人版注册用户已突破600万。字节内部实践显示,TRAE在抖音生活服务团队AI代码贡献率超43%。针对企业的性能要求、部署适配、效能追踪,以及代码安全的四大挑战,TRAE CN 企业版进行了全面优化:支持10万文件、1.5亿行代码的容量;实现了从知识库到Agent的全场景业务适配;支持实时效能追踪管理,以及全链路代码加密传输。云端零存储,保障企业安全合规。
《科创板日报》记者了解到,豆包大模型正与润欣科技、老凤祥联合开发AI眼镜,价格约在2000元以内,预计明年初上市。该AI眼镜由火山引擎提供RTC实时音视频和豆包大模型,润欣科技提供模组和硬件程序设计。
12月18日,在FORCE原动力大会上,火山引擎发布豆包大模型1.8、豆包视频生成模型Seedance 1.5 pro。经过一年多的持续升级,豆包大模型家族在多模态理解和生成能力、Agent能力上,已位于全球第一梯队。
截至今年12月,豆包大模型日均Tokens使用量已突破50万亿,居中国第一、全球第三。目前,已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿。
→微软或将与Kimi进行Agent级合作,实现Office产品自动化据财联社报道,在本月初微软Azure宣布接入Kimi k2模型后,双方合作有望下探至应用层。微软或将在本月与Kimi合作上线新的Agent功能,以应对本土厂商的激烈竞争。据了解,该合作将利用AI的Agent能力,实现Office产品的自动化。记者就此向微软及Kimi方面求证,截至发稿,双方未予回应。12月17日,商汤科技推出面向电商运营的如影营销智能体,集成店铺运营、直播运营、流量投放、直播场控四大Agent及数字人主播,形成“五大智能体矩阵”。该方案覆盖电商运营全链路,大幅提升效率:店铺运营任务耗时从半天缩短至10分钟,直播复盘由2小时减至20分钟,流量投放监测提效5倍,直播场控实现自动化,数字人可复刻真人直播间。此次发布旨在推动电商智能化升级。智探AI应用交流群,有兴趣的朋友请添加群主:cosmic-walker 备注:公司+姓名+职务+AI入群。
还没有评论,来说两句吧...