造大模型避免追求“宏大叙事”、功效全能
“行业有个共识,2023年是大模型之年,‘百模大战’解决了模型从无到有(的问题),实现了从0到1的过程。2024年不要‘卷’模型了,要看应用,最重要的场景就是‘安全’。”周鸿祎在会上指出,大模型做起来容易,做好却很难。
他提到,当前一个基本事实是,很多同行用一些安全知识训练开源大模型,使其功能类似于“百科问答”,这种做法无法打造出真正的安全大模型,“就像汽车副驾驶坐了一个教练为你提供指引,但是他并不能帮你开车。这类大模型的实际效果目前都限于宣传,离实用还是有距离。”
据周鸿祎分析,打造真正的安全大模型面临三方面难点。
一是缺乏开发互联网大模型、大数据的经验,不具备搜索、自然语言处理等方面的技术。二是缺乏海量、高质量的安全知识,知识密度、知识准确度越高,大模型效果越好,“数据不等于知识,数据需经过提炼才能变成知识。”三是与安全业务深度融合,不能让大模型的作用类似于聊天机器人、“副驾驶”等,成为“玩具”或“助理”,只有与安全业务深度融合才能实现效能提升。
“最开始我们也很兴奋,以为大模型无所不能,什么都能干。”周鸿祎表示,360此前接了上百个项目,其中70%都失败了,从中才意识到大模型开发方面存在的几个误区。
一方面,打造大模型不能脱离具体应用场景,过于追求“宏大叙事”,追求大模型功效全能都是错误观念,它不可能解决所有问题。另一方面,大模型并不能取代企业原本的IT系统、数字化系统。他将大模型比作大脑,有“嘴巴”和“耳朵”,原本的IT系统相当于“手”和“脚”。
此外,大模型也无法让企业实现“弯道超车”,跳过数字化阶段。倘若一个企业缺少数字化积累的过程,不可能打造出真正的大模型。他还认为,提示词是目前中国用户、企业用户使用人工智能最大的障碍,不应“迷信”提示词的效果。
基于这些误区,周鸿祎总结了一套“简单方法论”。其中包括,企业应改变思路,不追求打造全能大模型,而是选择一个垂直场景、细分切口;OpenAI的做法只是大模型发展的一种方向,企业打造大模型不应迷信“大参数”,有上百万、几十万的资金就可以开始打造自己的大模型。他表示,目前国内的模型能力虽然与GPT-4还有差距,但也足够好用了。
或为带动安全业务增长实施免费策略?
“我一直说把大模型拉下‘神坛’,把‘免费’贯彻到底。”会上,周鸿祎宣布360安全大模型正式免费,这也是国内首个免费安全大模型。“我们不希望大模型成为少数厂商掌握在手里奇货可居的赚钱利器,如果每个企业用得起专业的大模型,我们非常强烈地支持开源。”
南都记者梳理发现,大模型降价甚至免费的趋势自今年上半年起便有端倪。
5月,抖音、阿里云等宣布大模型降价,百度、腾讯云、科大讯飞等宣布部分模型免费,厂商之间打起了“价格战”。在国外,OpenAI推出GPT-4o时的策略是支持公众免费试用,对开发者的收费降低一半。7月亮相的GPT-4o mini较于GPT-3.5,价格要便宜六成以上。
在上述国内各大厂的官方回应中,技术能力和应用生态建设需求是降价的关键因素。多位业内专家曾就此谈到,降低价格有利于加速AI应用的爆发。对于实力强劲的头部企业而言,价格战有利于在竞争中占据优势地位,实现规模效益;与此同时,一些大模型创业公司的商业化模式可能被颠覆,生存空间被压缩。
周鸿祎还表示,360安全产品已全面集成安全大模型的能力,对所有购买360标准产品的用户免费提供大模型标准能力,产品加量不加价;对已经购买产品的用户,可以免费升级安全大模型。如此看来,大模型免费策略施行的原因,或许与通过大模型服务带动原有产品及业务增长有关。
值得一提的是,周鸿祎针对360的广告问题也作出回应。他表示,360为支撑国家级网络安全事业等付出了巨大的资金和人力成本,也因此形成了至今比较奇葩的商业模式,即利用互联网广告的收入补贴安全业务,“这里我也特别感谢广大的用户支持,你们为国家在看广告。”
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...