此篇文章发布距今已超过1天,您需要注意文章的内容或图片是否可用!
最近,谷歌发布Gemma4 12B模型,让人眼前一亮!而且,它是一个多模态全能Agent,支持理解图片、音频、视频文件。本地跑Gemma4 12B,最简单方法之一,使用ollama并且上下文可以达到262K,很不错,也为本地长对话能力提供支撑。按照开发文档,16G内存就可以跑,比如Mac电脑M1,到M5都可以跑。5090单卡,从提问到看到首Token(也就是TTFT),20轮下来,平均2.33秒:平均每秒钟输出107.7 tokens,录制了一个GIF,感受下推理速度:这对 12B级别,Ollama 本地推理来说,107.7 tokens/s,已经属于很流畅的水平。因此不管从TTFT,而且每秒tokens速度,都是不错的。首先安装DeepLocals,获取地址:https://deeplocals.com/downloadDeepLocals支持本地大模型的丝滑接入,配置为:Gemma4:12b配置后,直接就可以在本地对我们的文件,如论文,合同,文书,做本地检索增强问题,更懂我们的AI如下图所示,DeepLocals会从左侧学习到的海量本地文件中,检索到了10个知识片段:这个总结Gemini-3.1-Pro给出了95分的高分:Gemma4:12B是一个统一的多模态模型,无视觉编码器,显存使用更好。接下来测试它的图片理解能力如何,如下点击箭头所示,上传本地文件:上面总结发给Gemini3.1-Pro,它给出了98分:发送这样一张图片给Gemma4:12B,看看它的多模态能力:这个测试证明了,它能看懂学术论文里最难搞的复杂数据对比。本篇实测下来,感觉Gemma4 12B 这次确实把本地 AI 的体验拉到了一个新高度。12B 这个体量,刚好卡在 16G 内存的舒适区。最实在的是,原生的多模态让它真能帮你干脏活累活。就算拔了网线,那些晦涩的英文 PDF 和复杂的实验折线图,它也能给你扒得明明白白。对于咱们这种看重数据隐私,又想在本地白嫖一个“全能助理”的人来说,没啥好纠结的,直接折腾起来就对了。全文1290字,29图,如果你觉得这篇文章对你有帮助,也欢迎给我一个三连击:点赞、转发和在看;如果可以,再帮我点一个⭐️。谢谢你看到这里,我们下篇再见。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
周飒博客-ZhouSa.com
还没有评论,来说两句吧...