2026年6月个人开发者霸榜抱抱脸Top2,推荐必看

  • 时间:
  • 浏览:82
  • 来源:南宁市武鸣区陆酷巴网络科技工作室

个人开发者凭什么挤进Top榜单

2026年6月, 抱抱脸模型排行榜上出现了反常状况, 在智谱GLM - 5.2、百度、NVIDIA等众多大厂机构的模型当中, 一个个人开发者账号“逯雨鑫”的模型显著地跻身前排, 其下载量居高不下, 甚至有一段时间还胜过GLM - 5.2占据榜首。智谱AI负责人在X(原Twitter)上公开推荐了这个模型, 进而引发社区热烈讨论。

这位处于当下在美国某所高校钻研AI方向硕士学位的开发者, 依靠其自身的力量, 于仅仅一周的时间以内, 使得自身的模型在抱抱脸占据榜首位置, 下载数量总计超过70万次。他向量子位表明,这并非借助运气, 而是依据一套严密的技术方法论以及大量的数据处理工作。

Fable 5与Gemma 4的巧妙融合

逯雨鑫这次发布了两个新模型。其核心思路是把Fable 5的编程推理能力“蒸馏”进一个能够在本地运行的Gemma 4 - 12B小模型里。教师数据主要源自Cursor的Composer 2.5, 还辅以Fable 5。Composer 2.5做错的题目, 会交给Fable 5再次进行推理, 从而生成新的思维链跟正确代码。

模型卡呈现出这样的情况, 训练数据有着被称作“可验证”的代码推理形式, 具体表现为, 跟每条思维链相对应的代码, 都一定要在真实的环境里实现跑过测试这一行为, 并且在真正经过测试、得以通过之后方能够保留下来。就是因为存在这种对数据质量进行严格把控的情况, 才确保了哪怕是小模型依然能够输出可靠的推理结果。

V2版本来临:本地Agent的突破

V2版本将agentic能力予以引入, 增添了多步工具调用功能。用户能够把它当作本地Agent来使用, 自行达成“阅读-推理-动手-验证”的闭环操作。在tau2-bench的telecom子集中, 基座Gemma-4-12B的得分仅仅是15%, 但V2版模型的得分却高达55%, 性能提高了约3.5倍。

只不过作者也承认, 这是在本地自行测试、于单一领域之内、针对20个任务运行而得出的相对数值, 是不能够直接同官方榜单开展比较的东西, 并且和前沿的大模型之间仍然存在着不小的差距情况。然而这样的一个结果已然致使不少的开发者察觉到了在本地运行具有强大能力的Agent的可能性所在。

数据处理:最耗时的核心工程

逯雨鑫讲道, 整个进程最为耗费时间的并不是训练, 而是数据处理, 特别是agentic数据, 真实的对话常常甚长, 一个任务也许会有十几步, 关联到几千乃至上万个token, 他运用类似“滑动窗口”的办法, 把最近一次用户的消息当作锚点, 将上下文裁剪至预算范围之内。

他又提及, Fable 5随后被下线了, 仅他自身的数据集留存了Fable 5最初的推理过程。社区贡献数据里缺失的部分推理, 被他用Claude Opus 4.8(xhigh)重新去生成, 一条条给补上了。尽管重建的轨迹或许和原版存在差异, 但这是那时唯一可行的办法。

本地运行:推动实际应用的关键

llama.cpp生态里常见的本地模型格式是GGUF格式, llama.cpp、Ollama、LM Studio、Jan等工具能直接加载此格式, 这一具备能够直接加载的特性, 对于那些和涉及私有项目以及处在本地环境当中的关于编程、代码审查、命令执行与调试那样的各种场景而言, 极具极大的吸引力。

有个叫逯雨鑫也算过这样的情况, 要是把模型量化到大概3bit左右的程度, 那么好多配置8GB统一内存的Mac用户是能够运行该模型的, 并且还能够留出一定的上下文窗口。他又觉得好多人也就是仅仅想要利用AI来整理文件, 还有进行处理各种数据, 以及去制作PPT, 或者是体验一下agent, 并非必定愿意每个月为Claude、GPT来支付费用。

未来方向与个人开发者的机遇

被称作逯雨鑫的这个人表明, 他自己未曾料想到此次之后训练所获得的提升幅度会如此之大, 后续将会持续予以推进。那V2这一版本在tau2-bench telecom方面呈现出一种“过度进行尝试、反复实施retry”的状况, 而V3则打算凭借更多的训练去加以改进。他总计在HF上公布了9个公开的模型,除开两个成为爆款的之外, 还曾做过“直接去蒸Claude”的模型。

就个人开发者来讲, 那人的经历表明: 那大厂虽有着更多研究者以及更强的算力, 可个人开发者没有那些包袱, 反倒能够更专心地去解决一个特定痛点。逯雨鑫觉得, 这恰是开源作者的机会所在之处: 不用去做全能模型, 而是把一个足够特定的问题做得好用。要是你也想体验这款本地模型, 能够访问 www.fc-bowuguan.cn 获取更多信息。

你是否愿意放弃每月订阅费,改用本地模型处理编程和Agent任务?欢迎在评论区分享你的看法。

猜你喜欢

2026年6月必看Top1:AI时空漫游Vlog推荐

如果你还没看过Chloe的「AI时空漫游」系列,那你可能正在错过2026年最令人上瘾的视觉体验。2400万人,看她「死」在泰坦尼克号上标题是:《我穿越到了1912年的泰坦尼克号》。从今年3月开始,Chloe密集输出了超过多个时空漫游Vlog。公元前30000年,冰河时期。

2026-06-29

2026年6月最强推荐:5款AI编程助手深度评价与排名

CLI、Windsurf全支持,总之市面上你能想到的AI编程助手它全接上了。Code,建议带上—chrome让它能直接操控浏览器:AI会先对目标网站做一次全面体检。这里所有数值都是用getComputedStyle()从浏览器里拿到的真实计算值。

2026-06-29

2026年6月:2028年RSI自进化,AI疯狂迭代引惊叹

2028年RSI自进化一旦造出来,它就能不断自我升级,越变越强,没有上限。更狠的是,它达到这个成绩,比对手少烧了1.35到1.72倍的token。Clark押下重注:60%的概率,2028年底前,AI将能亲手缔造出更强大的自己。曾将「哥德尔机」死死困住20年的那道高墙,名为「证明」。

2026-06-29

2026年6月个人开发者霸榜抱抱脸Top2,推荐必看

这是普通的一天,我也普通地刷着抱抱脸的Trending榜。甚至在此前一周,这位个人开发者的模型一度霸榜抱抱脸,力压GLM-5.2一头,连智谱负责人都在X上公开推荐:V1发布后,曾连续多日霸榜抱抱脸Trending榜榜首。当问及他对其他个人开发者有什么建议时,逯雨鑫说:真诚和坚持最重要

2026-06-29

2026年6月15-25万SUV推荐榜:零跑C16等国产车优缺点大PK

15万到25万这个区间,以前你只能买到CR-V、RAV4这类合资紧凑型SUV,而现在国产SUV已经卷到了一种不讲道理的程度,甚至连千伏平台,兆瓦闪充都能给你安排上。零跑的打法一直很简单——用越级的配置打价格差, C系列的三款SUV都取得了不错的市场反响,你觉得它们的销量还能更进一步吗?

2026-06-29