山野大叔

文章/答案/技术大牛

发布

LV1

发表了文章 1小时前2026-06-10 15:56:51

硬核实战：2.15 倍推理提速！揭秘 LLM 小批量解码的隐形致命坑

在LLM部署中，小批量连续解码（Batch Decode）是线上服务、对话场景最主流的形态。长期以来，业内有一个普遍看法：

山野大叔 1小时前2026-06-10 15:56:51

LLM、自动推理、gpu、大模型部署

发表了文章 1天前2026-06-09 12:00:34

Sentinel：让 AI 不再"装完工"的宪法自进化架构

过去 18 个月，所有"AI coding agent"——从 Copilot Workspace 到 Cursor 到 Devin——都共享一个致命 bug：

山野大叔 1天前2026-06-09 12:00:34

agent、腾讯技术创作特训营S18、sentinel

关注了用户 2天前2026-06-08 02:39:40

AI智享空间

拥有多年互联网企业技术总监经验，深耕技术实践与管理。已出版十余本专业著作，专注前沿技术落地。

181 文章14 回答57 关注者

关注了用户 2天前2026-06-08 02:39:39

一只牛博

484 文章6 回答57 关注者

关注了用户 2天前2026-06-08 02:39:37

qife122

2.6K 文章0 回答47 关注者

关注了用户 2天前2026-06-08 02:39:35

meme猫

14 文章0 回答209 关注者

关注了用户 2天前2026-06-08 02:39:34

叶一一

苍生涂涂，天下缭燎，诸子百家，唯我纵横。

249 文章0 回答60 关注者

关注了用户 2天前2026-06-08 02:39:31

小宇-xiaoyu

b站同名哦~

41 文章3 回答335 关注者

关注了用户 2天前2026-06-08 02:39:30

芦笛
中国互联网络信息中心｜工程师 (已认证)

中国互联网络信息中心（CNNIC）创新业务所应用服务部工程师、公共互联网反网络钓鱼工作组秘书处研究员

1.6K 文章0 回答28 关注者

关注了用户 2天前2026-06-08 02:39:29

岳涛
腾讯云TDP ｜官方产研 (已认证)

所有失去的，都会以另一种方式，回到你身边。

112 文章0 回答4.4K 关注者

关注了用户 2天前2026-06-08 02:39:28

jack.yang

资深AI系统工程师 | 大数据与大模型实战者，近3年专注大模型（LLM）工程化落地。

1.6K 文章2 回答113 关注者

关注了用户 2天前2026-06-08 02:39:27

未闻花名

深耕青少年心理和医疗大健康领域，融合AI大模型的本地化应用，对大模型有深度的应用经验和使用体验。

231 文章0 回答91 关注者

发表了文章 5天前2026-06-05 16:35:26

WorkBuddy 智能体成本控制与架构实践

在开发「语义显微镜 V3.0」和「brainproto 类脑原型」两个项目的过程中，验证了一个结论：

山野大叔 5天前2026-06-05 16:35:26

LLM、腾讯云智能体开发平台、WorkBuddy、腾讯云Token Plan、腾讯技术创作特训营S18

发表了文章 5天前2026-06-05 10:08:44

CubeAttn｜一篇推翻线性注意力评测惯例的「反常识」发现：U 型失效、种子陷阱与瓶颈定位

大模型的核心瓶颈之一是注意力机制的显存开销——标准 Transformer 要算一个 $L \times L$ 的大矩阵，序列越长越爆炸。

山野大叔 4天前2026-06-06 07:53:50

卷积神经网络、线性回归、huggingface-transformers、腾讯技术创作特训营S18、腾讯云Token Plan

发表了文章 8天前2026-06-02 12:03:17

31%：LLM 修 Bug 的真正天花板？

我们耗时多轮迭代，持续优化 LLM 自动修 Bug 流水线，从数据喂入、评分机制、Bug 分类到任务调度，完成了全链路架构优化。所有前置工程问题悉数解决，流水线...

山野大叔 8天前2026-06-02 12:03:17

coding、LLM、bug

关注了用户 2021-05-292021-05-29 18:04:02

小傅哥

小傅哥 | 沉淀、分享、成长，让自己和他人都能有所收获！

486 文章1 回答272 关注者

个人简介

FINTECH | Chief Exp. of AI APP&Eng
AI Native Builder
AIGC
暂未填写学校和专业
暂未填写个人网址
北京
加入社区时间：2021-05-29

个人成就

获得 3 次赞同
文章被阅读 354 次

关注了：11关注者：3

山野大叔

硬核实战：2.15 倍推理提速！揭秘 LLM 小批量解码的隐形致命坑

Sentinel：让 AI 不再"装完工"的宪法自进化架构

AI智享空间

一只牛博

qife122

meme猫

叶一一

小宇-xiaoyu

芦笛
中国互联网络信息中心｜工程师 (已认证)

岳涛
腾讯云TDP ｜官方产研 (已认证)

jack.yang

未闻花名

WorkBuddy 智能体成本控制与架构实践

CubeAttn｜一篇推翻线性注意力评测惯例的「反常识」发现：U 型失效、种子陷阱与瓶颈定位

31%：LLM 修 Bug 的真正天花板？

小傅哥

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

山野大叔

硬核实战：2.15 倍推理提速！揭秘 LLM 小批量解码的隐形致命坑

Sentinel：让 AI 不再"装完工"的宪法自进化架构

AI智享空间

一只牛博

qife122

meme猫

叶一一

小宇-xiaoyu

芦笛中国互联网络信息中心 ｜ 工程师 (已认证)

岳涛腾讯云TDP ｜ 官方产研 (已认证)

jack.yang

未闻花名

WorkBuddy 智能体成本控制与架构实践

CubeAttn｜一篇推翻线性注意力评测惯例的「反常识」发现：U 型失效、种子陷阱与瓶颈定位

31%：LLM 修 Bug 的真正天花板？

小傅哥

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

芦笛
中国互联网络信息中心｜工程师 (已认证)

岳涛
腾讯云TDP ｜官方产研 (已认证)