本地大模型后续.调研了几天得到这个结果

xiao1932794922 · 2025 年3 月 4 日 09:50

前几天在站里问了友们,这几天调研了一些厂家,给的方案都是L20 * 4 部署方案,本人对显卡不是很了解,如果要H20的话就只能8卡起售，现在是买不到卡吗？为什么看到网上评论测评都是A100 800的，这些国内的去哪里要
还有就是L20 卡咋样。
前几天的帖子
本地搭建大模型

wangxiaoer · 2025 年3 月 4 日 09:52

紧俏商品的购买路子在各国都是要仔细研究一下的

yqyan · 2025 年3 月 4 日 09:55

数据中心用的 H20 是长这样的，8 张 H20 合一的整体产品

数据中心级的 N 卡就是紧俏商品，订单远远超过生产能力的

xiao1932794922 · 2025 年3 月 4 日 09:56

基本给配的都是L20

xiao1932794922 · 2025 年3 月 4 日 09:57

就不能分开卖是吧

Timmy_0 · 2025 年3 月 4 日 09:57

现在我们是L20 * 2，实测跑32b的r1满血，是20t/s左右， 70b跑不起满血，q4的话是30t/s，你参考下

xiao1932794922 · 2025 年3 月 4 日 23:59

70b跑的q4吗

JayXuZ · 2025 年3 月 5 日 00:08

都是8卡整机卖的，所以基本不会拆开单卖
整机卖方案利润率会比单卡更高，有溢价空间

单台8卡整机也是百万级别的报价了

xiao1932794922 · 2025 年3 月 5 日 00:09

是啊，太贵了，公司没预算，买低配卡又担心推理慢

preacher · 2025 年3 月 5 日 00:13

如果不是保密数据，预算低拉api最好。
有保密需求只能本地部署

JayXuZ · 2025 年3 月 5 日 00:18

没预算建议早降低预期
不然并发量高了token数太低也是没法用的

xiao1932794922 · 2025 年3 月 5 日 00:27

就是有数据安全问题才要的本地部署，我个人感觉API比自己搭建好多了。企业价值就在数据，没办法

preacher · 2025 年3 月 5 日 00:36

预算少，效果肯定不如预期。
让老板加钱

Timmy_0 · 2025 年3 月 5 日 01:03

对的，跑AWQ GPTQ那些

abelwang · 2025 年3 月 5 日 02:15

公司买确实麻烦些，主要还是考虑财务制度也没法用大船的tesla这些

ukyozhou · 2025 年3 月 5 日 02:16

这个预算得够。一般小公司没法搞

system · 2025 年4 月 4 日 02:17

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

话题		回复	浏览量
买API还是自组炼丹炉？搞七捻三人工智能 , 快问快答	19	764	2025 年3 月 12 日
公司预算20-50w，有佬知道可以部署什么本地部署大模型？搞七捻三快问快答 , 纯水	31	909	2025 年3 月 30 日
老板要求弄个AI让员工使用开发调优人工智能	78	2492	2025 年4 月 6 日
公司给我搞了个4张4090的服务器有什么模型可以考验一下新干部呢资源荟萃人工智能	46	1988	2024 年9 月 9 日
本地部署开源模型排行求助开发调优人工智能 , 快问快答	29	687	2025 年12 月 11 日