本地大模型后续.调研了几天得到这个结果

前几天在站里问了友们,这几天调研了一些厂家,给的方案都是L20 * 4 部署方案,本人对显卡不是很了解,如果要H20的话就只能8卡起售,现在是买不到卡吗?为什么看到网上评论测评都是A100 800的,这些国内的去哪里要 :rofl:
还有就是L20 卡咋样。
前几天的帖子
本地搭建大模型

11 个赞

紧俏商品的购买路子在各国都是要仔细研究一下的

数据中心用的 H20 是长这样的,8 张 H20 合一的整体产品

数据中心级的 N 卡就是紧俏商品,订单远远超过生产能力的

基本给配的都是L20

就不能分开卖是吧 :rofl:

1 个赞

现在我们是L20 * 2,实测跑32b的r1满血,是20t/s左右, 70b跑不起满血,q4的话是30t/s,你参考下

1 个赞

70b跑的q4吗

都是8卡整机卖的,所以基本不会拆开单卖
整机卖方案利润率会比单卡更高,有溢价空间

单台8卡整机也是百万级别的报价了 :rofl:

是啊,太贵了,公司没预算,买低配卡又担心推理慢

如果不是保密数据,预算低拉api最好。:laughing:
有保密需求只能本地部署

没预算建议早降低预期
不然并发量高了token数太低也是没法用的

就是有数据安全问题才要的本地部署,我个人感觉API比自己搭建好多了。企业价值就在数据,没办法

预算少,效果肯定不如预期。
让老板加钱

对的,跑AWQ GPTQ那些

公司买确实麻烦些,主要还是考虑财务制度也没法用大船的tesla这些

这个预算得够。一般小公司没法搞

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。