前几天在站里问了友们,这几天调研了一些厂家,给的方案都是L20 * 4 部署方案,本人对显卡不是很了解,如果要H20的话就只能8卡起售,现在是买不到卡吗?为什么看到网上评论测评都是A100 800的,这些国内的去哪里要 ![]()
还有就是L20 卡咋样。
前几天的帖子
本地搭建大模型
11 个赞
紧俏商品的购买路子在各国都是要仔细研究一下的
基本给配的都是L20
就不能分开卖是吧 ![]()
1 个赞
70b跑的q4吗
都是8卡整机卖的,所以基本不会拆开单卖
整机卖方案利润率会比单卡更高,有溢价空间
单台8卡整机也是百万级别的报价了 ![]()
是啊,太贵了,公司没预算,买低配卡又担心推理慢
如果不是保密数据,预算低拉api最好。![]()
有保密需求只能本地部署
没预算建议早降低预期
不然并发量高了token数太低也是没法用的
就是有数据安全问题才要的本地部署,我个人感觉API比自己搭建好多了。企业价值就在数据,没办法
预算少,效果肯定不如预期。
让老板加钱
对的,跑AWQ GPTQ那些
公司买确实麻烦些,主要还是考虑财务制度也没法用大船的tesla这些
这个预算得够。一般小公司没法搞
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

