來自cohere團隊的新模型。距離上次發佈模型已經好一陣子cohere,終於也放出了新的模型Command-A,比肩 Deepseek-v3 與 OpenAI GPT-4o
官網上表示,2片H100s或A100s就可以搭建(這樣換算下來約111B左右)
PS:感謝 @passerby064857 的hugging face資料
https://cohere.com/blog/command-a
