投稿
ログイン
会員登録
DeepSpeed
書いてみる
関連タグ
#LLM (20,284)
#ChatGPT (292,499)
#AI (656,879)
#GPT (6,904)
#Microsoft (10,271)
#ファインチューニング (621)
人気
急上昇
新着
すべての記事
有料の記事
13件
人気の記事一覧
論文紹介 part9 :"The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities"を読む
新明技研
1年前
4
ABCI上でDeepSpeedを使ったLLMの学習を実行するまで
となかい
1年前
2
Megatron-DeepSpeedからHFのTransformersにチェックポイントを変換する
yutohub
1年前
3
日本マイクロソフトで DeepSpeed ミートアップを開催、その機能や活用法とは(2024/06/14、ニュースリリース)
河合一彦
1年前
1
大規模言語モデル(Llama2など)を正攻法でファインチューニングする際のメモ(ZeRO-Offload, not QLoRA)
Kan Hatakeyama
2年前
40
Google Colab で DeepSpeed によるLLMのフルパラメータの指示チューニングを試す
npaka
2年前
32
メモリをスワッピングしながら大規模言語モデル(LLama2)をフルパラメータでファインチューニングできるかどうか?
Kan Hatakeyama
2年前
20
DeepSpeedの使い方をまとめてみた
福田 渉 | 日本テクノトレード CEO
2年前
11
DeepSpeed-ChatがAI業界を革新、効率向上とコスト削減を促進し、アプリケーションの展開を加速
0xpanda alpha lab
2年前
9
DeepSpeed Chat by Docker
Hodaka
2年前
3
DeepSpeed training
Hodaka
2年前
1
スケーラブルで効率的なFine-Tuning of LLM on Azure ML
daka | Microsoft | AI
11か月前
DeepSpeed-chat + gpt model がdropout 未定義エラーになる件
Hodaka
2年前