人気の記事一覧

論文紹介 part9 :"The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities"を読む

ABCI上でDeepSpeedを使ったLLMの学習を実行するまで

Megatron-DeepSpeedからHFのTransformersにチェックポイントを変換する

1年前

日本マイクロソフトで DeepSpeed ミートアップを開催、その機能や活用法とは(2024/06/14、ニュースリリース)

大規模言語モデル(Llama2など)を正攻法でファインチューニングする際のメモ(ZeRO-Offload, not QLoRA)

Google Colab で DeepSpeed によるLLMのフルパラメータの指示チューニングを試す

2年前

メモリをスワッピングしながら大規模言語モデル(LLama2)をフルパラメータでファインチューニングできるかどうか?

DeepSpeedの使い方をまとめてみた

DeepSpeed-ChatがAI業界を革新、効率向上とコスト削減を促進し、アプリケーションの展開を加速

DeepSpeed Chat by Docker

2年前

DeepSpeed training

2年前

スケーラブルで効率的なFine-Tuning of LLM on Azure ML

DeepSpeed-chat + gpt model がdropout 未定義エラーになる件

2年前