Shortcuts

训练加速与优化

使用deepspeed训练

重要

deepspeed不支持windows,如果需要请使用wsl2

首先在cfgs/launcher/deepspeed.yaml中指定deepspeed_config.deepspeed_config_file为需要的deepspeed的配置文件。目前提供zero2.jsonzero3.json两种方式,zero3支持offload,更省显存,但会更慢,并且可能需要较大内存。

训练使用的显卡数量通过num_processes配置。

配置之后运行命令开始训练:

hcp_train --launch_cfg cfgs/launcher/deepspeed.yaml --cfg cfgs/train/cfg_file.yaml