-
Notifications
You must be signed in to change notification settings - Fork 1k
Open
Description
模型
- 最新模型接入 P0
- 多模态padding_free/packing支持更多模型
- 混合数据训练支持更多多模态模型
- agent template支持更多模型
训练
- RAY支持 P0
a. DPO
b. GRPO
c. PPO - embedding/reranker/序列分类支持
a. ✅padding_free
b. packing P0 - ✅ulysses & ring attention混合使用支持
- ✅embedding & reranker 数据集格式重构
- ms-swift目录结构重构; template与model_type解耦重构 P0
Megatron-SWIFT
- 新模型支持 P0
- ✅blockwise FP8 P0
- ✅MTP支持 P0
- 多模态支持 ViT部分TP/CP性能优化
- ✅GRPO P0
- RLHF支持:✅Reward Model;✅KTO;GKD;MPO
- 更多训练类型支持:✅序列分类;Embedding;Reranker
- Deepspeed/fsdp2集成
- ✅权重转换优化(mcore-bridge):多机转换;GRPO兼容;去除显式转换步骤;支持LoRA直接导出 P0
- 存储:按epoch保存; save_total_limit; 异步存储支持 P0
- ✅VPP与异构PP
- megatron infer/deploy/eval模块支持
RL
- GRPO
a. ✅权重同步优化(LoRA/MoE)P0
b. ✅训练显存优化
c. ✅CHORD
d. training-inference mismatch (TIS/MIS/FP32 lm_head ...) - ✅RLOO P0
- ✅Reinforce++ P0
- ✅KTO padding_free & packing支持
- liger_kernel显存优化
- ✅GKD 支持 vLLM / offload
推理部署
- ✅reranker推理部署支持
- sglang支持多模态模型
- vllm/sglang支持分类模型/RM
量化
- 量化支持更多类型模型:embedding/reranker/多分类等
- GPTQ/AWQ升级; ✅GPTQ-v2
ms-swift3.6-3.8 Roadmap: #4561
hjh0119, 651961, firefighter-eric and summoneryhl
Metadata
Metadata
Assignees
Labels
No labels