SUInput/src
songsenand cd25349d90 删除旧的 MoE 模型文件 2026-02-15 21:51:17 +08:00
..
suinput 添加损失权重支持并重构部分模块结构 2026-02-15 01:06:52 +08:00
tmp_utils feat: 优化模型输入处理与专家数量,增强训练与推理兼容性 2026-02-14 23:34:27 +08:00
trainer 删除旧的 MoE 模型文件 2026-02-15 21:51:17 +08:00