songsenand
|
7c90633ebc
|
refactor(model): 使用注意力池化替换 span pooling 并支持 token_type_ids
|
2026-02-26 00:48:09 +08:00 |
songsenand
|
019fa2d23d
|
feat(dataset): 优化拼音处理逻辑并增强代码注释
|
2026-02-23 22:40:39 +08:00 |
songsenand
|
8f58917d13
|
调整拼音分组与采样逻辑,优化模型结构及专家路由策略
|
2026-02-21 21:55:55 +08:00 |
songsenand
|
917c9f4256
|
调整数据采样逻辑以提升模型训练效果
|
2026-02-21 00:56:08 +08:00 |
songsenand
|
e91f823d65
|
feat: 优化模型输入处理与专家数量,增强训练与推理兼容性
|
2026-02-14 23:34:27 +08:00 |
songsenand
|
d2d65c7efa
|
调整导入顺序并修复pickle保存逻辑
|
2026-02-14 15:26:53 +08:00 |
songsenand
|
c3c6f69532
|
feat: 优化数据加载器配置并新增模型评估与预测功能
|
2026-02-13 00:57:21 +08:00 |