songsenand
|
88955bcfdd
|
refactor(model): 优化slot权重计算逻辑以提升稳定性
|
2026-05-23 13:42:44 +08:00 |
songsenand
|
53f244de2f
|
docs: 详细描述history_slot_ids的设计策略与使用场景
|
2026-05-23 13:25:32 +08:00 |
songsenand
|
71ef54e3d4
|
fix(trainer): 使用固定最大序列长度的collate函数以避免内存问题
|
2026-05-15 14:47:31 +08:00 |
songsenand
|
722912f296
|
feat(data-preprocess): 预处理数据预打乱以提升训练效率
|
2026-05-15 13:49:41 +08:00 |
songsenand
|
0862b5b8fc
|
fix(PreProcessedDataset): 修复数据类型转换,避免内存复制
|
2026-05-11 22:05:05 +08:00 |
songsenand
|
27beb7f0b1
|
refactor(trainer): 优化进度条逻辑与训练循环结构
|
2026-05-11 00:14:17 +08:00 |
songsenand
|
d0f1534086
|
fix(dataset): 修复分片数据集时未正确计算样本数的问题
|
2026-05-10 23:34:08 +08:00 |
songsenand
|
483e4d4f98
|
fix(model): 移除 torch.compile 的注释和未使用配置
|
2026-05-10 10:38:14 +08:00 |
songsenand
|
432132a108
|
feat(MoELayer): 添加 moe_mode 支持稀疏和图内计算策略
|
2026-05-10 10:26:44 +08:00 |
songsenand
|
e8eab1f260
|
refactor(generate_pinyin): 优化拼音生成逻辑,利用 pypinyin 分词能力处理多音字
|
2026-05-09 13:36:48 +08:00 |
songsenand
|
8b41bcdc6f
|
feat(dataset): 引入幂律平滑方案优化频率调整逻辑
|
2026-04-30 08:10:34 +08:00 |
songsenand
|
4ded2d656f
|
feat(analyze_frequency): 添加拼音字符频率分析脚本
|
2026-04-22 22:05:15 +08:00 |
songsenand
|
1b7da9ddd4
|
feat: 添加束搜索演示脚本及ONNX模型文件忽略规则
|
2026-04-20 11:49:25 +08:00 |
songsenand
|
710cfe7fc2
|
fix(dataset, trainer): 调整数据集和训练参数以提高模型效果
|
2026-04-16 22:35:59 +08:00 |
songsenand
|
3175ace9c5
|
docs: 移除模型扩容两阶段训练文档并更新相关用法说明
|
2026-04-13 14:09:14 +08:00 |
songsenand
|
33f56f709b
|
docs: 删除 README.md.bak 文件
|
2026-04-12 12:13:36 +08:00 |
songsenand
|
bb78e0afa0
|
feat(pinyin): 添加拼音LSTM编码器以支持多字符预测的逐步确认评估
|
2026-04-11 22:58:56 +08:00 |
songsenand
|
68a6fc3533
|
feat(eval): 添加按槽位数量评估文本的功能
|
2026-04-11 20:28:31 +08:00 |
songsenand
|
0fea985b45
|
feat(checkpoint): 优化 checkpoint 保存策略,保留最后3个epoch并节省磁盘空间
|
2026-04-11 13:19:49 +08:00 |
songsenand
|
1cdef19153
|
fix(tokenizer): 移除异常处理,直接加载指定tokenizer
|
2026-04-11 07:32:05 +08:00 |
songsenand
|
a0e4d25b2f
|
feat(eval): 添加模型评估脚本,支持文本分析与概率分布检测
|
2026-04-11 00:21:08 +08:00 |
songsenand
|
919d0972e2
|
fix(trainer): 优化检查点保存逻辑避免重复写入和进度条重置问题
|
2026-04-09 22:46:05 +08:00 |
songsenand
|
569eeb4d12
|
删除了临时交换文件,清理项目残留文件
|
2026-04-09 22:39:31 +08:00 |
songsenand
|
8b0beeb56c
|
chore: 移除冗余代码行以提高可读性
|
2026-04-09 22:19:56 +08:00 |
songsenand
|
526cfc8477
|
fix(model): 处理无有效槽位时的池化计算逻辑
|
2026-04-09 22:11:50 +08:00 |
songsenand
|
05e440bcfe
|
test.py+8
|
2026-04-09 17:49:23 +08:00 |
songsenand
|
504353e895
|
feat: 添加拼音转ID函数并优化结果排序逻辑
|
2026-04-09 17:28:52 +08:00 |
songsenand
|
6ee28e0aa5
|
feat: 实现并行化 MoE 层以兼容 torch.compile 和 AMP
|
2026-04-09 12:37:34 +08:00 |
songsenand
|
e1efcc75a8
|
feat(base.html): 优化页面样式与结构,提升移动端兼容性
|
2026-04-09 08:01:55 +08:00 |
songsenand
|
d5daba182a
|
docs: 将Streamlit替换为Flask以支持移动端监控界面
|
2026-04-08 18:25:29 +08:00 |
songsenand
|
7ac44a2731
|
refactor(trainer): 优化两阶段训练器代码结构和注释格式
|
2026-04-08 06:37:47 +08:00 |
songsenand
|
5dda0e6f85
|
feat(BigExpert): 添加 torch.compile 支持并优化编译参数
|
2026-04-08 00:21:15 +08:00 |
songsenand
|
813dce2224
|
删除 uv.lock 文件以清理依赖锁定信息
|
2026-04-07 23:09:29 +08:00 |
songsenand
|
c9a96651cd
|
feat: 添加模型扩容两阶段训练功能,支持冻结层训练与全量微调切换
|
2026-04-07 14:46:50 +08:00 |
songsenand
|
d14fd09f41
|
feat(reverse_proxy): 添加 Apache 和 Nginx 反向代理配置支持 WebSocket 和 CORS
|
2026-04-07 08:01:01 +08:00 |
songsenand
|
3da8ae8876
|
feat(docs): 添加HTTP静态文件服务与远程监控说明
|
2026-04-06 22:53:15 +08:00 |
songsenand
|
2f0166c8ce
|
feat: 添加模型权重检查与推理调试工具脚本
|
2026-04-06 12:29:22 +08:00 |
songsenand
|
a203e67aff
|
fix(trainer): 修正总训练步数计算逻辑以支持多轮训练
|
2026-04-06 06:12:58 +08:00 |
songsenand
|
6ad003133c
|
fix(dataset): 添加异常捕获防止标签生成失败
|
2026-04-06 06:05:12 +08:00 |
songsenand
|
493bfdec1a
|
refactor(MoELayer): 并行化前向传播以兼容 torch.compile 和 AMP
|
2026-04-05 23:19:11 +08:00 |
songsenand
|
7143896f4d
|
fix: 启用 TensorFloat32 加速矩阵乘法并解决 UserWarning
|
2026-04-05 22:16:48 +08:00 |
songsenand
|
59bb29e4fd
|
feat(benchmark): 添加性能基准测试脚本用于诊断模型训练瓶颈
|
2026-04-05 22:06:36 +08:00 |
songsenand
|
c0489e538c
|
feat(docs): 添加基于JSON旁路记录法的移动端监控方案文档
|
2026-04-05 19:38:30 +08:00 |
songsenand
|
c31ec3990f
|
fix(trainer): 添加键盘中断处理以保存训练进度
|
2026-04-05 10:38:14 +08:00 |
songsenand
|
f838ec9b22
|
docs: 更新 README 中代码示例和训练说明
|
2026-04-05 10:29:23 +08:00 |
songsenand
|
1e9f1e8bd6
|
fix(dependency): 降级 torch 版本要求至 2.10.0
|
2026-04-05 08:08:03 +08:00 |
songsenand
|
310a926c98
|
refactor(trainer): 优化检查点保存逻辑以支持定期覆盖保存
|
2026-04-05 07:54:16 +08:00 |
songsenand
|
3e529d805f
|
fix(trainer): 调整模型保存频率以避免频繁写盘
|
2026-04-05 01:35:53 +08:00 |
songsenand
|
369424be28
|
feat(trainer): 添加GPU可用性日志并调整pinyin_ids处理逻辑
|
2026-04-05 00:58:51 +08:00 |
songsenand
|
b3055656d1
|
fix(trainer): 检测GPU可用性并提示用户退回CPU训练
|
2026-04-05 00:32:12 +08:00 |