Commit Graph

44 Commits

Author SHA1 Message Date
songsenand 8b41bcdc6f feat(dataset): 引入幂律平滑方案优化频率调整逻辑 2026-04-30 08:10:34 +08:00
songsenand 4ded2d656f feat(analyze_frequency): 添加拼音字符频率分析脚本 2026-04-22 22:05:15 +08:00
songsenand 1b7da9ddd4 feat: 添加束搜索演示脚本及ONNX模型文件忽略规则 2026-04-20 11:49:25 +08:00
songsenand 710cfe7fc2 fix(dataset, trainer): 调整数据集和训练参数以提高模型效果 2026-04-16 22:35:59 +08:00
songsenand 3175ace9c5 docs: 移除模型扩容两阶段训练文档并更新相关用法说明 2026-04-13 14:09:14 +08:00
songsenand 33f56f709b docs: 删除 README.md.bak 文件 2026-04-12 12:13:36 +08:00
songsenand bb78e0afa0 feat(pinyin): 添加拼音LSTM编码器以支持多字符预测的逐步确认评估 2026-04-11 22:58:56 +08:00
songsenand 68a6fc3533 feat(eval): 添加按槽位数量评估文本的功能 2026-04-11 20:28:31 +08:00
songsenand 0fea985b45 feat(checkpoint): 优化 checkpoint 保存策略,保留最后3个epoch并节省磁盘空间 2026-04-11 13:19:49 +08:00
songsenand 1cdef19153 fix(tokenizer): 移除异常处理,直接加载指定tokenizer 2026-04-11 07:32:05 +08:00
songsenand a0e4d25b2f feat(eval): 添加模型评估脚本,支持文本分析与概率分布检测 2026-04-11 00:21:08 +08:00
songsenand 919d0972e2 fix(trainer): 优化检查点保存逻辑避免重复写入和进度条重置问题 2026-04-09 22:46:05 +08:00
songsenand 569eeb4d12 删除了临时交换文件,清理项目残留文件 2026-04-09 22:39:31 +08:00
songsenand 526cfc8477 fix(model): 处理无有效槽位时的池化计算逻辑 2026-04-09 22:11:50 +08:00
songsenand e1efcc75a8 feat(base.html): 优化页面样式与结构,提升移动端兼容性 2026-04-09 08:01:55 +08:00
songsenand d5daba182a docs: 将Streamlit替换为Flask以支持移动端监控界面 2026-04-08 18:25:29 +08:00
songsenand 7ac44a2731 refactor(trainer): 优化两阶段训练器代码结构和注释格式 2026-04-08 06:37:47 +08:00
songsenand 5dda0e6f85 feat(BigExpert): 添加 torch.compile 支持并优化编译参数 2026-04-08 00:21:15 +08:00
songsenand c9a96651cd feat: 添加模型扩容两阶段训练功能,支持冻结层训练与全量微调切换 2026-04-07 14:46:50 +08:00
songsenand d14fd09f41 feat(reverse_proxy): 添加 Apache 和 Nginx 反向代理配置支持 WebSocket 和 CORS 2026-04-07 08:01:01 +08:00
songsenand 3da8ae8876 feat(docs): 添加HTTP静态文件服务与远程监控说明 2026-04-06 22:53:15 +08:00
songsenand 2f0166c8ce feat: 添加模型权重检查与推理调试工具脚本 2026-04-06 12:29:22 +08:00
songsenand a203e67aff fix(trainer): 修正总训练步数计算逻辑以支持多轮训练 2026-04-06 06:12:58 +08:00
songsenand 6ad003133c fix(dataset): 添加异常捕获防止标签生成失败 2026-04-06 06:05:12 +08:00
songsenand 493bfdec1a refactor(MoELayer): 并行化前向传播以兼容 torch.compile 和 AMP 2026-04-05 23:19:11 +08:00
songsenand 7143896f4d fix: 启用 TensorFloat32 加速矩阵乘法并解决 UserWarning 2026-04-05 22:16:48 +08:00
songsenand 59bb29e4fd feat(benchmark): 添加性能基准测试脚本用于诊断模型训练瓶颈 2026-04-05 22:06:36 +08:00
songsenand c0489e538c feat(docs): 添加基于JSON旁路记录法的移动端监控方案文档 2026-04-05 19:38:30 +08:00
songsenand c31ec3990f fix(trainer): 添加键盘中断处理以保存训练进度 2026-04-05 10:38:14 +08:00
songsenand f838ec9b22 docs: 更新 README 中代码示例和训练说明 2026-04-05 10:29:23 +08:00
songsenand 310a926c98 refactor(trainer): 优化检查点保存逻辑以支持定期覆盖保存 2026-04-05 07:54:16 +08:00
songsenand 3e529d805f fix(trainer): 调整模型保存频率以避免频繁写盘 2026-04-05 01:35:53 +08:00
songsenand 369424be28 feat(trainer): 添加GPU可用性日志并调整pinyin_ids处理逻辑 2026-04-05 00:58:51 +08:00
songsenand b3055656d1 fix(trainer): 检测GPU可用性并提示用户退回CPU训练 2026-04-05 00:32:12 +08:00
songsenand 69349a88a6 feat(train): 添加训练脚本并重构模型输入处理逻辑 2026-04-05 00:08:29 +08:00
songsenand 1af85a36bc feat: 更新输入法模型架构设计文档并重构核心组件代码 2026-04-03 17:04:35 +08:00
songsenand fd49058764 feat(dataset): 添加四段式文本编码方法并优化拼音处理逻辑 2026-04-03 08:19:43 +08:00
songsenand 74416bfcb1 feat(model): 优化数据集处理逻辑,增加频率调整功能 2026-04-02 21:30:03 +08:00
songsenand 14c835dd72 chore: 删除旧的拼音字符统计文件 2026-04-02 00:44:16 +08:00
songsenand 9c8574cf11 feat(resign_stat): 添加拼音统计文件修改工具,支持键值转换与终止符插入 2026-03-30 22:53:24 +08:00
songsenand 4bcbbaa4eb feat(pinyin): 添加中文拼音字符统计文件以优化模型输入处理 2026-03-30 00:16:16 +08:00
songsenand 917d5976a9 feat(model): 添加 fit 方法支持模型训练流程 2026-03-24 00:38:02 +08:00
songsenand 1d2ae677f9 移除独立文本编码器,改用预训练编码器并调整相关参数 2026-03-23 16:32:11 +08:00
songsenand b6a677f15d feat: 添加输入法引擎模型设计与实现,包含架构、核心模块及训练策略 2026-03-23 16:30:38 +08:00