Commit Graph

18 Commits

Author SHA1 Message Date
songsenand e8eab1f260 refactor(generate_pinyin): 优化拼音生成逻辑,利用 pypinyin 分词能力处理多音字 2026-05-09 13:36:48 +08:00
songsenand 8b41bcdc6f feat(dataset): 引入幂律平滑方案优化频率调整逻辑 2026-04-30 08:10:34 +08:00
songsenand 4ded2d656f feat(analyze_frequency): 添加拼音字符频率分析脚本 2026-04-22 22:05:15 +08:00
songsenand 1b7da9ddd4 feat: 添加束搜索演示脚本及ONNX模型文件忽略规则 2026-04-20 11:49:25 +08:00
songsenand 710cfe7fc2 fix(dataset, trainer): 调整数据集和训练参数以提高模型效果 2026-04-16 22:35:59 +08:00
songsenand bb78e0afa0 feat(pinyin): 添加拼音LSTM编码器以支持多字符预测的逐步确认评估 2026-04-11 22:58:56 +08:00
songsenand 68a6fc3533 feat(eval): 添加按槽位数量评估文本的功能 2026-04-11 20:28:31 +08:00
songsenand 1cdef19153 fix(tokenizer): 移除异常处理,直接加载指定tokenizer 2026-04-11 07:32:05 +08:00
songsenand 6ad003133c fix(dataset): 添加异常捕获防止标签生成失败 2026-04-06 06:05:12 +08:00
songsenand c0489e538c feat(docs): 添加基于JSON旁路记录法的移动端监控方案文档 2026-04-05 19:38:30 +08:00
songsenand f838ec9b22 docs: 更新 README 中代码示例和训练说明 2026-04-05 10:29:23 +08:00
songsenand 69349a88a6 feat(train): 添加训练脚本并重构模型输入处理逻辑 2026-04-05 00:08:29 +08:00
songsenand 1af85a36bc feat: 更新输入法模型架构设计文档并重构核心组件代码 2026-04-03 17:04:35 +08:00
songsenand fd49058764 feat(dataset): 添加四段式文本编码方法并优化拼音处理逻辑 2026-04-03 08:19:43 +08:00
songsenand 74416bfcb1 feat(model): 优化数据集处理逻辑,增加频率调整功能 2026-04-02 21:30:03 +08:00
songsenand 14c835dd72 chore: 删除旧的拼音字符统计文件 2026-04-02 00:44:16 +08:00
songsenand 9c8574cf11 feat(resign_stat): 添加拼音统计文件修改工具,支持键值转换与终止符插入 2026-03-30 22:53:24 +08:00
songsenand 4bcbbaa4eb feat(pinyin): 添加中文拼音字符统计文件以优化模型输入处理 2026-03-30 00:16:16 +08:00