|
|
f6660518b7
|
feat: 增强堆叠模型管道,添加配置管理、日志记录和性能监控
重构主要管道代码,实现更完善的架构设计:
- 添加统一配置管理系统,支持数据、模型、训练和可视化参数的集中管理
- 实现完整的日志记录系统,支持文件和控制台输出,提供结构化的运行日志
- 集成性能监控工具,包括执行时间、内存使用情况的实时跟踪和分析
- 新增模型检查点功能,支持模型和评估结果的自动保存与加载
- 添加数据验证器,确保数据完整性和预测结果的正确性
- 实现模型工厂模式,便于扩展和管理不同类型的机器学习模型
- 优化异常处理机制,提供专门的异常类型分类
- 更新依赖项,添加psutil库用于系统资源监控
输出文件管理改进:
- 将评估结果和训练后的模型保存到outputs目录
- 添加日志文件到.gitignore,确保版本控制清洁
- 提供完整的模型评估指标对比分析
|
2025-12-07 18:35:34 +08:00 |
|
|
|
dfd3eb841e
|
chore: 更新项目配置文件
- 优化 .gitignore 文件,添加更全面的忽略规则
- 添加虚拟环境目录 .venv/ 的注释说明
- 新增 uv.lock 锁文件的忽略规则
- 补充 Python 缓存目录的排除规则
- 添加 Python 分发包 dist/ 目录忽略
- 包含 VSCode 设置目录 .vscode/ 的忽略
- 从 pyproject.toml 依赖列表中移除 joblib>=1.5.2 依赖
|
2025-12-07 17:22:44 +08:00 |
|
|
|
936e686211
|
feat: 添加模型可视化和分析功能
为堆叠模型项目添加了完整的可视化功能,包括模型性能、预测结果对比和特征重要性分析。
主要改进:
- 新增 ModelPlotter 可视化类,提供多种图表类型
- 添加预测值对比、残差分析、指标对比等可视化功能
- 生成并保存特征重要性图表,支持 XGBoost 和 LightGBM
- 创建模型性能热力图,直观比较不同模型表现
- 优化主程序流程,集成可视化输出到 outputs 目录
- 修复导入路径问题,调整部分注释代码
- 添加 seaborn 依赖,增强图表美观度
功能增强:
- 自动创建输出目录,保存所有可视化结果
- 支持多种图表格式和高分辨率输出
- 提供模型性能的全方位分析视角
|
2025-12-07 17:19:05 +08:00 |
|
|
|
2a13242471
|
chore: 改进 Git 忽略规则并清理已编译的 Python 文件
- 修改 .gitignore 中的 __pycache__ 模式为 **/__pycache__/ 以更准确地忽略所有子目录中的缓存文件
- 删除所有已存在的 __pycache__ 目录下的 .pyc 文件
- 确保项目仓库中不包含任何 Python 编译缓存文件
|
2025-12-07 16:57:32 +08:00 |
|
|
|
e38def9330
|
chore: 更新 .gitignore 并清理 Python 缓存文件
- 在 .gitignore 中添加 Python 编译文件和缓存目录的忽略规则
- 删除已提交的 __pycache__ 目录和 .pyc 文件
- 确保 Python 临时文件不会被版本控制系统跟踪
|
2025-12-07 16:47:39 +08:00 |
|
|
|
d3e3aa8762
|
refactor: 重构包结构从 stacking-model 到 stacking_model 并完善构建配置
- 将整个包目录从 src/stacking-model 重命名为 src/stacking_model,使用 Python 标准的包命名约定
- 更新所有模块的导入路径以适配新的包结构
- 添加 hatchling 构建系统配置,设置正确的包路径
- 新增 matplotlib 依赖以支持可视化功能
- 添加代码质量工具配置:black 和 ruff,统一代码风格
- 配置 hatch 构建目标,指定正确的包路径为 src/stacking_model
- 保持所有核心功能模块不变:数据生成器、基础模型、堆叠模型、预处理和评估工具
|
2025-12-07 16:43:51 +08:00 |
|
|
|
eac11ba1ad
|
refactor: 重构项目目录结构,将代码迁移到分层模块化架构
- 移除根目录下的简单main.py文件
- 创建src/stacking-model作为新的主代码目录
- 建立标准的Python包结构,包含data、models、utils子模块
- data模块负责数据生成和处理逻辑
- models模块包含基础模型和堆叠模型实现
- utils模块提供评估和预处理工具函数
- 采用分层设计提升代码的可维护性和扩展性
|
2025-12-07 01:35:41 +08:00 |
|
|
|
cdfbff7981
|
build: 添加项目依赖和配置文件
- 创建 .gitignore 文件,忽略 .venv/ 目录和 uv.lock 文件
- 更新 pyproject.toml,添加机器学习项目所需的核心依赖包
- 添加的依赖包括:joblib、lightgbm、numpy、pandas、scikit-learn 和 xgboost
- 配置了 uv 工具的 Python 安装镜像地址,优化国内下载速度
|
2025-12-07 00:55:06 +08:00 |
|
|
|
88d834d617
|
feat: 初始化 stackingdemo 项目结构
- 创建新的 Python 项目,实现堆叠集成模型功能
- 添加 pyproject.toml 配置文件,定义项目元数据和依赖管理
- 设置主程序入口 main.py,提供基础执行框架
- 配置清华大学 PyPI 镜像源以加速依赖安装
- 项目规划包含 Ridge/XGBoost/LightGBM/MLP 与决策树的堆叠组合
|
2025-12-07 00:45:33 +08:00 |
|