安装命令
clawhub install data-analysis
跨工具通用:Claude Code ~/.claude/skills/ · Qoder ~/.qoder/skills/ · TRAE ~/.trae/skills/
何时使用
当你需要对数据集做探索性分析、统计检验、或生成数据洞察报告时触发。
核心流程
数据清洗
- 识别缺失值模式:随机缺失 vs 系统性缺失,分别处理
- 异常值用 IQR 或 Z-score 检测,标记而非直接删除
- 数据类型统一:日期格式、数值精度、字符串编码
探索性分析
- 先看分布(直方图、箱线图),再看关系(散点、相关矩阵)
- 分组对比用分组统计 + 置信区间,不只看均值
- 时间序列看趋势、季节性、异常点
统计检验
- 两组比较:正态用 t-test,非正态用 Mann-Whitney U
- 多组比较:ANOVA + 事后检验(Tukey HSD)
- 相关性:Pearson(线性)或 Spearman(单调),报告 p 值和效应量
可视化
- 选择图表类型:趋势用折线、比较用柱状、分布用直方图、关系用散点
- 标注关键数据点、异常值、阈值线
- 输出结论:每张图配一句话洞察