SAS EG数据分析及数据挖掘应用(选修)

SAS EG应用介绍
掌握数据预处理的基本过程
掌握数据探索的基本方法
根据数据特点生成统计报表
培养处理实际问题的统计分析能力
第1讲 熟悉 SAS Enterprise Guide
  • 1.1 SAS Enterprise Guide介绍
  • 1.2 数据变量详解:变量类型、缺失值、变量测量等
  • 1.3 数据引入(平面文件、格式文件、数据库联接)
  • 1.4 数据操纵(表连接、数据重组)
  • 1.5 变量操纵(生成新变量、求秩)
  • 第2讲 统计基础回顾
  • 2.1 统计基本概念
  • 2.2 变量可视化分布探索
  • 2.3 均值的致信区间
  • 2.4 假设检验
  • 2.5 单样本t-检验、独立双样本 t-检验、配对 t-检验和单边 t-检验
    第3讲 方差分析(ANOVA)

      3.1 单变量 ANOVA
      3.2 随机区组设计的ANOVA
      3.3 ANOVA 后期检验
      3.4 两变量 ANOVA
      3.5 非参数 ANOVA

      第4讲 线形回归
        4.1 数据的探索性分析
        4.2 一元线形回归
        4.3 多元线形回归(5个经典假设论述与重要议题)
        4.4 建立模型(全子集与逐步法)
        4.5 检验残差分布
        4.6 极端值
        4.7 共线形
        4.8 异方差、自相关与一般线形模型(general linear model, GLM)
        4.9 流程回顾、对模型设置与研究设计的讨论
        第5讲 分类数据分析

          5.1 分类变量的描述
          5.2 关联关系的检验、小样本Chi-Square检验
          5.3 逻辑回归介绍
          5.4 分类变量作为解释变量的逻辑回归
          5.5 解释变量的选择

        第6讲 数据分析运用案例

          6.1 数据描述
          6.2 变量修改
          6.3 建立模型
          6.4 模型评估

        第7讲 多元统计模型

          7.1 主成分与变量聚类
          7.2 样本聚类
          7.3 判别分析
          7.4 典型相关

      第8讲 构造精细的逻辑回归模型

        8.1 分类变量水平压缩
        8.2 缺失值处理
        8.3 经验概率图形
        8.4 宏与全子集模型选择
        8.5 模型评估

      第9讲 广义线性模型(generalized linear model,GENMOD)与生存分析

        9.1 泊松回归
        9.2 多分类逻辑回归
        9.3 生存分析

      第10讲 时间序列分析简介

        10.1 时间序列数据整理
        10.2 AR模型
        10.3 MA模型
        10.4 带自回归误差的回归分析

  • 咨询热线 : 400-051-9191