商务数据智能分析 (Spring Semester, 2017)

介绍

大物云移时代,即大数据、物联网、云计算和移动互联网时代的到来给整个学界与商界带来了巨大的机遇与挑战。 一方面,商界相信商务大数据与其他的大数据相比蕴含着更大量的待发掘的价值。另一方面,学界也百家争鸣般纷纷在大数据的基本概念、模型、理论以及相关的人才培养方面进行了相当多的探索与讨论。

与大数据密切相关的问题是大数据表示、查询、分析与应用。大数据的表示与查询是大数据分析的基础,解决的是大数据体量大,难以集中存储的问题。 大数据的分析是大数据得以应用的核心,解决的是大数据的价值挖掘问题。给定数据的表示,统计机器学习(简称统计学习)的核心任务就是从数据中进行知识发现与价值挖掘。

本课程首先讲授统计学习的基本概念、原理与模型。其次,通过与商务数据相关的案例去探讨如何应用这些模型进行商业分析。最后,通过R语言训练大家能够运用统计学习的模型处理商务数据。最终实现对商务数据智能分析的目的。

值得注意的是本课程是管理学院大数据的系列课程,其他两门课程为《可扩展数据分析》与《数据库与数据管理》。

介绍

授课对象

西安交通大学硕士研究生

时间

春上学期,1-8周,每周日5-8节

地点

管理学院大楼219

授课人

常象宇,xiangyuchang@xjtu.edu.cn

助教

申旌周,jingzhou_shen@stu.xjtu.edu.cn

参考书籍

内容

Week Date Lecture Topic Case Study R
1 Feb. 26 Introduciotn to Big Data, Data Value and Predicition. Overview of Statistical Machine Learning. NA NA
2 Mar. 5 Linear Model for Regression: Linear Regression, Stepwise Regression, Stagewise Regression, Ridge and Lasso. 北京二手房买卖案例 R, R Markdown and LaTeX (Lecture)
3 Mar. 12 Linear Model for Classification: Linear Discriminate Analysis and Logistic Regression 西安火锅团购案例 Read Data, Data Structure, Data Type and Control Flow in R (Lecture)
4 Mar. 19 Model Assessment: AIC, BIC, Cp, Degree Freedom, Cross-validation and AUC. NA Function and Plotting in R (Lecture)
5 Mar. 26 Nonlinear Method: Piecewise Polynomilas, Nonlinear Logistic Regression, Smoothing Spline, Naive Bayesian NA Linear Regression, Logistic Regression, LDA, Ridge, LASSO in R (Lecture)
6 Apr. 2 Classificaiotn and Regression Tree, Bagging and Random Forest 相亲案例 CRT and RF in R (Lecture)
7 Apr. 9 Boosting: AdaBoost, Additive Model and Gradient Boosting 出租车案例 Caret in R (Lecture)
8 Apr. 16 Deep Learning 手写字符识别案例 Mxnet in R (Lecture)

作业

参考文献