新書推薦:

《
日军的“治安战” 日本远东战争罪行丛书
》
售價:HK$
79.2

《
了不起的她,写给所有不甘平凡的女性的生命蜕变指南。
》
售價:HK$
86.9

《
名士的反抗:从孔融到嵇康
》
售價:HK$
96.8

《
万千心理·图式疗法临床实践:模式工作模型应用指南(原著第二版)
》
售價:HK$
85.8

《
美国启蒙运动
》
售價:HK$
129.8

《
变局与定力
》
售價:HK$
86.9

《
岭南学报复刊第二十四辑:文本·观念·空间:中国文学的一个精神侧影
》
售價:HK$
107.8

《
爱尔兰史 250个历史瞬间,解锁一座岛的万年史诗
》
售價:HK$
184.8
|
| 內容簡介: |
|
本书以社会对”具有数据分析技能的管理者”的需求为导向,从”场景引用驱动的商业数据挖掘”出发,将人工智能及数据挖掘赋能企业运营和商业创新工作。全书从数据分析思维切入,尝试以工商管理类学生容易接受的语言介绍商业数据挖掘的知识点及精髓。全书分为思维篇、方法篇和案例篇三部分,思维篇从应用的角度介绍数据的商业价值,期望让读者明白数据分析的业务场景与目标;方法篇则着重将业务场景及问题转化为可能的数据挖掘技术,将业务目标转化为技术目标并实现;案例篇则以研究生、本科生完成的实际案例为例,向读者展示具体的实现过程。
|
| 關於作者: |
|
周军杰,博士,教授。2013年6月毕业于中国人民大学商学院,获管理学博士学位。2017年3月至2018年3月,俄勒冈州立大学商学院访问学者。研究关注传统服务的数字化与智能化转型,重点关注医疗健康与养老服务行业,在MISQ等国际顶级期刊和CMR、JKM、管理评论、中国管理科学等主要期刊发表论文20余篇,主持及参与国家自然科学基金、国家社会科学基金、省部级基金8项。
|
| 目錄:
|
第1篇 思维篇 第1章 人工智能、机器学习与数据挖掘概论2 1.1 人工智能概论4 1.1.1 人工智能的定义4 1.1.2 人工智能的特点5 1.1.3 人工智能的发展历史7 1.1.4 人工智能的类型10 1.1.5 人工智能的前沿发展11 1.1.6 人工智能的伦理问题13 1.2 机器学习概论16 1.2.1 开发机器智能的策略16 1.2.2 机器学习17 1.2.3 知识图谱18 1.3 数据挖掘概论21 1.3.1 数据挖掘的定义21 1.3.2 数据挖掘技术21 1.4 三者之间的关系辨析22 1.4.1 人工智能与机器学习的关系22 1.4.2 机器学习与数据挖掘的关系23 1.4.3 三者之间的融合23 第2章 数据与数据的价值25 2.1 无处不在的数据27 2.1.1 数据爆发的原因27 2.1.2 数据的模态与类型32 2.2 数据的价值35 2.2.1 数据金字塔35 2.2.2 数据价值的演进35 2.2.3 数据商业价值的实现方式36 2.3 警惕“数据至上主义”38 2.3.1 数据的局限性39 2.3.2 数据利用的伦理问题39 2.3.3 数据隐私与安全保护40 2.3.4 人与数据的关系41 第3章 数据思维与商业应用43 3.1 思维范式45 3.1.1 数据思维45 3.1.2 模型思维47 3.2 商业需求与决策47 3.2.1 认识现实,理解现状是什么47 3.2.2 识别模式,按照规律做决策48 3.2.3 厘清关系,根据因果做决策48 3.2.4 预测未来,通过预判来决策49 3.3 驱动商业决策的技术体系49 3.3.1 描述性分析50 3.3.2 预测性分析50 3.3.3 规范性分析51 3.3.4 商业需求决定数据分析技术选择52 第4章 业务引领的商业数据挖掘过程54 4.1 商业数据挖掘过程中的数据思维56 4.2 步骤1:设置靶子,明确所要解决的业务问题57 4.2.1 分析业务存在的问题57 4.2.2 确定数据分析的目标58 4.3 步骤2:分解问题,构建问题对应的业务指标体系59 4.3.1 分解问题的重要性59 4.3.2 构建业务指标体系59 4.4 步骤3:准备数据,收集和理解问题所需的数据61 4.4.1 数据收集61 4.4.2 数据清洗61 4.4.3 数据标签体系62 4.5 步骤4:分析数据,找到业务问题的数据答案62 4.5.1 选择数据分析技术的“原则”62 4.5.2 使用机器学习找到答案63 4.6 步骤5:回到业务,确定分析结果的商业解释64 4.6.1 将分析结果转化为业务洞察64 4.6.2 将业务洞察转化为商业行动64 4.7 步骤6:呈现结果,基于数据分析过程形成商业数据分析报告65 4.7.1 商业数据分析报告的结构65 4.7.2 优秀商业数据分析报告的要点65 第2篇 技术篇 第5章 聚类分析68 5.1 聚类分析的商业应用场景70 5.1.1 聚类分析的基础知识70 5.1.2 聚类分析在商业领域的应用70 5.2 K-means算法71 5.2.1 算法简介71 5.2.2 计算步骤72 5.2.3 K值选择73 5.2.4 算法优缺点75 5.3 K-modes算法76 5.3.1 算法简介76 5.3.2 计算步骤76 5.3.3 K值选择76 5.3.4 算法优缺点76 5.4 K-prototypes算法77 5.4.1 算法简介77 5.4.2 计算步骤77 5.4.3 K值选择77 5.4.4 算法优缺点77 5.5 层次聚类算法78 5.5.1 算法简介78 5.5.2 计算步骤78 5.5.3 K值选择78 5.5.4 算法优缺点80 5.6 聚类分析的Python实现方式80 5.6.1 K-means算法80 5.6.2 K-modes算法81 5.6.3 K-prototypes算法81 5.6.4 层次聚类算法82 第6章 分类分析84 6.1 分类分析的商业应用场景86 6.1.1 分类分析的基础知识86 6.1.2 分类分析在商业领域的应用87 6.2 KNN算法89 6.2.1 算法简介89 6.2.2 计算步骤89 6.2.3 算法优缺点90 6.3 决策树算法90 6.3.1 算法简介90 6.3.2 计算步骤91 6.3.3 算法优缺点93 6.4 支持向量机算法94 6.4.1 算法简介94 6.4.2 计算步骤95 6.4.3 算法优缺点95 6.5 分类准确率的测量方法95 6.5.1 混淆矩阵96 6.5.2 评价指标96 6.5.3 分类准确率的提升方法96 6.6 分类分析的Python实现方式98 6.6.1 KNN算法98 6.6.2 决策树算法99 6.6.3 支持向量机算法99 第7章 关联规则分析101 7.1 关联规则分析的商业应用场景102 7.1.1 关联规则分析的基础知识102 7.1.2 关联规则分析在商业领域的应用104 7.2 常见的关联规则分析算法105 7.2.1 Apriori算法105 7.2.2 FP-Growth算法105 7.3 关联规则分析的Python实现方式106 7.3.1 Apriori算法106 7.3.2 FP-Growth算法107 第8章 回归分析109 8.1 回归分析的商业应用场景111 8.1.1 回归分析的基础知识111 8.1.2 回归分析在商业领域的应用111 8.2 简单线性回归113 8.2.1 定义与数学模型113 8.2.2 回归系数估计113 8.2.3 计算步骤114 8.3 多元线性回归114 8.3.1 定义与数学模型114 8.3.2 回归系数估计115 8.3.3 计算步骤116 8.4 逻辑回归116 8.4.1 定义与数学模型116 8.4.2 模型参数估计118 8.4.3 梯度下降法的实现步骤118 8.5 岭回归与Lasso回归119 8.5.1 岭回归119 8.5.2 Lasso回归120 8.5.3 岭回归与Lasso回归的对比121 8.6 回归结果显著性检验121 8.6.1 模型拟合优度121 8.6.2 显著性检验123 8.6.3 置信区间估计125 8.7 回归分析的诊断与改进125 8.7.1 残差分析125 8.7.2 多重共线性127 8.7.3 异方差128 8.7.4 自相关129 8.8 回归分析的Python实现方式131 8.8.1 简单线性回归131 8.8.2 多元线性回归132 8.8.3 逻辑回归133 8.8.4 岭回归134 8.8.5 Lasso回归134 8.8.6 回归结果显著性检验135 8.8.7 回归分析的诊断与改进136 第9章 人工神经网络138 9.1 人工神经网络的商业应用141 9.1.1 人工神经网络的基础知识141 9.1.2 人工神经网络的商业应用141 9.2 感知机143 9.2.1 简单逻辑电路143 9.2.2 工作原理144 9.2.3 线性不可分的局限144 9.2.4 多层感知机145 9.3 全连接神经网络146 9.3.1 基本结构146 9.3.2 激活函数147 9.3.3 损失函数150 9.4 卷积神经网络152 9.4.1 基本结构152 9.4.2 训练流程155 9.4.3 代表性网络结构155 9.5 循环神经网络156 9.5.1 基本结构157 9.5.2 训练流程157 9.5.3 代表性网络结构158 9.6 训练技巧160 9.6.1 参数初始化160 9.6.2 批处理162 9.6.3 优化算法163 9.6.4 偏差与方差164 9.6.5 超参数调优166 9.7 深度学习框架167 9.7.1 TensorFlow和Keras167 9.7.2 PyTorch168 9.7.3 PyTorch与TensorFlow的差异169 9.8 人工神经网络的Python代码实现169 9.8.1 全连接神经网络169 9.8.2 卷积神经网络171 9.8.3 循环神经网络171 9.8.4 LSTM网络174 9.8.5 门控循环单元176 第10章 商业文本挖掘179 10.1 文本挖掘的商业应用场景181 10.1.1 文本挖掘的基础知识181 10.1.2 文本挖掘在商业领域的应用183 10.2 文本向量化方法184 10.2.1 独热编码184 10.2.2 词袋模型184 10.2.3 TF-IDF模型185 10.2.4 Word2Vec模型186 10.2.5 Doc2Vec模型187 10.2.6 其他方法188 10.3 文本挖掘任务189 10.3.1 文本分类189 10.3.2 文本关联规则190 10.3.3 文本情感分析190 10.3.4 文本主题提取191 10.4 文本挖掘的Python实现方式193 10.4.1 文本预处理与分词193 10.4.2 文本可视化194 10.4.3 使用scikit-learn库进行文本挖掘195 10.4.4 使用VADER进行情感分析197 10.4.5 使用gensim进行Word2Vec模型训练198 第3篇 案例篇 第11章 “翠峰伍号”顾客细分202 11.1 玩具配送企业面临的问题202 11.2 关于客户需求的业务指标设计203 11.3 数据清洗与准备203 11.3.1 数据清洗和预处理203 11.3.2 探索性分析206 11.4 聚类分析211 11.4.1 特征工程211 11.4.2 聚类分析过程212 11.5 基于用户画像的营销策略设计217 11.6 指导老师点评218 第12章 “僵尸粉丝”识别――分类分析219 12.1 “粉丝经济”的兴起与虚假粉丝问题219 12.2 “僵尸粉丝”特征指标选择219 12.3 数据收集与用户特征选择220 12.3.1 数据收集220 12.3.2 用户特征选择220 12.4 数据清洗与预处理221 12.4.1 去重与缺失值处理221 12.4.2 数据编码221 12.4.3 数据标准化223 12.4.4 数据降维223 12.5 分类模型构建与调优226 12.5.1 关键参数解释226 12.5.2 训练过程227 12.5.3 模型参数调优227 12.5.4 评估模型性能227 12.6 分类结果分析228 12.6.1 参数优化结果分析228 12.6.2 降维前分类结果分析228 12.6.3 降维后分类结果分析229 12.7 “僵尸粉丝”问题的应对策略230 12.7.1 “僵尸粉丝”检测与清理机制230 12.7.2 用户价值分层体系230 12.7.3 平台运营优化策略230 12.8 指导老师点评231 第13章 消费者对猫
|
|