新書推薦:

《
旧日烟火 静远楼读史
》
售價:HK$
103.8

《
鲁迅与周作人
》
售價:HK$
81.4

《
索恩丛书——命运交织的土地:东南欧的历史(撕去标签,东南欧不只是“大火药桶”)
》
售價:HK$
198.2

《
甲骨文丛书——创造者、征服者和公民:一部古希腊通史
》
售價:HK$
140.4

《
中国力量:迈向世界之巅的九大战略支点
》
售價:HK$
80.2

《
大国筹谋:中国式现代化的关键十年
》
售價:HK$
103.8

《
江苏文库:明清之际江南文化遗民研究
》
售價:HK$
115.6

《
何以中国·忠臣之变:大宋989—1051
》
售價:HK$
80.2
|
| 編輯推薦: |
1.系统思维。助你建立坚实的数据科学认知框架,掌握从问题定义到模型落地的系统性思维。 2.超越理论。直指数据实践中的真实挑战,揭示工程现实如何决定项目成败。 3.实战导向。提炼7大项目成功原则,提供从问题定义到业务整合的完整行动清单。 4.前瞻视野。直面数据偏见与隐私伦理挑战,培养负责任的、面向未来的数据素养。
|
| 內容簡介: |
一本为渴望系统理解数据科学全貌的读者所写的指南。数据科学致力于从海量数据中提取有价值且非显而易见的模式。本书对数据科学这一新兴领域进行了系统梳理,以简洁的笔触勾勒出其发展脉络、与机器学习的关联、当前应用场景、数据基础设施现状及面临的伦理挑战。來源:香港大書城megBookStore,http://www.megbook.com.hk 全书从数据科学的演进历程说起,解析了基础数据概念,并详细阐述数据科学生命周期的各个阶段,继而深入探讨数据基础设施的关键问题,以及多源数据整合过程中面临的技术挑战。同时,本书还对数据伦理与法律规范、数据监管机制演进趋势及隐私保护计算技术进行了专业解读。最后,通过前瞻性探讨数据科学的未来发展方向,总结了保障数据科学项目成功实施的关键原则。
|
| 關於作者: |
【作者介绍】 约翰·D. 凯莱赫(John D. Kelleher),爱尔兰都柏林理工大学计算机科学学院教授,兼任信息、通信和娱乐研究所学术负责人。合著有《预测数据分析的机器学习基础》(麻省理工学院出版社)。 布伦丹·蒂尔尼(Brendan Tierney),爱尔兰都柏林理工大学计算机科学学院讲师,兼任Oracle ACE 总监,撰有多部基于Oracle技术的数据挖掘著作。 【译者介绍】 张里博,西南大学人工智能学院智能科学系主任、副教授,南京大学特聘研究员,主要从事人工智能、大数据与智能决策等方面的研究。 杨金瑞,澳大利亚麦考瑞大学计算机科学硕士。
|
| 目錄:
|
第一章 什么是数据科学 001 第二章 什么是数据和数据集 033 第三章 数据科学生态系统 055 第四章 机器学习入门 077 第五章 标准数据科学任务 119 第六章 隐私与伦理 141 第七章 未来趋势与成功之道 169 致 谢 184 术语表 185 注 释 193 延伸阅读 197 参考文献 199 索 引 207
|
| 內容試閱:
|
前 言 数据科学的目标是通过从海量数据中提炼洞见来改进决策。作为一门学科,数据科学融合了一系列原理、问题界定、算法和流程,旨在从大数据集中挖掘出隐蔽而实用的规律。它与数据挖掘和机器学习密切相关,但其涵盖范围更广。如今,数据科学在现代社会的几乎各个领域推动着决策的制定。数据科学可能影响你日常生活的方方面面,包括:决定网上向你展示哪些广告,为你推荐哪些电影、书籍和新朋友,将哪些电子邮件扔进垃圾箱,当你续订手机服务时会收到哪些优惠,你的医疗保险费,你所在区域的交通信号灯的时序安排,你可能需要的药物是如何设计的,以及你所在城市的警察正在关注哪些区域。 数据科学在社会中的广泛应用,得益于大数据和社交媒体的蓬勃发展,计算能力的显著增强,计算机内存成本的急剧降低,以及如深度学习等先进数据分析和建模技术的不断进步。这意味着,人类收集、存储和处理数据从未像现在这样容易。与此同时,这些技术创新以及数据科学的更广泛的应用,也意味着与数据使用和个人隐私相关的伦理挑战从未如此紧迫。本书旨在提供数据科学的入门介绍,涵盖该领域的基本要素,其深度足以帮助读者对数据科学形成原则性理解。 第一章介绍数据科学领域,并简要回顾它的发展历程。同时,本章探讨了数据科学在当今的重要性以及推动其应用的一些因素。最后,本章还回顾并澄清了与数据科学相关的一些误解。第二章介绍与数据相关的基本概念,并描述了数据科学项目的标准阶段:商业理解、数据理解、数据准备、建模、评估和部署。第三章聚焦于数据基础设施,以及大数据和多源数据整合所带来的挑战。典型数据基础设施中的一个挑战是,数据库和数据仓库中的数据通常与用于数据分析的数据存储在不同的服务器上。因此,当处理大规模数据集时,在数据库或数据仓库服务器与数据分析和机器学习的服务器之间迁移数据会耗费大量时间。第三章首先描述了一个组织的典型数据科学基础设施,并介绍了一些新兴解决方案,以应对在数据基础设施中移动大规模数据集的挑战,包括使用数据库内机器学习、利用 Hadoop进行数据存储和处理,以及开发能够无缝结合传统数据库软件和类 Hadoop解决方案的混合数据库系统。章末强调了将组织的各类数据整合为适合机器学习的统一数据表示形式时所面临的一些挑战。第四章介绍机器学习领域,并解释了一些最流行的机器学习算法和模型,包括神经网络、深度学习和决策树模型。第五章则通过回顾一系列典型的商业问题并描述如何通过机器学习来解决这些问题,从而将机器学习中的专业知识与现实世界的问题联系起来。第六章探讨数据科学的伦理影响,概述了数据监管的最新进展,并介绍了一些在数据科学实践中保护个人隐私的新方法。第七章展望了数据科学在不久的将来可能产生重大影响的领域,并讨论了决定数据科学项目成功与否的一些关键原则。
|
|