深入浅出数据分析 pdf

深入浅出数据分析

内容简介

《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。

作者简介

Michael Milton,将自己的大半职业生涯献给了非盈利机构,帮助这些机构解析和处理,从赞助人那里收集来的数据,提高融资能力。Michael Milton拥有新佛罗里达学院哲学学位及耶鲁大学宗教伦理学学位。多年来,他博览群书,这些书籍虽字字珠玑,却枯燥乏味;蓦然抬首,深入浅出(HeadFirst)系列图书让他眼前一亮,他欣然抓住机会,写出了这本同样字字珠玑,兼振奋人心的书。走出图书馆和书店,人们会看到他在跑步、摄影,以及亲手酿制啤酒。

目录

1 数据分析引言:分解数据
2 实验:检验你的理论
3 最优化:寻找最大值
4 数据图形化:图形让你更精明
5 假设检验:假设并非如此
6 贝叶斯统计:穿越第一关
7 主观概率:信念数字化
8 启发法:凭人类的天性作分析
9 直方图:数字的形状
10 回归:预测
11 误差:合理误差
12 相关数据库:你能关联吗?
13 整理数据:井然有序
附录A 尾声:正文未及的十大要诀
附录B 安装R:启动R!
附录C 安装Excel分析工具:ToolPak

感悟与笔记

一、数据分析的基本流程

确定----分解----评估----决策

确定:确定问题,了解问题;

分解:数据分析总的来说就是分解问题和数据,使其成为更小的组成部分;

评估:这才是分析大餐,在这一步对前两个步骤了解到的情况作出各种结论;

决策:最后,把这些结论重新组合在一起,作出(建议)或一个决策;

你的客户可能:相当了解或不甚了解自己的数据;相当了解或不甚了解自己的问题或目标;相当了解或不甚了解自己的业务;目标明确或优柔寡断;头脑清醒或稀里糊涂;富有直觉或善于分析;如果能够对客户了解越深(问对问题),你的分析越有可能派上用场;

二、务必明确你的心智模型

1、什么是心智模型?

你对外界的假设和你确信的观点就是心智模型;

2、统计模型取决于心智模型:心智模型决定你的观察结果,是你观察现实的棱镜;

3、如果用错了心智模型,分析会胎死腹中;

第二章 验证你的理论

通过做实验来验证你的理论,并且帮助自己做决策; 再没有什么办法能像一个好实验那样,既能解决问题又能揭示事物的真正运行规律。 一个好的实验往往能让你摆脱对观察数据的无限依赖,能帮助你理清因果联系;可靠的实证数据将让你的分析判断更有说服力; 观察分析发充满混杂因素,混杂因素就是研究对象的个人差异它们不是你试图进行比较的因素,最终会导致分析结果的敏感度变差;拆分数据块,管理混杂因素;

第三章 最优化

第五章 证伪法--假设并非如此

一、评估一个事件发生的未来预测,需要把这个事件相关的各种变量间的关系进行圈点,同升同降,关系为“+”,背道而驰,关系为“-”,变量之间可以正相关也可以负相关,尽可能多的发现变量,并标注关系;

二、现实世界中的关系呈网络关系,而非线性关系,线性关系等于直觉;

三、根据网络关系形成假设;

四、假设检验的核心是证伪,请勿试图选出最合理的假设,只需剔除无法证实的假设;

五、进行假设检验时,要使用证伪法,回避满意法;对假设进行评级,不利证据越少的排在越前面;

第六章 贝叶斯统计

哦,这里发现个及其严重的错误,在p180页,计算自己患蜥蜴流感的概率为多少,在文字公式中,应该是在实验结果为阳性的条件下患病概率,而不是为阴性的条件下患病概率;

一、基础概率:统计出总的概率情况;

二、条件概率:一件事发生为前提的另一件事的发生概率。

三、贝叶斯规则(用简单的整数思考复杂的概率)用基础概率和条件概率估计新的条件概率;

四、贝叶斯公式:

第七章 主观概率

将严谨融入直觉的简便办法;

Copyright © 2021-2022 知识猫. All Rights Reserved.