封面
行为科学统计 Frederick J. Gravetter, Larry B. Wallnau - Statistics for the Behavioral Sciences-Cengage Learning (2016)
作者: [美] Frederick J Gravetter / [美] Larry B. Wallnau 出版社: 机械工业出版社 副标题: 原书第9版 原作名: Statistics for the Behavioral Sciences 译者: 方平 / 姜媛 出版年: 2023-1 页数: 426 定价: 99.00元 装帧: 平装 ISBN: 9787111716334
内容简介 · · · · · · ★ 一本“有魔法”的统计学入门教材,全面更新至第9版
★ 被无数学生和老师强推的经典教材,时隔15年完整再版
★ 以往版次获豆瓣千人9.5高分推荐:“相见恨晚,泪流满面,原来统计学没有那么难!”
★ 资深统计学教授方平、姜媛领衔翻译,译文准确流畅
本书是统计学经典入门教材,两位作者有几十年应用统计和实验设计的教学经验,作者根据读者和学生的反馈,追踪统计学新发展,对本书进行了多次修订。自出版以来,本书一直是全球心理学、社会学、经济学等领域广泛使用的应用统计学教材。
本书非常大的特色在于深入浅出,通俗易懂,花了大量篇幅介绍超越公式之外的统计学原理,有技巧地展示了统计分析的过程,循序渐进,有助于读者深入理解统计学的本质。作者通过一步步的逻辑推演,向读者展示了每个统计概念的含义,帮助读者理解每种统计方法适用于何种情境,以及运用每种方法的关键点。书中还提供了大量生动的案例和课后练习,以帮助数学基础薄弱的学生真正理解统计思想。
如果你想真正学习一门社会科学,那么统计学基础知识是你必须了解的。如果你觉得统计很难,觉得自己数学不够好,担心自己学不会统计学,那么这本书就是为你准备的。
作者简介 · · · · · · 弗雷德里克·J.格雷维特(Frederick J. Gravetter)
纽约州立大学布洛克波特学院心理学荣誉教授。任教期间,他专注于统计学、研究设计和认知心理学方向的研究和教学工作。格雷维特博士在麻省理工学院获得数学学士学位,在杜克大学获得心理学博士学位。除了出版本书、发表多篇研究论文,他还参与编写了《行为科学统计精要》《行为科学的研究方法》。
拉里·B.瓦尔诺(Larry B. Wallnau)
纽约州立大学布洛克波特学院心理学荣誉教授。瓦尔诺博士在研究和教学方面都获得了很多奖项,他发表了很多研究论文,主要是关于精神药物的影响。他与格雷维特博士一起编写了《行为科学统计》和《行为科学统计精要》。
译者简介
方平
首都师范大学教授,博士,博士生导师,美国加利福尼亚大学伯克利分校和德国康斯坦茨大学访问学者。教育部高等学校心理学类专业教学指导委员会副主任,中国心理学会副理事长,中国社会心理学会常务理事,中国心理学会心理测量专业委员会主任,北京市心理学会副理事长。主持国家级和省部级科研项目10余项,发表心理学核心期刊论文150余篇,主编、主译心理学学术著作10余部,荣获首届全国教材建设奖、全国教育科学研究优秀成果奖和北京市教育科学研究优秀成果奖。
姜媛
北京体育大学教授,博士,博士生导师,美国加利福尼亚大学伯克利分校和德国康斯坦茨大学访问学者。主持、参加国家级和省部级科研项目20余项,发表心理学核心期刊论文90余篇,参编、参译心理学学术著作10余部。
目录 · · · · · · 译者序 前言 第一部分 导论和描述统计 第1章 统计学导论2 第2章 频数分布21 第3章 集中趋势41 第4章 变异性59 第二部分 推断统计基础 第5章 z分数:分数的位置和标准化分布78 第6章 概率93 第7章 概率和样本:样本平均数的分布112 第8章 假设检验简介129 第三部分 运用t统计量推断总体平均数和平均数差异 第9章 t统计量简介158 第10章 两个独立样本的t检验176 第11章 两个相关样本的t检验196 第四部分 方差分析:检验两个或多个总体平均数的差异 第12章 方差分析简介216 第13章 重复测量方差分析242 第14章 双因素方差分析(独立测量)260 第五部分 相关和非参数检验 第15章 相关286 第16章 回归313 第17章 卡方统计量:拟合度检验和独立性检验331 第18章 二项式检验353 第19章 选择恰当的统计方法368 附录 附录A 统计表380 附录B 各章奇数编号习题和各部分复习题的答案395 附录C SPSS使用简要说明412 附录D 顺序数据的假设检验414 参考文献421 教辅材料申请表426
[z = \frac{得到的差异}{偶然引起的差异} ] 例如,z分数 z=3.00 意味着在样本和假设之间的差异是期望随机出现差异的 3 倍 (查看原文)
如果样本大小足够大,任意处理效应,不管有多小,都能足以使得我们拒绝虚无假设
精神病学的人际关系理论 27.00元
双缝实验和量子力学 45.50元
ACT就这么简单 49.00元 喜欢读"行为科学统计"的人也喜欢 · · · · · ·
心理统计导论(原书第10版) 8.4
机会的数学 8.7
情绪心理学(原著第三版) 8.1
认知语言学
心理治疗大辩论 9.2
心理学研究方法 9.6
万千心理:认知神经科学(原著第五... 9.7
心理学导论(原书第9版) 9.3
理解之谬 改变之谜 8.1
心理学研究方法(第9版) 8.2
看了下面的留言,买了这本书,说啥好呢?例如:简单测量每个个体的两个变量并给出如图1-4所示的数据的研究所使用的方法就是相关法(全书第7页的最后一行),书中类似的长句,还有很多,就不一一列举了。只想请问一下本书翻译人员:您忘了还有‘标点、符号’这回事吗?麻烦您添几个逗号,行不?您看清楚“,”这叫逗号,添几个逗号,费不了您多少时间,也占不了多大的版面,可省了读者的很多时间和脑力,请多为那些手头并不宽裕的,为了学习,省下零花钱,用来购买本书的读者们,想想吧!~
竟全书,以后权当工具书和习题册了。 12/19。英美大学教材总是那么事无巨细,不厌其烦,生怕你有任何不懂的地方,清晰、连贯、完备,但有时也会显得啰嗦
能大差不差自学明白的统计学教材,厉害的呢
标准误与标准差 在我用于本科毕业论文答辩的ppt里的某页赫然写着这么一行:“标准误:标准差除以样本量的平方根”。这是我对“数据处理”部分特地作出的一条说明。前些天打开看到的时候,不禁觉着有些囧。当年我们的《生物统计学》是一门选修课,授课的是生科院生物信息学方向的一个牛人,长得像藏人,不过一听口音就知道他家和我家肯定离不太远。
这门课历来就是选修课。学的内容很浅,考试是开卷。我考得还不错,但学得不咋地。学完的时候感觉,统计学说来就一句话:“有没有显著性差异”。你说这话啥意思,我也不太懂,能套公式把结果算出来就成。要说起来,有关统计学的基本知识,早在大一上分析化学的时候就专门讲过,很多实验报告也都要算平均数和标准差。
等到做完毕设写论文要处理数据的时候,我突然就发现了一个问题,为什么我看的那么多paper里面,在算样本平均数的时候,有的附的是标准差,有的附的是标准误呢?而且国外的paper都是用的标准误。我又不懂,但是搜到有篇专门讲两者区别的文章说要用标准误,我也就用了。两者啥区别呢?标准差除以样本量的平方根就等于标准误。可这数学关系反映了什么实质?我还是不懂。只是记得上生物统计学的课的时候,老师特别强调说国内生命科学和医学方面的大部分paper都存在统计学错误。我就生怕我这么“正确地”使用标准误反而显得“错误”了,于是有了ppt上多此一举的那句话。
其实统计学是很多学科都需要用到的,而且重要性不言而喻。可就我所了解的,如我们这些生、化、医、药专业出身的学生有多少真的理解了统计学呢?大部分都是停留在机械用软件、套公式、填结果的层面吧。当然了,这里存在一个学科差异的问题,也不是谁刻意地不想去理解统计学。比方说,去年国家就三聚氰胺出台了一个最低检测限的标准的时候,很多没有科学素养的记者就开始疯狂质疑了。其实对“检测限”这个概念我们就很理解,我想心理学专业的学生倒不见得认同,而“检测限”的本质同属统计学中的“概率”和“误差”的范畴。不过总的说来,我们的统计学训练比起心理学实在差太远。
终于进入正题了,因为统计学是心理学的基本功,所以我正儿八经地看起了那本国内最经典的《现代心理与教育统计学》,等把第八章假设检验看完之后,暂停。我的基本感受是,一路看下来,条理是清晰的,逻辑是明白的,我也是理解的。如果说单纯应试的话,看到这样没问题。可这门课程当然不止是应试之用的,那么,我在想,我看了这么多,它讲的这些东西到底是在干嘛呢?对,我的意思很明白。这本书是在讲鱼不是在讲渔。我纵使把计算标准误的公式及其意义理解得化成灰也认识,可它到底是干嘛的呢?
我暂停是为了找些paper来自己体会统计学的用处,这时发现了手头正读着的《行为科学统计》,如获至宝地读完第一章我就恨不得骂脏话了,差距怎么能这么大?!为什么一本国内最经典的心理统计学教材和美国的一本也许还不是最经典的心理统计学教材差了这么远?所以等读完第一部分的时候,我想哭了(呃,当作形容词看待吧,不是真的要哭)。昨晚读完第二部分的时候,我又想哭。因为,我终于理解了“标准误”到底是用来干嘛的!明白了当paper中出现它的时候是说明了什么实质问题!
索性抓几个点来比较这两本教材。
1、《现代》在讲中数的时候就用到了内插法,讲百分位数的时候又讲了。可是它这两处都没有提“内插法”仨字儿,到后来好几个章节计算概率的时候却冒出来“内插法”仨字儿让人不知所云。这也就罢了,关键是,同样讲内插法,原理和方法都是一样的,《现代》用了个形式巨复杂的公式来套用,看着就不敢用了。《行为》没用公式,直接画个小表就可以口算了。
2、类似于上面的情况,在针对很多不同类型的概念和方法时,《现代》的很多习题我在做的时候都不得不翻到正文中按例题的步骤来套用,《行为》的习题基本上都是口算,也不用回顾前面的例题。
我忍不住举一个实例对比:
《现代》版某例题: 有10道正误题,问答题者答对几题才能认为他是真会,或者说答对几题,才能认为不是出于猜测因素?
《行为》版某例题: 假设你正在用请人预测从整副牌中抽出的牌的花色来测试人的特异功能。在48次实验中,一个人能正确预测多于20次的概率是多少?
这两道题的解法是一致的,考查的点也差不多。可是,前面那题纠结的提问方式我每次读到都抽搐,恨不得转换几次才能理解题意。《现代》中类似的绕心令比比皆是。更不用说《现代》版在讲解题步骤时的死板了,逼得我只能依葫芦画瓢呀。
3、《现代》版太瞧得起我们学生了,很多概念突然就冒出来了,也不告诉你怎么回事,比如“自由度”;有些概念稍微讲解了几句也没讲明白,比如“有偏统计量”它怎么就有偏了呢?再有就是我前面说的,讲了那么多讲到最后,我也搞不清楚它到底是可以用到心理学什么地方去(书中举例清一色的是学生测验之类的)。而《行为》对于很多概念都是用基本属于“一加一等于二”的方式一板一眼告诉你它的含义。还真别说它的讲法像是对待傻子,在一门新学问面前,我们不就和在幼儿园接触到“一加一等于二”之前一样无知么?受的教育再高也不保证谁就触类旁通呀。同时,它的举例涉及心理学各分支,这才是学以致用。
4、再从章节设置的顺序上,我不否认《现代》版有它的内在逻辑,但那种逻辑基本上是站在一个已经掌握了统计学的人的角度展开的。对于初学者,越往后越觉得章节之间的关系诡异。而《行为》则是完全从学习者的视角设置章节,让人能够体会到循序渐进的快乐。比如,全书四部分,第一部分讲描述统计,第二部分讲推论统计基础,而实际上,这部分的三章共就讲了三个概念:z分数、概率和标准误。放到《现代》里才三节的篇幅。可人家就是咬文嚼字地把这三个对于推论统计至关重要的概念给讲通透了,我现在一点疑问都没有了!
5、《现代》我看完一章脑细胞就基本上耗尽了,因为时不时就要停下来揣摩。而《行为》一口气看三章也没问题,就像在读小说。掌握同样多的知识,后者用的时间大概还短一些。毕竟统计学在心理学里是拿来实用的,不是要我费劲去额外训练数学的逻辑思维能力的吧。
6、另外,我不太清楚原版《行为》会有多少排版错误,但至少,《行为》译本的排版错误比《现代》要少得多。另外的另外,《行为》每章的SPSS讲解比《现代》清楚太多。另外的另外的另外,《行为》的每节小测验都附有答案,每章习题的奇数题都附有答案。
说到最后,我想引申一下。
《现代》代表了国内某类优秀教材的风格,学术至上,用语严谨,条理分明,言简意赅,同时也严肃、枯燥和死板; 《行为》代表了国外某类优秀教材的风格,学生至上,用语亲切,行文流畅,点到方止,同时也失去些许严密性、简明性和学术性。
实际上国外还有一类优秀教材,或者我更愿意称其为优秀读物。拿统计学来说有大名鼎鼎的《统计学的世界》,这类教材之所以优秀,是因为能被学院之外的大众所接受,也正是为了吸引更广泛的读者,它放开了学术门槛。我这么说并不是存在某种“歧视”,而是当其学术品质泛化后,对于专业领域的学习者而言就相当程度地失去了教材的功能,看看好玩儿罢了,既对付不了考试,更应付不了研究。
而我无疑是相当认可《行为》这类既保证了学术水准又满足“教”“材”功用的教材的。
以上仅代表个人口味,就如同文言文和白话文和网络语各有所爱。
最后的最后,热情地向所有需要在今后的学术研究中运用或理解统计学知识的各专业同学推荐此入门教材。
后续评论请见:http://book.douban.com/review/2674702/ 进阶教材推荐:http://book.douban.com/review/5322488/
一本让人看得感动的统计书 从本科到研究生,我正儿八经上过两轮统计课,但中间因为备考和数据分析,又查过几本不同的教材。从以黑白猪举例的生物统计到以精神病人举例的心理学统计,研究生期间不停的分析了几波数据,来回折腾了六七年,才敢说真的入了一点统计的门。
很多小朋友都觉得统计可怕,其实可怕的根本不是这门课,是一些不负责任的教材和漫不经心的老师们。像我本科第一次学统计时,特么的满本书都是公式,然后下面附一个让你算黑白猪体重或快慢羽鸡仔发育的差异,整本书就是做题做题,算F值,算相关系数,再做做线性回归。考完试根本不知道这门课到底干嘛的,满满的疑惑:咦,我怎么还在学数学。学完就忘了。
考研时看过甘怡群的书,这本书的最大好处是简单,轻薄,公式好记。能让人梳理一遍统计理论的流程。看完记得几个方差公式,也能正确用起来。
至于大家都推崇的张奶奶的书,我实在不敢恭维。只能说张奶奶人比书好看。
研究生时又看过帕加诺的还有舒华的,还有一堆看怎么用SPSS跑数据顺便讲统计原理的教材。我真是深深的不明白,明明很直白的东西,为什么大家都搞得这么复杂。
只有这本书,是数学弱鸡们的福音。作者掏心掏肺的给你讲,什么是差异,差异怎么衡量,一个公式,附带几种不同的演示形式,从描述统计到推论统计再到最后的非参,不用歇一口气。仔仔细细的教怎么分析怎么理解公式怎么写报告:不是算完F值就完事啊。
类似情况也发生在国人编的实验心理学、认知心理学的教材里,有时我甚至想,作者压根没打算让人懂这些内容,满满的都是汉字,却看不进去。彭聃龄的《普通心理学》除外。
这本书在参数统计部分讲的非常好,把有些统计书里根本懒得说的效应量的计算也讲得清清楚楚,这在APA报告里是必须的。但到了非参就太简单了,只介绍了一下卡方,实际上,不少数据分布是做不了参数检验的,多介绍一下非常也很重要。此外,还有一些小的例题和印刷错误。
瑕不掩瑜。看的过程常常觉得,这本书才不是教做题,教的是统计的精神。如果我看的第一本教材就是这本,也不用痛苦那么多年了。
为了学统计同时看了《行为科学统计》、《行为统计学基础》、《商务与经济统计》、《深入浅出统计学》。都是好书,但推荐前两本。第三本对公式和过程解释得不是特别简单,最后的不够系统,但是对核心概念解释得比较好,我是拿来参考不懂的概念的。本文以《行为科学统计》为主进行梳理,主要是围绕假设检验以及检验方法。更基础的概念下一篇梳理。
支撑推断统计的学科是概率论(很重要!!),因此结论都是一定概率范围内的。
一、假设检验 含义 我的理解: 从一个总体中抽出许多个大小为 n 的样本,样本均值基本遵从正态分布(中心极限定理),定义 α 的概率为显著性水平,则认为大部分的抽样均值(比例为 1-α)在零假设(H0)定义的范围之内。而若某次抽样(实验抽样)均值出现在 α 对应的数值范围内,则与我的判断不符,拒绝 H0。 (α代表范围、分布概率,z代表距离)
这部分很重要,理解了就理解了统计学的核心思想。下面的各种方法都是基于这个概念。
《行为科学统计》的解释:
关键概念:
z-score:表示每一个数值(X值)在总体分布中的位置,即距离总体平均数多少个标准差。
中心极限定理: 对于任意平均数为 υ,标准差为 σ 的总体,样本大小为 n 的样本平均数分布具有平均数 υ,标准差 σ/√n(这货是根号),并且当 n 趋于无穷时,分布将趋于正态。 样本均值的标准误差 M表示样本分布平均数(注释见最后),则M的标准误= σM= σ/√n(公式见p178) 样本平均数的 z-score: 表示从总体中多次抽样的到的多个样本均值 M 的分布,M 在此分布上的位置 标准误≠取样误差(因为它表示样本均值分布的离散度(距离平均值也是总体均值υ),而不是每次取样有可能产生的误差) 也可看作:样本与总体的差异/偶然误差
均值置信区间 两类错误 第一类错误:拒绝 H0 而 H0 为真,错误概率为α 第二类错误:不拒绝 H0 而 H0 为假,错误概率为贝塔 显著性水平:统计上的显著水平 1)表示了经处理后的样本和总体有显著差异,但不代表处理效应多大,只代表是否有效。 2)不一定是实质上的显著。因为它表示处理效应大于随机效应,随机性由标准误测得,当样本很大时,小的处理效应也可以是显著的。 处理效应 科恩d 科恩 d 值=平均数差/标准差= (M-υ)/σ
步骤 声明 H0 声明 H1 确定合适的统计量 确定显著性水平 判别合适的抽样分布 确定拒绝H0的区域 总结和分析数据 二、统计方法 (一)、平均数检验:单样本 1、z 检验(总体方差已知) z=(M-υ)/σM= (M-υ)/σ/√n 置信区间 υ=M±zσM
置信区间:已知α水平,可根据α/2求得标准正态分布(均值0,标准差1)的 z-score,(因为求区间,因此取α/2),再根据上面的公式求得置信区间。
2、t 检验(总体方差未知) 大多数情况下总体参数未知。xxx统计学家以 student 的化名发表了 t 分布。用样本方差估计总体方差。
公式
公式中的分母 sM 是一个估计的标准误,用估计的标准差 s 替代总体标准差 σ
s 如何计算呢? 总体方差 σ 平方=SS/n, SS=(总体每一数值-总体均值)的平方和,即总体数值与均值离差的平方和。
如下图是样本数值与均值的离差的平方和。它小于总体数值与均值离差的平方和。(因为总体的外延更大,会有极值没包含在样本内)
那么由于样本方差的分子小于总体方差的分子,在用样本数值估计总体方差时,改小分母,使估计精确。
因此用样本数值估计总体时,估计总体方差=s 平方=SS/n-1=SS/df
自由度:df=n-1 自由度:若一个数列15个数,平均数 u, 那么14个数可自由取值,由于均值确定,第15个数可得出,它是不自由的。因此自由度 n-1 t 分布的形态:接近于正态分布,样本越大,越接近正态分布 图 根据自由度、α值可得期望 t 值 置信区间(下述) 处理效应 科恩d值:估计的d值=平均数差/估计总体标准差=(M-υ)/sM r平方
根本假设 样本中的数值都是独立观测的 样本来自的总体必须是正态分布(n很大时,误差不大) (二)、平均数检验:双样本 1、独立样本检验 独立样本研究两个完全独立的样本。重复样本对同一样本使用不同的处理。
典型实验 研究两种教学方法的差异,一组同学使用方法一,另一组同学使用方法二。 公式
公式表示用样本均值的差异来评估总体均值的差异
双样本t检验公式含义
分母计算:
双样本t检验分母
分母 sp平方(合并方差)用两个样本平均方差来表示每个样本的方差
自由度=df1+df2=n1+n2-2 处理效应 科恩估计d=平均数差/标准差
双样本t检验科恩 r 方,同单样本检验
根本假设 每个样本中的观察都必须是独立的 两总体都必须是正态分布,但样本量大时关系不大 两总体方差相等 方差齐性检验:Hartley 检验 公式中的合并方差是两总体方差的均值,如果两总体方差不等,则这个值失去意义。 思路是:假设两总体方差相等,那么样本方差也近似。
k=独立的样本的个数(独立样本 t 检验中 k=2) df=n-1 对于每个样本来说,自由度为 n-1 ( 如果两个样本样本数不同呢?) 求值:在α,k, df, 已知时 可求的 Fmax 临界值,如果观测值大于临界值,则齐性假设无根据,小于则总体方差相等。(等于?) 若方差不等,可以进行方差修正 《基础》306 检验一般步骤(待补充) 2、重复样本检验 典型实验 对一组同学先使用某种教学方法测验,再用另一种方法,看哪种方法测验结果更好。 缺点和解决 时间因素和顺序效应:两次测试在时间上不同,变化可能是由时间引起;由于顺序问题,第2次测验可能疲惫(例如教学方法类测验) 解决:尽量抵消平衡。例如对于教学方法一二的测试。第1组被试先一后二,第二组先二后一。 公式
通过计算每个被试两次测验的差值,以这个差值作为样本数值,求均值并与总体均值比较。可看作单样本检验。
D 表示差值,sMD=独立样本检验的公式
效应大小 科恩估计d=样本差值平均数/样本标准差=MD/s r 平方,同单样本检验 检验一般步骤(待补充) t 检验中 总体均值的置信区间:
(三)、平均数检验:多样本 方差分析 和t检验的区别:
可以测量多因素 可以既有因素,又有因素的 level 可以同时进行独立测量和重复测量 例如两组被试,每一组用不同的治疗方法(独立),每一组都在3个时间点测量(重复) 1、单因素:独立测量 典型实验:对3组样本,测量3种温度条件对学习成绩的影响
公式:F=组间方差/组内方差=MS间/MS内 MS间=SS间/df间 MS内=SS内/df内 MS 表示均方,理解为方差 公式含义:处理效应引起的效应+个体差异和偶然误差/个体差异和偶然引起的效应 处理效应是否比偶然引起的效应大 公式计算: 组内方差=每组各自SS和/每组各自df和 (合并方差) 组间方差=SS总-每组各自SS和/组间df 总方差=SS总/df总
df总=N-1 N=各样本数总和 df组内=n1+n2+n3-k=N-k k表示处理条件或因素水平的个数 在这个典型实验里 k=3 df组间=k-1=df总-df组内
F分布: 起始为0,趋近于1的有偏分布。越靠右概率越小。
显著性检验:已知α和分子分母的自由度,可算出F期望。若F观测大于他,则拒绝H0
处理效应 方差分析单因素独立测量效应公式.png 方差分析中用η平方表示 事后检验:检测到底哪些处理效果起作用 Tukey 检验 公式
几个样本大小(n)必须一样 已知k, df内,α,查表得 q HSD表示差异显著时所得值,可比较每组样本均值差是否大于HSD
Scheffe 检验 最安全的事后检验
检验一般步骤
声明 H0 声明 H1 确定合适的统计量 确定显著性水平 判别合适的抽样分布(若n>30,误差不大) 确定拒绝H0的区域 计算总、组间、组内分别3个 SS 和 df -> MS组间、组内 -> F 值 若F显著,Hartley 检验方差齐性 方差齐性检验显著/不显著,先修正F,检验处理效应r方? Tukey 事后检验 根本假设同 t 检验 两个处理时 F=t方 2、单因素:重复测量 典型实验:测试不同分散注意力的情况对视觉任务的影响。对n个被试,要求在没有干扰、视觉干扰(闪光)、听觉干扰(噪音)时找出图片错误。考量3组处理,以处理为维度。 原理:
计算公式:F处理间/F误差 =处理效应+偶然误差 (没有个体差异)/偶然误差(没有个体差异) SS被试间
Df被试间=n-1(n=被试数)
F 计算步骤
处理效应
Tukey /Scheffe 事后检验 同单因素,MS误差替代 MS处理内,df误差替代 df处理内 根本假定 每个处理条件里的观察必须是独立的 每个处理内的总体分布必须是正态分布,但样本量大时关系不大 每个处理的总体总体分布的方差是大体相当的 协方差齐性,每个被试在每个处理条件中都保持一定的相对位置 检验一般步骤 3、双因素/多因素 适用场景:考虑最简单的情况 双因素 /只适用独立测量/样本大小相同/典型实验:3种温度和2种湿度对学习的影响,6种情况每种5个被试。 原理:
公式 FA=因素A方差均数/偶然误差 FB=因素B方差均数/偶然误差 FAB=不能用主效应解释的方差/偶然误差 计算步骤 计算总、处理间、处理内分别3个 SS 和 df 典型实验里,df总=30-1 df处理间=6-1 df处理内=5*6-6 计算因素A、B、交互作用AB分别3个 SS 和 df dfA=A对应的行或列数-1 dfB同理 SSAB=SS处理间-SSA-SSB dfAB=df处理间-dfA-dfB 计算MS处理内、MSA、MSB、MSAB 计算FA=MSA/MS处理内 FB=MSB/MS处理内 FAB=MSAB/MS处理内 方差分析双因素计算.png
处理效应
因素A 同 B 的公式
事后检验? 根本假定:同单因素独立测量检验=t检验 检验一般步骤 三、相关(待补充) 附:统计学符号表 υ σ M: 代表样本分布平均数,理解为单次抽样的样本均值。一个总体的许多个样本,每个样本的平均数是一个M值
p35 例2.2表格第一行,X=10,“f=2”而不是f=5
p37 小测验上面那段的最后一行,应该是“区间50到54具有实限49.5到54.5”
p126 例5.6,z分数的和是0,而不是10
p140 如果第一张卡片不是方片J,第二张是的概率为1/51,而不是1/52
p151 小测验3,应该是“恰好得到18个正面” 投诉 有用 25 没用 0有关键情节透露 25 5回应收起 苏半夏。 2011-10-01 23:07:21中国轻工业出版社2008版 如果你看张厚粲的统计已经到了死去活来的地步 那么你快看这一本吧! 这个是解救你出统计的灯塔啊!!!
所有的概念都是循序渐进,很有条理,十分清晰。 所有题目都有根有据,步骤明确。
它不会像张那本一样突然蹦出个你完全不晓得的概念。 也不会只一个公式草草打发你。
你是慢慢游进了海的中央,而不是被人噗通一声扔进海里的!
所以,如果你要应试的话,你就先看这本再去背张的公式吧, 或者你背了张的公式再来看这本理解吧。 为什么都不推荐这本书?这才是有意义的参考书嘛!
P.S:不过有些概念公式啊,是不考的,有一些和张的有些出入。 比如全距。一个用Max-min,一个用上限-下限。 孩子啊你们差一个数让我怎么办该听谁的啊!!! 愁死我了。。哎呦喂。 投诉 有用 24 没用 0有关键情节透露 24 14回应收起 ws1516_ 2016-10-02 12:05:55中国人民大学出版社2016版 行为科学统计精要读书笔记 第一部分 入门与描述统计 第1章 统计学入门 1.1 统计、科学与观察 统计学是一套组织、整合和解释信息的数学过程。
1.2 总体和样本 总体是在特定研究中所关注的所有个体的集合;描述总体的数值叫总体参数; 样本是那些从总体中选出的个体,在研究中用来代表总体;描述样本的数值叫样本统计量。 抽样误差是存在于样本统计量与相应的总体参数间的误差。 描述统计组织、整合和简化数据; 推论统计基于样本对总体做出推论。
1.3 数据结构、研究方法和统计方法 相关研究:测量两个变量,评估两个变量是否相关;通常使用相关和卡方检验的统计分析方法来评估。 因果研究:操纵一个变量(用自变量定义组别),控制其他变量(被试变量/环境变量),测量一个变量(用因变量进行比较),评估因变量的改变是否由自变量的改变引起;通常使用描述统计组织和整合每组分数,使用推论统计把样本结论推及总体。 因果研究可分为实验法和非实验法:实验包括真实操纵和严格控制;非实验使用一个既有的被试特征(例如男/女-非等效组研究)或时间变化(之前/之后-前后测研究)产生比较的组。 实验研究通常会含有控制组,这样做的目的是通过考察处理情况下的分数与无处理情况下的分数的显著不同来证明处理效应存在;被试在控制组不接受实验处理,但会接受一个中性的或安慰剂处理。 当测量过程产生数值数据,一般会计算和比较均值;当测量过程产生非数值数据,一般会计算和比较比例(卡方检验)。
1.4 变量和测量 假设建构:不能被直接观察到的内部特质; 操作定义:通过一系列操作测量外部行为,并根据结果定义构建。 离散变量:由分离的数值组成,任何两个数值之间的数值数量是有限的; 连续变量:由连续的片段组成,任何两个数值之间的数值数量是无限的; 测量连续变量时,每个测量种类必须是一个由边界定义的间隔,这个间隔的边界就是精确界限。 测量量表包括:称名量表(种类只在名称上不同)、顺序量表(种类根据方向区别)、等距量表(种类根据方向和数量或距离区别)、等比量表(有绝对零点的等距量表)。
1.5 统计符号 N代表总体中的分数数量;n代表样本中的分数数量。 ∑代表求和;∑X表示对变量X的所有分数的求和。
第2章 频数分布 2.1 概述 描述统计的目的是简化数据的组织和呈现形式,其中一个技术就是将数据转化为频数分布表或分布图,它们可以精确地测量数据或范围的数目。
2.2 频数分布表 简单频数分布表:一列列出测量数据范围(X值),一列列出频数(f);比例=p=f/n;百分比=p(100)=f/n(100)。 分组频数分布表:10个左右的分组区间最佳;组距最好是简单的数字;区间下限值最好是组距倍数;所有区间应该有相同组距。
2.3 频数分布图 频数分布图:X轴是分数,Y轴是频数。 等距或等比数据:使用直方图或多边形图;称名或顺序数据:使用条形图。 总体分布图往往有两个特征:相对频数和平滑曲线。
2.4 频数分布图的形状 形状常用来描述分数分布特征,分布形态多为对称或偏态。 尾端位于右侧的偏态分布叫正偏态分布,尾端位于左侧的偏态分布叫负偏态分布。
第3章 集中趋势 3.1 集中趋势的定义 对集中趋势进行测量的目标就是找到一个分布中最具代表性的值,以最好地描述整个分布的情况。 集中趋势的三种测量方法:均值、中数和众数。
3.2 均值 均值:将所有数据总和除以数据个数所得的值; 总体均值μ=∑X/N;样本均值M=∑X/n。
3.3 中数 中数:将分布恰好等分为两部分的数据。
3.4 众数 众数:数据分布中出现频率最高的数据。
3.5 选择测量集中趋势的方法 使用均值:等距或等比数据; 使用中数:极端值或偏态分布/不确定值/空端分布/顺序数据; 使用众数:称名数据/离散变量。
3.6 集中趋势和分布的形态 对于对称分布:均值和中数相等;正态分布众数在中间,双峰分布众数在两边,矩形分布无众数; 对于偏态分布:众数位于峰点,平均数位于靠近尾部极端值处,中数位于二者之间。
第4章 变异性 4.1 概述 对变异性进行测量的目标就是描述分数在分布中的分散或聚集的程度。 变异性的三种测量方法:全距、方差和标准差。
4.2 全距 全距:分布中全部分数覆盖的距离;最大分数(精确上限)-最小分数(精确下限)。
4.3-4.4 标准差和方差 方差:离均差的平方的平均数; 标准差:到平均数的标准距离,方差的平方根。 计算总体标准差σ的方法:找出每个分数的离均差(X-μ);给每个离均差取平方;求出各离均差的平方和SS【SS=∑X²-(∑X)²/N】;除以分数个数得到总体方差(SS/N);给方差开平方根得到总体标准差σ。 计算样本标准差s的方法:找出每个分数的离均差(X-M);给每个离均差取平方;求出各离均差的平方和SS【SS=∑X²-(∑X)²/n】;除以样本变异的自由度(df=n-1)得到样本方差(SS/n-1);给方差开平方根得到样本标准差s。
第二部分 推论统计基础 第5章 z分数:分数的位置及标准化分布 5.1-5.5 z分数的位置及标准化分布 每个X值都可被转换成z分数,z分数可以描述X值在分布中的精确位置,也可以使整个分数分布标准化。 z分数包括符号和数字:符号(+/-)表示该分数位于平均数之上或之下;数字表示该分数到平均数的距离等于几个标准差;总体:z=(X-μ)/σ;样本:z=(X-M)/s。 z分数分布与原分布形状相同,且总是平均数为0,标准差为1。 任一分布都可以进行标准化,先把原始分数转换成z分数,再把z分数转换成新的具有确定的平均数和标准差的分布。
5.6 推论统计展望 在推论统计中,z分数给特定分数在多大程度上代表它的总体提供了一个客观的判断方法:z分数接近于0表明该分数靠近平均数,具有代表性;z分数大于或小于2.00表明该分数是极端值,明显不同于分布中其它分数。
第6章 概率和正态分布 6.1 概率简介 一个特定事件A的概率被定义为一个比例:p(A)=分类为A的事件的数量/所有可能结果的数量; 这个定义只对随机样本(总体中的个体有相等的机会被选择;当多于一个个体被选择时概率保持不变)成立。
6.2-6.3 概率和正态分布 对于正态分布,可以先用z分数公式实现X值和z分数的转换,再使用单位正态分布表中查找与每个z分数值相联系的概率(比例)或者与每个概率相联系的z分数值。
6.4 推论统计展望 z分数大于或小于2.00的选择是武断的,通过概率来确定边界的具体位置更为客观。
第7章 概率和样本:样本均值的分布 7.1-7.4 样本均值的分布 样本均值的分布被定义为一个总体中可能得到的大小为n的所有随机样本的一系列M。 根据中心极限定理,样本均值分布的参数如下: a 形状 - 如果以下任意一个条件被满足,样本均值的分布将是正态的:样本来自的总体是正态的/样本量相对较大(n=30或更大); b 集中趋势 - 样本均值分布的均值(M的期望值)将等同于样本来自的总体的均值; c 变异性 - 样本均值分布的标准差(M的标准误)等于σ/√n,标准误测量了样本均值(M)和总体均值(μ)之间的标准距离。 每个M在样本均值分布中的位置能用z分数定义:z=(M-μ)/标准误; 因为样本均值的分布趋近于正态,所以能用z分数和单位正态分布表找到特定样本均值的概率。
7.5 推论统计展望 标准误测量了样本统计量和总体参数间的差异量的期望值,是推论过程中的重要元素。
第8章 假设检验介绍 8.1-8.3 假设检验的逻辑 假设检验是一个推论的过程,它使用来自样本的数据得出(检验)关于总体的结论(假设)。 假设检验(用样本均值来检验一个关于未知总体均值的假设)的步骤: a 提出假设,设定α水平 - 虚无假设提出不存在效应或者改变,备择假设与之相反,α水平通常是0.05、0.01或0.001; b 定位拒绝域 - 拒绝域被定义为虚无假设为真时极不可能出现的样本结果; c 收集数据,计算检验统计量 - 用z分数定义统计量:z=(M-μ)/标准误; d 做出关于虚无假设的决定 - 若z分数在拒绝域,拒绝虚无假设,存在处理效应;若z分数不在拒绝域,不能拒绝虚无假设,没有足够证据证明存在处理效应。 当假设检验作出一个决定时,可能犯两种错误:错误地拒绝虚无假设;没有拒绝错误的虚无假设。
8.4 有方向的假设检验(单侧检验) 当研究者希望一个处理在特定的方向上改变分数(增加/减小)时,可以做一个单侧检验,这个过程的第一步是在假设中加入有方向的预测,若预测是处理将会增加分数,虚无假设指出没有增加,备择假设指出存在增加。
8.5 测量效应大小 一个显著的处理效应并不意味着是一个大的处理效应,测量效应大小最直接的方法是Cohen's d系数。 Cohen's d系数是对均值差异的标准测量,计算公式为:d=均值差异/标准差。 d=0.2时为小效应;d=0.5时为中等效应;d=0.8时为大效应。
8.6 测量检验力 假设检验的检验力:当处理效应存在时,检验正确拒绝虚无假设的概率; 随着处理效应的增加,检验力也增加。
使用t统计量推断总体均值和均值差异 第9章 t检验介绍
非常优秀的一本统计学教材 这个评价系统能够没有再高的级数,否则打个十星也不为过。在读过国内版本的统计教材之后,这本统计教材显得更加珍贵。甘怡群的行为科学统计便是此书的简单翻译版本,尚如此畅销且被诸多学生因为经典,可见原著功力深厚。一步一步的教导,而不是像国内徐建平等人的统计教材般扔出来一个公式便作罢。 学心理学的学生两本书是必须要拥有的,一本就是此书(个人意见,当时阅读时尚未出中文版本,费很大劲才复印到英文版),另一本则是公认的舒华的因素分析。
中国的教材竟然跟外国教材差距如此之大……
又对照着甘的书和张的书翻看了第二遍了,越发的觉得这本书的难得,里面的题也非常非常好。
严重推荐啊。
7月5日
第三遍读,直接看的T检验和方差分析,发现,如果时间有限,只需要把每章后(章节总结前)的例题搞懂即可达到复习效果。
12月
通俗易懂,入门必备。只是有些地方略有瑕疵,我仅把我能发现的一些问题找出来。本人才疏学浅,如有不对之处,望指正;如有遗漏之处,望补充。
1、P28 :“学习检查 4、(但是可以至少回答有三个被试得分可能为X=73)”
2、P28 :页末 “Y轴的高度大概是X轴长度的1/3~3/4”
3、P53: “没有特殊的符号用来报告众数。故众数经常以叙述的形式来报告。”
4、P54:“1、图的高度应该接近于它的长度的三分之二或四分之三。”与P28页叙述不同。不过这不是什么大问题。
5、P56: 学习检查第4题答案“错”。正态分布一定是对称分布,中数和均值相等。
6、P57: “关注问题解决 ·众数X=3,而不是f=8.”
7、P63: “当分布中的分布数全是数字时,全距也表示为:全距=最大值—最小值+1”。这里的“1”并不准确,最好改为“精确度”。
8、P65: “定义:方差=离均差平方的平均数,即离均差的平方的平均数”。 这里没什么问题,只是觉得略搞笑。。。 “注意,计算离均差分值的过程……”
9、P82: "学习检查 2.b 答案 z=+1/2或+0.5"
10、P140: 图8-7中阴影部分“P<α”
11、P224: 小结:5.b:“随着置信水平的增加,置信区间的宽度遍大(更加不精确)”
12、P271: 右侧第5行:“应是显著的,否则你只能得出结论说观察到的平均数差异仅仅是样本误差造成的。”我猜原来的英文单词是or
只是发现了一些显而易见的小错误,书后来看的也比较快,不算太仔细。 投诉 有用 9 没用 0有关键情节透露 9 2回应收起 Raindrop 2019-05-28 10:34:11中国人民大学出版社2016版 优秀教材,有翻译欠缺和排版错误,但瑕不掩瑜 好书。有些翻译欠缺和印刷错误,但瑕不掩瑜。
边读边做书中的例题和习题,几乎无理解障碍,你会沉浸在轻松学到新知识的喜悦中。感觉是自己面前打开了另一扇了解周遭世界和社会窗口。读完这本书后,再加上吴明隆的《 问卷统计分析实务—— SPSS操作与应用 》,帮助我从对统计学一无所知,到独立完成了毕业论文的统计分析。
建议对照英文原版 Essentials of Statistics for the Behavioral Sciences 8th Edition一起看,中文版翻译有些欠缺,也有不少小的印刷错误,比如小数点点错、数字位置调换等等。中文看不明白时,查看英文原版就会明白。例如以下两个例子:
中译版第5页,样本的定义翻译为“从总体中选出的个体……” ,做为初学者会被这个翻译误导,由于是基本概念,对书本中的后续内容理解也造成困扰。无奈查阅了英文原版才恍然大悟。英文原文为“a set of individuals selected from a population…”,应该翻译为“从总体中选出的一组个体……”才比较严谨。样本不是一个“个体”,样本是指“一组个体”的集合。
第99页的正态分布等式,其中自然数e的指数部分排版错误,呈现出的是一个错误的公式(见下面中英文截图对比)。
中译版第99页,正态分布公式,自然数e的指数部分排版错误
英文原版 page 156 中的正态分布公式才是正确的。 英文版的语言非常好,使用最简单的语言解释得非常明了,言简意赅。作者对统计学有深刻的理解,又深知普通菜鸟学生的思维方式和盲点、困难在何处,深入浅出,循循善诱,恰到好处地给出善解人意的提醒和举例说明。
英文著者知道自己在做什么,不但对自己的学科领域有深刻理解,语言能力极强,态度也非常谦逊地不厌其烦耐心讲解,是真正的学者,是我们为学的表率。做学问要淡泊宁静,潜心笃志,孜孜不倦。在写毕业论文的过程中,由于自身资质和功底不够,面临不少困难和挑战,这本书的英文著者,也给了我这样的警醒和感悟;帮助我在论文研究进入瓶颈时战胜绝望和浮躁,继续前行。
也感谢翻译者们的辛劳付出,把国外优秀教材介绍了给大家。