reading-notes

张俊的读书笔记

View project on GitHub

统计学入门

统计、科学与观察

统计服务于两个目的

  1. 统计用于整理及总结信息,使得研究者看出在研究中发生了什么,并与其他研究者交流结果。
  2. 统计帮助研究者回答了引出研究的普遍问题,它根据获得的结果来确定结论究竟是什么。

统计指整理、总结并解释信息的一系列数学过程。

总体与样本

  • 总体是在一个特定研究中所有感兴趣个体的集合。
  • 样本是从一个总体中选择出来的个体的集合,通常在研究中被期望代表总体。
  • 参数是一个值,通常是一个数字值,它描述了一个总体。参数可以从单个测量中得到,或从对总体的一组测量中推导出来。
  • 统计量是一个值,通常是一个数字值,它描述了一个样本。统计量可以从单个测量中得到,或从对样本的一组测量中推到出来。

通常,每个总体参数都与一个样本统计量相对应。

  • 数据是测量或观察,它通常被称为一个分数或原始分数。
  • 描述性统计是用于总结、组织并简化数据的统计过程。
  • 推论性统计是允许我们研究样本,然后将研究结果推广至样本来自的总体的技术。
  • 取样误差是存在于样本统计量和总体参数间的差异或误差的数量。

统计在研究中的应用:

数据结构、研究方法与统计

  • 变量是一种针对不同个体具有不同值得特性或条件。
  • 常量是一个特性或条件,它不会变化,并且对每一个个体都是相同的。

相关法

相关法中,观察两个变量并确定它们之间是否存在关系。

实验法

一种比较不同组的分数的特殊研究方法被称为实验法。它有两个特性:

  1. 操纵。研究者操纵一个变量,将它的值从一个水平变化至另一个水平。然后观察(测量)第二个变量,来确定这种操纵是否导致了变化的产生。
  2. 控制。研究者必须控制研究情况,使得其他无用的变量不能影响需要研究的变量关系。

实验法中,操纵一个变量并观察或测量另一个变量,为了建立两个变量间的因果关系,实验需要控制所有其他的变量,使它们不会影响结论。

实验法的术语

  • 自变量是被研究者操纵的变量。在行为研究中,自变量通常由被试参与的两个(或多个)处理条件组成。自变量由在观察因变量之前就操纵好的“前”条件组成。
  • 因变量是被观察的那个变量,用于评估处理效应。
  • 控制条件中的个体不接受实验处理。他们或者不接受处理,或者接受一个中立的,安慰剂性质的处理。控制条件的目的是提供与实验条件相比较的基准。
  • 实验条件中的个体接受实验处理。

非实验与准实验法

很多研究对两个组进行了比较,但是,这两组不是通过操纵自变量得到的。相反,这些组通常由被试变量(如男性与女性)或是时间变量(如处理前与处理后)决定。在这些非实验研究中,决定组别的变量被称为准自变量

变量与测量

构念与操作定义

构念是内部属性或特性,它不能被直接观察到,但是可以描述并解释行为。

操作定义是一个测量过程(一系列操作),它测量了外部行为,并使用测量结果作为定义和对假设的构念的测量。注意,操作定义有两个部分

  1. 它描述了一系列测量构念的操纵;
  2. 它用测量结果定义了构念。

离散变量与连续变量

离散变量由不同的、不可分割的类别组成。在两个相邻的类别之间不存在其他的值。

对于连续变量,在任意两个观察到的值之间都存在着无限多个可能的值。一个连续变量可以被分割为无限个小数部分。

实限是可以被表示为一条连续数据线上数值组成的区间的界限。将两个相邻数值分开的实限恰好位于这两个数值的中点。每个数值都有两个实限。上实限是区间的顶边,下实限是区间的底边。

测量量表

测量包括了将事件分类(定性测量)或使用数字描述事物的大小(定量测量)。

  • 称名量表由一系列具有不同名称的类别组成。称名量表的测量将观察的对象分类并贴上标签,但不对观察做任何定量的分析。
  • 顺序量表由一组按顺序排列的类别组成。顺序量表的测量将观察的对象按大小排序。
  • 等距量表由排序的类别组成,这些类别都是完全相同大小的区间。在等距量表中,量表上数字之间的差异等价于量上的差异。然而,大小的比例没有意义。
  • 等比量表是一种等距量表,并且有一个绝对零值。使用等比量表,数字的比例可以反映量上的比例。