样本数的设定,固然要考虑一般抽样原则,但也必需兼顾TEPS的主要目标:除了提供叙述性的统计数据外,更能做进一步的因果机制的分析,以回答基础研究与政策的问题。因果分析愈深入,通常需要的样本数就愈高,甚至高出一般描述性统计样本的数十倍,仍不一定有足够的统计变异量,去做精确的推论。
总样本数 --- 做为一个公用的多目的调查,我们可以想到钗h重要的研究主题,会需要3,000个以上的样本数。使用国外panel教育调查资料,而在一流社会学、经济学期刊中发表的论文,大部份分析都使用一万到两万名学生。国际上有关学校的重要学术研究,都有上千的学校数。就以美国国会于1964年立法要求执行的教育调查研究计画为例,调查对象就包括了将近4,000所学校,仅是高中学生的样本数就将近25万人,其研究报告的The Coleman Report就改写了美国近代的教育研究的历史。相对而言,我们的资料库所牵涉到的学生总数不算特别多。
学校数 ---- 就以美国教育部1988年的中学生长期追踪调查(NELS:88)而言,其资料就包括约1,000所学校及两万多名的8年级学生。我们只抽到539所学校,其中必须兼顾各级学校(国中、高中/职和五专)、各类学程、公私立、以及城乡之差异,所以从统计分析的角度来看,这个数目已经不甚理想,若要进行学校层次,较为细緻的分析,可能会捉襟见肘。其中对学生样本数的考量,是因为深入的因果分析对大样本之需求,而不是因为美国人口众多。
班级数 ---- 台湾的中学与美国的不一样,每个年级都有固定的班级,而不是随著科目而重组,因此,原则上研究者可以区分班级和学校对学生学习的效应。但因为在每所学校必须尽量多抽一些班级,才能达到有效区分的目的,所以在经费的限制下,我们每个年级约抽了1,000至1,200班(每所学校平均约四班)。其实这个班级数也只和NELS的学校数差不多,如果要与学校的效应区分的话,这样的班级数显然不算多。
每班的抽样人数 ----由于TEPS採用三个类属层次(nested groups)的设计,所以必须要有足够的学校数、班级数和学生数,才能应付未来使用者对多层次因果机制分析的需求。每一个层次在进行多变项因果分析时的统计精确性,是本计画样本设计之关键所在。为了确保一定程度的统计稳定性,再加上流失率的考量,第一波调查至少每班15人。