学术研究中经常会需要用到统计资料,无论是人文科学的访谈结果,或是自然科学的实验数据。然而,许多作者在整理统计数据时,往往不知如何适当地使用数据,有些作者甚至直接把所有数据都放在文章中,造成内文过于冗长。因此,本期电子报将列举三点建议,有助于您能在学术文章中正确呈现统计数据。
在内文中讨论需要的数据
许多学术作者习惯把统计数据放在表格内,而又在内文中重新整理一遍所有资料,造成读者在阅读文章时,无法快速掌握作者想表达的内容。我的建议是,可以将所有统计数据以表格方式呈现,在内文中只探讨涉及论文假设的统计资料即可。
举例来说,一篇探讨年纪与疾病关联性的学术文章,统计患病的不同年龄层的病人,在资料收集过程中,可能会额外记录病人的性别、职业、居住地等信息。除非这篇文章也要讨论这些因子于年纪与疾病的关联性,否则这些额外数据放在内文的表格中即可,不必在内文中重复,如此既能减省篇幅,也能凸显文章讨论的重点。
关联性与因果关系
学术研究常以相关系数来表达两组资料之间的关系,并用统计检定来判断两组的关联性具有显著性。然而,有些作者会把关联性误认为是两组数据之间的因果关系。关联性和因果关系是不同的观念,这两组数据可能同时受第三组数据影响而有关联性,也有可能只是碰巧两组数据有关连性。
比方说,喜欢吃糖的小孩跟高蛀牙率高度相关,但这关联性可能是受小孩刷牙频率或糖果成分两种因素共同的影响,因此喜欢吃糖的小孩不一定会导致高蛀牙率。所以,在使用统计数据探讨关联性和因果关系时,应避免将两者混淆。
避免用百分比说明比较
有些学术文章在比较统计资料时,习惯用百分比来比较两份数据的差异,象是用百分比来比较两个群体中,各自有多少比例的人支持某议题。然而,百分比适合用来强调单一群体内的比例,用百分比来比较不同群体的数据,容易让读者对数据产生误会。
比方说,两份访谈分别有70%和20%的受访者赞成某议题,但第一份访谈总数只有20人,第二份访谈总数却有200人,总数落差很大。因此,如果单纯以百分比强调比例上的差距,便容易造成误导,让读者误以为多数受访者赞成该议题。百分比需要在告知比较基数时,才能用作比较差异,否则百分比不适合单独用来比较统计资料。