无论是人文学科或是自然学科,经常会需要用到统计资料。然而,许多学术作者在整理数据时,往往不知如何适当地使用数据;有些作者甚至选择直接把所有数据放在文章内,造成内文过于冗长。因此,本电子报将列举三点建议,有助于您在写作中正确呈现统计数据。
1. 在内文中讨论需要的数据
许多学术作者习惯把统计数据放在表格内,却又在内文中重新整理一遍所有资料,造成读者在阅读文章时,无法快速掌握作者想表达的内容。建议将所有统计数据以表格方式呈现,仅在内文中探讨假设的统计资料来避免不必要的赘述。
举例来说,一篇探讨年纪与疾病关联性的学术文章会统计不同年龄的病患。在资料收集过程中,可能会需要记录病人的性别、职业、居住地等信息。除非文章会讨论这些因子与同年纪及疾病的关联性,否则将病人的个人信息放在内文中的表格即可,不必在内文中复述,如此既能减省篇幅,也能凸显文章的重点。
2. 关联性与因果关系
学术研究常以相关系数来表达两组资料之间的关系,并用统计检定来判断两组资料关联性的显著性。然而,有些作者会把关联性误认为是两组数据之间的因果关系。关联性和因果关系是不同的观念——这两组数据可能同时受第三组数据影响而产生关联性,但也有可能只是一种巧合。
比方说,喜欢吃糖的小孩跟高蛀牙率高度相关,但这关联性可能是受到小孩刷牙频率或糖果成分两种因素共同的影响,因此喜欢吃糖的小孩不一定会导致高蛀牙率。所以,在使用统计数据探讨关联性和因果关系时,应避免将两者混淆。
3. 避免用百分比说明比较
有些学术文章在分析统计资料时,习惯用百分比来比较两份数据的差异,象是用百分比来比较某议题的两个群体人数的支持比例。然而,百分比适合用来强调单一群体内的比例,而用百分比来比较不同群体的数据容易让读者对数据产生误会。
比方说,两份访谈分别有70%和20%的受访者赞成某议题,但第一份的受访人数只有20人,第二份却有200人,总数落差很大。因此,如果单纯以百分比强调比例上的差距就容易造成误导,让读者误以为多数受访者赞成某议题。百分比需要在告知比较基数时,才能用来比较差异性。