仙一网 - 文献资料 - 医学书籍 - 预防医学

第十七章 统计表和统计图

  统计表和统计图都是将已整理的资料用简明的表格或图形表达出来,使人获得明晰而直观的印象,避免冗长的文字叙述,便于比较分析。

  一、统计表

  统计表(statistical table)是从整理表中选出需要的资料,经过统计加工为各种指标后,列成便于对比分析的表格。

  (一)统计表的结构和要求

  表的结构要简洁,最好一事一表,避免臃肿庞杂。

  例17-1 吴氏等研究某些疾病发生高催乳素血症的频率,结果归纳如表17-1。

表17-1 高催乳素血症的发生率

诊断 总例数 高催乳素血症例数 发生率(%)
嫌色细胞瘤 80 62 77.5
肢端肥大症 41 17 41.5
蝶鞍部其他肿瘤 29 10 34.5
原因不明闭经 67 14 20.9
月经量少 20 3 15.0
单纯泌乳 5 0
精神分裂症 1 1

  资料来源:吴建中等 中华妇产科杂志20:34,1985年

  以该表作为典范,说明统计表的结构特点:

  1.标题 简练,用词确切,能表达中心内容,左侧有表号以备查考(必要时还应标明资料来源和时间)

  2.标目 有横标和纵标目,横标目又称主辞,是研究事物的,通常位于表内左侧;纵标目的是研究事物的,又称宾辞,列在表内上方,其表达结果与主辞呼应,读起来就是一完整句子。例如第一行可读成:“嫌色细胞瘤80例,有62例出现高催乳素血症,发生率77.5%。”

  3.线条 力求简洁,该表除有较粗的顶线和底线外,表内只有一条隔开纵标目的的细横线,简单明了。

  4.数字 位置上下对齐、准确、率的小数点后所取位数也上下一致。该表最后两个率因为构成的绝对数太小,作者在发生率栏中用“…”来表示,这是对的。一般如果某格无数据或暂缺资料,也可用“-”或“…”来表示。

  5.内容排列 一般按事物发生频率大小顺序来排列,对比鲜明,重点突出。

  (二)统计表的种类

  常用的有四种:

  1.简单表 常用以比较互相独立的统计指标,主辞未经任何分组。表17-1即属简单表。

  2.分组表 主辞按一个标志分组,结构形式与简单表基本相似。通常设有合计栏,以利说明综合水平。

  例17-2 1984年上海县随机抽查30岁以下的正常人群的麻诊免疫水平,共检查733人结果统计如表17-2。

表17-2 1984年上海县部分健康人群麻疹抗体

年龄(岁) 检测人数 阳性人数 阳性率(%) 平均滴度之例数
0~ 124 123 99.2 43.52
5~ 141 141 100.0 37.64
10~ 147 147 100.0 21.43
15~ 109 102 93.6 15.50
20~ 91 89 97.8 17.94
25~ 121 119 98.3 19.78
合计 733 721 98.4 25.14

  资料来源:郑平等 上海医科大学学的增刊53页,1987年

  表17-2的主辞是按年龄分组的调查对象,亦就是按年龄一个标志分组,所以属于分组表。

  3.复合表 主辞按两个以上标志分组。在安排上可将部分主辞放在表的上方,与宾辞配合起来。

  例17-3 胡氏介绍改良阴道纵隔手术治疗子宫脱垂132例,疗效统计表如表17-3。

表17-3 132例子宫脱垂手术前后症状比较

 

症状

手术前 手术后
例数 % 例数 %
下坠感 126 95.45 13 9.85
性生活不满意 123 93.18 3 2.27
腰酸痛 47 35.60 9 6.82
排尿困难 36 27.27 0 0
压力性尿失禁 17 12.88 0 0

  资料来源:胡丽华 中华妇产科杂志20:56,1985年

  复合表是否需要合计应从有无意义来决定

  4.列联表 把数据资料列成交叉分类的表格,使一种属性的亚类以水平方向(行)表示,另一种属性亚类以垂直方向(列)表示。这样行变量与列奕量之间的联系便显示出来,并加以检验。最简单的列联表是四格表(2×2表);还有多维分类形式的列联表。

  例17-4 罗氏等应用国产放射免疫检测试剂“北方RIA”与进口试剂“AUSRIA”对肝癌发高发区居民乙型肝炎表面抗原(HBsAg)进行配对检测,结果统计如表17-4。

  该表资料可以应用配对x2检验法作进一步分析,具体方法将于第二十章介绍。

表17-4 两种试剂检测HbsAg结果比较

北方RIA 进口AUSRIA 合计
+ -
+ 244 107 351
- 149 1146 1295
合计 393 1253 1646

  资料来源:罗斯等 肿瘤论文汇编125页,1987年广西壮族自治区

  二、统计图

  统计图(statistical diagram)一般是根据统计表的资料,用点、线、面或立体图像鲜明地表达其数量或变化动态。医学统计常用的有线图、直方图、长条图、圆形图和统计地图等。

  (一)制图通则

  1.根据资料性质和分析目的正确选用图形。

  2.要有确切的标题和编号,其位置通常安排在图体下面。

  3.在同一图内比较几种不同的事物时,须用不同的线条或颜色表示,并附图例说明。图例位置要与图体协调、美观;如有碍于形象,则不要放在图体内。

  4.有纵轴和横轴为坐标的图形,一般都以第一象限为准则作图,以两轴交点为起点,纵、横轴都应有标目,并注明尺度的数量单位。

  (二)医学常用统计图及绘制法

  1.线图(line diagram)

  (1)适用于连续变量资料。说明某事物因时间、条件推移而变迁的趋势。

  (2)横轴常用以表示某事物的连续变量,纵轴多表示率、频率或均数。

  (3)纵轴采用算术尺度,从零开始。如果图形的最低点与零点差距很大,则可在纵轴基部作折断口,使线段降低以求美观。横轴可以不从零开始,如果以组段为单位,则每组均以组段下限为起点。但绘图的坐标点则应以组段中点为宜。

  (4)同一图内不宜有太多曲线,以免混淆不清。如有几条线作对比,则用不同线形来区别,并有图例说明。

  例17-5 根据成都学龄前儿童生长发育的3年追踪调查,身高的年增长值按性别分组统计比较如表17-5和图17-1。因为身高发育是连续性变量资料,用曲线图来表示是适宜的。该图很微妙地反映出儿童少年生长发育期的规律:女孩身高从8岁起增长很快,10岁左右达到突增高峰。男孩则在10岁起才迅速增长,13岁左右达突增高峰。这和生理上女孩青春期了育比男防早一些,是十分吻合的。

表17-5  1979~1982年成都学龄前儿童身高年增长值(cm)

(岁)
人数 均数 标准误 人数 均数 标准误
7~ 72 5.90 0.93 108 6.07 0.94
8~ 198 5.88 1.01 213 5.42 1.58
9~ 322 5.17 1.13 234 6.18 1.84
10~ 351 5.26 1.53 338 6.78 1.72
11~ 356 6.49 2.30 370 6.59 1.72
12~ 322 7.72 2.45 316 5.13 1.96
13~ 296 7.93 2.38 293 3.75 2.16
14~ 266 4.55 2.61 200 1.46 1.27
15~ 173 3.16 2.12 121 1.24 1.10

  资料来源:张兴儒等 中华预防医学杂志21(6):338,1987年

图17-1 成都市男女学生平均身高年增长值曲线

  另外不有一种线图叫半对数线图(semilogline diagram),纵轴用对数尺度,横轴仍用算术尺度。这种图常用于比较两组相对数的比值相差较大的动态数列。原因是同样的增长速度在对数尺度上的距离是相等的。例如表17-6中的三组数据,由时间A到B分别绘在算术格纸(图17-2a)和半对数格纸(17-2b)上,呈现两种不同的结果。a图三条直线坡度相差悬殊,这是三组数据的绝对差相差悬殊之故;b图则因三组数据的对数差相等,下降坡度亦一样。

图17-2 三组数据绘在算术(a)和半对数(b)格纸上的线图比较

表17-6 绝对差与对数差的比较

A→B 绝对差(A-B) 相对比(A/B) 对数差(IgA - IgB)
1000→100 900 10 Lg1000-lg100=3-2=1
100→10 90 10 Lg100-lg10=2-1=1
10→1 9 10 Lg10-lg1=1-0=1

  下例进一步说明半对数线图应用的实际意义。

  例17-6 美国疾病控制中心(CDC)报道,自从应用白喉类毒素作为儿童常规免疫接种后,白喉发病率和死亡率明显下降,但病死率仍停留在一定水平上。三者动态变化表达如图17-3。

图17-3 应用类毒素免疫接种后的白喉发病率、死亡率和病

 死率的动态变化比较(1920~1975年)

(资料来源:CDCNo.12,1978,Atlanta,Ca,USA)

  该图很形象地表明在55年内白喉发病率和死亡率下降速度基本一致。但两组数据的前后绝对差却很悬殊,如果用算术格纸来描绘,直观上将产生发病率下降坡度明显大于死亡率下降的错觉。图中还反映了白喉病死率自1920~1970年间变化不明显,与白喉死亡率不同;这里存在两个率的含义不同的原故,本教材的第二十四章将予阐明。

  2.直方图(histogram)

  (1)直方图是以面积表示数量,适用于表达连续性资料的频数或频率分布。

  (2)横轴表示变量,尺度可以不从零开始。同一轴上的尺度必须相等。

  (3)作图时各直条的宽度应等于组距,高度应等于该组的频数或频率。组距相等的分组资料才能作图,否则应先换算成相等组距。以下是120例T3比值频数表作图(图17-4)。

图17-4120例正常血浆结合

125I-Ts树脂摄取比值分布

  将各组直方的顶端中点相连,即成多边图,也可用来表示连续性资料的频数颁布情况。

  3.直条图(bar chart)

  (1)直条图是用等宽直条的和长短来表示各统计量的大小,适用于彼此独立的资料互相比较,有单式和复式两种。

  (2)作图时,一般是以横轴为直条图的基线,纵轴表示频数或频度,从零开始;直条间的距离一般以条宽的1/2为宜。排列顺序若非自然顺序资料,则按由高到低的次序排列,便于比较。

  (3)复式直条图的制图要求与单式相同,但每组的直条最好不要过多,同组直条间不留空隙,组内各直条排列次序要前后一致。

  例17-7 上海县统计了1960~1962年和1978~1980年两段时期的居民前10位死亡原因。现将其中可配比的9对资料绘成直条图(图17-5)比较如下。

图17-5 上海县居民在1960~1962年与1978~1980年间

死亡原因变化的比较

资料来源:GuXingyuan et al ,AJPH72(Sup.)p.22,1982

  该图给人的鲜明印象是原居首位的传染病死亡率与第6位的恶性肿瘤死亡率互易位;同时脑血管病和心脏病分别进到第2位和第3位。

  4.百分条图(percentchart)

  用以表达构成比的图形,绘制简便,而且可将多条并列作比较,以阐明疾病的动态变化。

  例17-8 某矿采用湿式作业,粉尘浓度明显下降。若干年后,新发矽肺减少,历年存活矽肺患者的期别也随之发生变化。作者根据表17-7统计资料绘制百分条图比较如图17-6。

  5.圆形图(circulargraph)

  用途同百分条图,是以圆的半径将圆面分割成多个大小不等扇形来表达构成比。作图法是先将各个百分比乘以3.60,获得圆心角度数,按其大小排列从0时开始,且量角器顺时针方向划分为一系列扇形。图17-7是某厂某年工伤分析百分比图。

表17-7 某矿1961~1965年矽肺患者期别构成比

矽肺分期 1961年 1962年 1963年 1964年 1965年
例数 % 例数 % 例数 % 例数 % 例数 %
48 50.5 54 47.8 61 43.9 64 41.3 67 39.9
33 34.7 41 36.3 53 38.1 60 38.7 66 39.3
14 14.8 18 15.9 25 18.0 31 20.0 35 20.8
合计 95 100.0 113 100.0 139 100.0 155 100.0 168 100.0

图17-6 某矿1961~1965年各期存活矽肺构成比的动态

图17-7 某年某厂工伤病例百分比

  6.点图(scatterdiagram)

  表示两种事物变量的相关性和趋势。医学上常用于观察两种生理指标之间的动态变化关系,或临床上两项检测结果之间的量变关系。点图绘测方法是先绘出适学的坐标,一般以两轴正交点为0点,但也可按两变量的全距中最小值起点加以高速调整。x变量定在横轴,y变量定在纵轴;然后将每受检者测得两变量值,找出P(x,y)所在的方位,并绘出各自的坐标点。最后根据点的颁布情况进行分析。

  例17-9 某中学测得最高年级100名男生身高、体重的结果,绘成点图如图17-8。

  7.疾病状况动态结构图

  是有目的地观察几种主要病伤类别构成的动态,从而评价卫生工作效果,指导以后工作的规划和策略。图17-9是美国1900~1973年间11种主要传染病历年占总死亡率百分比的动态;从1900年占40%到1970年仅6%;相应的中风、肿瘤和心脏病在该期间从20%上升到59%;意外事故死亡所占比重则变化不大。

  以上只介绍几种常用统计图、表范例和绘制通则,读者可根据资料内容和需要灵活运用和发展。

图17-8 某年某校100名男生身高体重相关图

图17-9 1900~1973年间美国传染病和慢性疾病死亡率构成动态变化