论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
摘要:统计已经成为当今中小学数学课程的核心内容之一。统计学的研究基础是数据,依据数据进行分析和推断。统计教育价值的核心在于逐步养成尊重事实、通过数据来分析问题的习惯,培养理解和把握随机现象的能力。中小学统计课程设计、教学设计的主线应该是,体现从收集数据到统计推断的全过程,建立统计直观。
关键词:中小学统计;课程设计;教育价值;教学
当今中小学数学增加了统计学和概率论的内容,这些内容是一种“不确定性数学”内容,与传统的“确定性数学”内容有较大区别。这使得数学教育工作者以及在教学一线的广大教师普遍感到不适应。
统计的基本思想方法是什么?解决统计问题的基本途径是什么?中小学统计课程、教学中应当突出的重点是什么?中小学统计的教育价值是什么?带着这些迷茫和困惑,我们进行了较长时间的专题访谈和深入研讨。
访谈对象:史宁中教授(以下简称史教授)。
访谈形式:专题访谈,三人对话以及多人参加的讨论班式的访谈;辅以资料查询。
一、统计及其基本思想与方法
(一)什么是统计学
问:一般认为,“统计学”这个词源于拉丁语的“国情学”,原是国家管理人员感兴趣的事情。《大不列颠百科全书》对统计学下的定义是:“统计学是关于收集和分析数据的科学和艺术。”陈希孺院士认为:“统计学是有关收集和分析带有随机性误差的数据的科学和艺术。”
史宁中教授,作为统计学家,您是如何认识统计学的?
▲ 史教授:我们先来简单地回顾统计学的历史是有益处的。正如拉丁语所说,统计原本就是收集和分析国家管理中需要的各种数据,比如国民收入、各种税收。为了直观,人们才发明了各种报表、直方图、扇形图等等。可以看到,这种传统意义上的统计学现在仍然是非常重要的,这也是我们现在小学统计教学中的主要内容之一。后来到了14世纪左右,随着航海业在欧洲兴起,航海保险业开始出现。为了合理地确定保险金与赔偿金,需要了解不同季节、不同路线航海出现事故的可能性的大小,需要收集相关的数据,根据数据进行分析和判断,这被称为是近代统计学的发端。到了19世纪末、20世纪初,人们把数学、特别是概率论的有关知识引入到统计学,构建了统计学的基础。与古典统计学相比,虽然二者都是对于数据的收集和分析,但是却有本质的不同,因为后者进行分析的基础是“不确定性”,我们称之为“随机”。
到了现代,人们发现,对于大量数据的分析,采用随机的方法不仅方便而且准确。比如,对于国民收入,我们可以动用大量的人力来收集数据,但是谁都知道这样的数据不可能是准确的,远不如我们依据某种原则划分出地区和人群,然后抽样、加权求和准确。再比如,对于股票市场,一天交易之后,可以得到精确的交易总量,但是人们宁可用部分核心企业的股票交易量来反映股票的变化,这便是“恒生指数”“上证指数”等等。特别是到了21世纪,银行、保险、电信,以及材料科学、基因组学等新兴学科的实验中涉及大量数据,其分析更需要借助随机方法了。我想,大概就是因为这些原因,国家才决定在现在中小学数学的教学中加入统计学的内容。
因此,你们谈到的关于统计学的定义都是可以的。但是,要把握统计学的根本思想方法却是非常困难的。
问:那么,您认为统计学的基本思想方法是什么呢?
▲ 史教授:这是一个不容易回答的问题。对于统计学的掌握很大程度上依赖于“感悟”,需要较长时间的理解与实践。我们先来回顾一下中小学传统数学的教学内容。这些内容主要是对日常生活中见到的图形和数量的抽象,研究的问题是图形的变化与计算法则,研究的基础是定义和假设,研究的方法主要是归纳、递归、类比和演绎推理。
统计学则不同。如我上面谈到的,统计学是通过数据来进行分析和推断的。因此,统计研究的基础是数据。这些数据的特点是,对于每一个数据而言,都具有不确定性,我们需要抽取一定数量的数据,才可能从中获取信息。因此,统计学的研究依赖于对数的感悟,甚至是对一堆看似杂乱无章的数的感悟。通过对数据的归纳整理、分析判断,可以发现其中隐藏的规律。因为可以用各种方法对数据进行归纳整理、分析判断,所以,得到的结论也可能是不同的。而且,我们很难说哪一种方法是对的,哪一种方法是错的,我们只能说,能够更客观地反映实际背景的方法要更好一些。比如,我们希望知道某公司员工的收入情况,可以用平均数也可以用中位数,很难说哪个方法对哪个方法错。事实上,如果收入比较均衡,用平均数要好一些;如果收入比较极端,用中位数要好一些。当然,最好的方法是对收入情况进行分类,但是分类的方法又有好坏之分。我们可以看到,统计学关心更多的是好与不好,而中小学传统数学关心更多的是对与错。
因此,统计学的基本思路是,根据所关心的问题寻求好的方法,对数据进行分析和判断,得到必要的信息去解释实际背景。
(二)统计学的研究对象
问:我们对于统计学有了一定的了解。从您的谈话中我们感觉到,统计学似乎是包罗万象的。那么,统计学到底研究什么呢?
▲ 史教授:是这样的,统计学的应用面非常广,凡是涉及数据分析的都可以成为统计学的研究领域。特别是到了近代,人们希望更加精细地了解实际背景,更多地借助数据分析,甚至人文科学也是如此,并且逐渐形成了专业的研究领域,比如计量经济学、计量社会学、计量教育学、计量心理学等等。这些研究领域分析方法的基础大体是统计学。统计学并不研究某一个领域的具体内容,在本质上只是研究数据分析的方法,这包括创造新的方法,也包括分析方法的好坏、分析方法的适用条件。
问:你能否结合中小学统计的内容谈得更具体一些?特别是,在统计教学过程中,应当把握的基本原则是什么呢?
▲ 史教授:可以。在统计研究中首先遇到的问题是如何获取“好”的数据。所谓“好”的数据是指那些能够更加客观地反映实际背景的数据,而要获取得好的数据则要依赖于“好”的方法。根据数据的不同,方法主要分两大类,一是通过调查收集数据,二是通过实验制造数据。中小学统计教学中涉及的主要是前者,称为抽样调查(而后者通常被称为实验设计)。抽样调查又包含两个方面,一个是对已经存在的数据的收集,称之为抽样,比如市场的物价、学生的身高、企业的产值等等;另一个是需要我们了解才能够获取的,称之为调查,比如美国总统的民意支持率、人们日常消费的主要项目、中小学生喜欢的歌手等等。
根据问题的不同,所要采用的方法也可能不同,但是要建立两个基本原则。第一个基本原则是,采用能够获取“好”的数据的方法。为了获取好的数据,我们需要尽可能多地利用对于实际背景已有的先验知识。比如,希望知道学生的身高,先验知识是“年龄之间差别很大”。因此,最好是根据年龄段学生数的多少按比例抽取样本,我们称这种方法为“分层抽样”。可以看到,统计方法的直观想法是很明显的。如果对于实际背景一无所知,那么,一定要随意抽取样本,这便是“随机抽样”。比如,希望知道学生喜欢的歌手,因这些学生年龄之间差别可能不大,就可以采取“随机抽样”。当然,也可以用“分层抽样”,但是要麻烦得多。第二个基本原则是,采用简单的方法。能够基于上述两个原则的方法就是一个“好”方法。我们不要小看第二个原则,一个好的方法往往能够节省很多调查经费。这就是为什么咨询公司非常欢迎统计学家的原因。
问:刚才你提到了“样本”,许多教师对这个概念总是感到费解。
▲ 史教授:是的,这个概念很难把握。样本实质上就是数据,但是,统计学中涉及的数据往往是具有随机性的。还是回到“学生的身高”这个问题上来。在抽样之前,我们并不可能知道具体数据的大小,这些数据对于我们是随机的;为了讨论出一个好的方法,我们假想能够得到这些数据,并且假想这些数据的出现是依据某种规律的,这种规律就是数据出现的可能性的大小,我们称之为“概率”。比如,高年级学生出现大数据(高个子)的可能性要大于低年级学生,就是说,出现大数据的概率要大。但是,只有当抽样之后,我们才能得到真实的数据,才能进行实质的计算与分析。这样,我们所要研究的数据既具有随机性又具有真实性。为了方便起见,我们称这样的数据为样本。
问:根据你的阐述,统计学怎么有一些哲学式的思考呢?
▲ 史教授:你们理解到了根本。这是统计学与中小学传统数学的最大区别。传统数学可以根据假设和规定的原则进行计算或者推理,但是统计学往往要问你所采用的方法是不是有道理,是不是还有更为合理的方法。不过,传统数学是统计学不可缺少的工具。
问:是不是因为统计学需要计算呢?
▲ 史教授:不仅仅如此,判断统计方法的好坏很大程度上也是依赖传统数学的。
问:你能不能结合中小学统计课程、教学,谈得更具体一些?
▲ 史教授:可以。假如我们得到了数据,由于数据看起来是杂乱无章的,就需要进行必要的整理,整理的实质是对大量的数据进行“压缩”。根据问题的不同,压缩的方法也有所不同。比如,希望知道学生的平均身高,称之为“总体均值”。我们可以计算样本的平均数,然后用样本的平均数去估计总体均值。样本平均数就是对于数据的一种压缩方法。当然还可以用其他的方法,比如计算中位数,或者计算最大数和最小数的平均数。那么,哪一个方法要好一些呢?虽然我刚才谈了平均数和中位数的使用条件,但这仅仅是一种描述性的。对于数据压缩也有一个原则,就是不能失去我们所要研究问题的信息,满足这个条件的压缩后的值被称为“充分统计量”。这个原则的数学表达需要借助“条件概率”,涉及很深的数学。因此,统计学需要哲学的思考,也需要严格的数学推理。事实上,对于总体均值,上面的三个压缩后的量中只有样本平均数是充分统计量。直观地想,样本平均数以局部的特征估计总体的特征,可能要好一些。这是因为,虽然样本平均数依赖样本的选取也是随机的,但是我们可以想象,当我们反复取样本计算时,这些样本平均数应当在总体均值附近摆动。当然,我们还可以建立其他的准则来判别方法的好坏,只要这个准则是合理的。比如,我们可以验证,样本平均数是使“与所有数据差的平方的和达到最小”的数;样本中位数是使“与所有数据差的绝对值的和达到最小”的数。这两个准则都是有道理的。
共2页: 1
论文出处(作者):