《女士品茶》

下载本书

添加书签

女士品茶- 第10部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
Ω萌绾稳プ龅钠羰荆嘉丛鱿衷诜研摹把钡摹⒁嗷蚱渌裁慈说闹髦小K允褂谩案怕实ノ弧保╬robit)这个词,是因为他的模型建立了“杀虫剂的剂量”与“使用该剂量时一只虫子会死掉的概率”这两者间的关系。他的模型中生成的最重要的参数谓之“半数致死剂量”(50 percent lethal does),通常用“LD50”来表示,是指杀虫剂能以50%的概率杀死虫子的剂量。或者说,如果施用这种杀虫剂来对付大量的虫子,那么用“LD50”的剂量,将有50%的虫子被杀死。布利斯模型的另一个推论则是:对一只特定的用做实验标本的虫子,要确定杀死它所需要的剂量是不可能的。
布利斯的概率单位分析已被成功地应用于毒物学(toxicology)。从某种意义上说,源于概率单位分析的认识已经形成了毒物学这门科学的主要基础。16世纪的医师P?A?帕拉赛瑟斯(P。 A。 Paracelsus;14931541)有一句名言:使用过量,什么都是毒药。概率单位分析为帕拉赛瑟斯首创的这个信条奠定了数学基础。按照帕拉赛瑟斯的这个信条,只要剂量足够大,任何东西都可能成为毒药;而只要剂量足够小,任何东西都是无害的。而布利斯则为了这个信条增加了与那些个案结果联系在一起的不确定性。
之所以会有那么多愚蠢的吸毒者,在古柯硷、海洛因或安非他命的作用下,或已毙命于街头,或变得极度虚弱,原因之一就在于,他们看到其他人同样服用这些毒品却没有死于中毒。他们就如同布利斯实验用的那些虫子,环顾四周,看到有些同伴依然活着。然而,即使知道某些个体还活着,也无法确定一个给定个体能否幸免于一死。我们根本没有任何办法能够预见某一独特个体对药物剂量的反应。就像皮尔逊统计模型里的那些个别观测值一样,它们都不是科学研究所关注的“事件”。惟有那些抽象的概率分布及其参数(如LD50,半数致死剂量)才是能够估计的。
布利斯的概率单位分析一经提出 ,其他研究人员也跟着提出了各种不同的数学分布。现代用来计算“LD-50”半数致死剂量的计算机程序,通常都会提供几种不同的模型让用户选择,这些模型都是在布利斯的原创基础上经过改进之后提出来的。用实际数据所做的研究表明,尽管在估计非常低的概率时,如“LD10”,由这些不同模型得出的估计值是有差别的,但在“LD50”上的估计值都非常接近。
我们完全可以运用概率单位分析或选择其他模型来分别估计一个不同的致死剂量,如“LD25”或“LD-80”(25%的死亡剂量,或80%的死亡剂量)。不过,离50%点越远,就越需要更大规模的实验才能得到理想的估计值。我自己就曾参与过一项研究,要确定某种能在老鼠身上致癌的化合物的LD01(1%的致死剂量)是多少。我们的实验用了65000只老鼠,最终的分析结果表明,我们还是没能得到使1%老鼠致癌的化合物剂量的理想估计值。依据那项研究的数据推算,要想得到一个可接受的LD01的估计值,我们得需要几亿只老鼠!

布利斯在列宁格勒
C?布利斯在概率单位分析上的开创性研究,到1933年却被迫中断了。那年,弗兰克林?D?罗斯福(Franklin D。 Roosevelt)当选为美国总统。在竞选总统期间,罗斯福明确声称是联邦政府的赤字导致了经济萧条,并且保证他当选后会消减政府赤字,缩小政府部门的规模。虽然这并不是“新政”(the New Deal)最终的行为,却是竞选的诺言,因此这位新总统就职之后,他的一些内阁成员就遵照总统的竞选诺言,开始解雇一些非必要的政府工作人员。
那位协助农业部副部长负责研制新式杀虫剂工作的助理,当他在视察这个部门所做的工作时,发现有人居然不到有虫子的田间去做实验,反而无聊地躲在实验室里不厌其烦地用杀虫剂来做实验。于是,布利斯的实验室被关闭了,布利斯也被解雇了。当时正值严重的大萧条时期,他发现自己根本找不到工作。尽管布利斯曾发明了概率单位分析,但对于一个失业的昆虫学家,特别是一个与实验室的昆虫,而不是野外的昆虫打交道的昆虫学家来说,找不到工作实在是不足为奇。
布利斯与费歇尔取得了联系。费歇尔刚刚在伦敦得到一个新职位,他答案举荐布利斯,并给他一些实验设备,不过他不能给他一个工作岗位,因此也没有办法付给这位美国昆虫学家工作报酬。尽管如此,布利斯还是不得不去了英国。他与费歇尔及其家人一起住了几个月,并与费歇尔一起协作进一步完善了概率单位分析的方法论。费歇尔在布利斯的数学去处中发现了几处错误,并提出修改建议,得到的最终统计结果更为有效。布利斯按照费歇尔的修改建议,发表了一篇新论文。而费歇尔也把那个必不可少的统计表,补充编到他自己与弗兰克?耶茨(Frank Yates)联名写的有关统计表的那本书的新版中去。
布利斯在英国住了不到一年,费歇尔就为他找到了一份新工作,是在苏联的列宁格勒植物研究所(Leningrad Plant Institute)。试想一下,这个来自美国中西部地区中产阶级家庭、对政治漠不关心、而且永远不会学第二种语言的又高又瘦的家伙,随身带着只装了几件换洗衣服的一个小行李箱,乘火车只身穿越欧洲大陆,终于到达列宁格勒火车站时的情景。而那时的俄国恰逢斯大林领导下的大清洗运动。
布利斯到达列宁格勒之后不久,聘请他来苏联的那个人的老板就被召到莫斯科去了,而且从此销声匿迹。一个月之后,那个聘请布利斯来苏联的人也被召到莫斯科去了,而且在返回途中“畏罪自杀”。负责布利斯旁边那个实验室的主管,也在某一天仓惶弃职,穿过拉脱维亚边境逃出了苏联。
就在这个时候,布利斯认真着手展开他的实验工作。他选了几组俄罗斯本地的害虫,用各种不同化合成分的杀虫剂来对这几组害虫进行试验,算出其概率单位极其“LD50”半数致死剂量。他在研究所附近的房子里租了一个房间,他的俄罗斯女房东只会说俄语,而布利斯只会说英语。不过他告诉我,用各种手势加上亲切的微笑,他们相处得相当融洽。后来,布利斯遇见了一个来自美国的年轻女人,她为了投身于俄国伟大的共产主义实践,中断大学学业,满怀着年轻人的理想主义和马克思列宁主义的盲目崇拜来到苏联。她把可怜的只会说英语的布利斯当成好朋友,帮他购物、熟悉环境。此外,她还是当地的一个共产党员。党组织对布利斯的一切了如指掌,他们知道他何时受聘,何时抵达俄国,住在什么地方,以及在实验室里都做了些什么。
有一天,那女孩告诉他,党员里有些人已经认定他是美国间谍。她竭力为布利斯辩护,向他们解释布利斯是个单纯而又天真的科学家,只热衷于自己的实验。但是这些猜疑已经通报给了莫斯科当局,他们已经派出了一个委员会到列宁格勒来进行调查。
调查委员会就在列宁格勒植物研究所召开审查会,把布利斯叫来面对他们接受审问。当他走进审问室的时候,已经知道调查委员会里每个人的身份了,当然是他的女朋友透露的。他们几乎还没来得及调查完最初的几个问题,就在这时,布利斯对他们说:“我看到某某教授也坐在你们中间(告诉我这段往事的时候,布利斯已经不记得这位教授的姓名了),我一直在读他的论文。请告诉我,他提出的这种农业试验方法,是遵照圣人马克思和圣人列宁的绝对真理吗?“翻译踌躇着吞吞吐吐地把它这句话译了出来,刚一译完,审查委员会的委员们便一阵忙乱,他们要求布利斯对此做进一步的阐述。
“某某教授的方法”,布利斯接着又问:“就是正规的党的方式吗?就是按照党所要求的做法进行的农业试验吗?”
最终委员会给他的答案是,没错,这确实是做事情的正确方法。
于是布利斯说:“如果是那样的话,我就是违背了你们的信仰。”接着他进一步解释,如果按照这个教授提出来的做法,农业试验研究必须用很大面积的土地,而且所有这些农田都得用同样的实验方式来处理。布利斯说,他认为这样的试验是无益的,并且阐明他一直在倡导的方法,就是把农田分成很多小块地,以不同的方式处理相邻的地块。
审查工作没有再深入进行下去就结束了。那天傍晚,他的朋友告诉他,委员会已断定他不是间谍。他们认为他太率真了,透明得一眼就可以看穿,或许真是如她所说,他是一个头脑单纯、只关心他的实验的科学家。
其后,布利斯在列宁格勒植物研究所工作了几个月。他再也没有任何顶头上司了,他自己认为怎么做最好就怎么做。但是,他必须加入由实验室工作人员组成的工会组织,当时,每个在俄国工作的人都必须加入某个由政府控制的工会组织。除了这一点规定之外,他们就不管他了。在20世纪50年代,美国国务院还曾因为他一度属于一个共产党的组织,而拒绝给他签发美国护照。
突然有一天下午,他的女朋友冲进实验室,告诉他:“你必须马上离开。”他坚持说他的实验还没有做完,实验结果还没有详细记录下来,坚持要做完这些才肯离开。女友把布利斯从实验报告堆中拽出来,逼他赶紧穿上外套,告诉他刻不容缓,必须丢弃所有的一切,必须马上离开。刀子守候着催促着他,看着他装好那个小小的提箱,告别了女房东。女友把他送到火车站,临行前坚持要他在安全抵达里加(Riga,现拉脱维亚共和国的首都)时给她打个电话。
到了20世纪60年代,苏联的政治局势有了些微的松动,苏联的科学家重新回到国际科学团体中来。国际统计学会(International Statistical Institute; C?布利斯曾是该学会的会员)在列宁格勒召开了一次国际会议,会议期间,布利斯抽空去探访那些30年代的老朋友,但他们都已故去。他们当中,有的是在大清洗时期被杀,有的死于第二次世界大战,只有他当年的女房东还活着。见面时,他们不停地用各种手势,不断地点头,互致问候,并亲切拥抱,布利斯用英语低声地表达着对她的美好祝福,她则以俄语回应。
第9章  钟形曲线
读完这本书的前八章,你也许会以为统计革命只是发生在英国。从某种意义上说,这倒也是事实,因为最先将统计模型应用于生物研究和农业研究的,的确是在英国,还有丹麦。在费歇尔的影响下,统计学方法很快就传到了美国、印度、澳大利亚和加拿大。正当统计模型的实际应用在说英语的国家和地区推广之际,由于欧洲大陆长期形成的一种数学传统,使得欧洲的数学家正在研究与统计建模有关的理论问题。
这些理论问题中,最为重要的是中心极限定理(central limit theorem)。直到20世纪30年代初,这还是个未经证明的定理,或者说只是一个猜想(conjecture),因为许多人都信其为真,却没有一个人能证明它成立。费歇尔早在研究似然函数值的理论时,就曾假设这个定理是成立的;而回溯到19世纪初,法国数学家皮埃尔?西蒙?拉普拉斯也用这个推论证明了他的最小平方法(method of least squares)。此外,心理学这门新兴科学也是根据中心极限定理开创了智力测验技术与精神疾病量表。

什么是中心极限定理?
大量数据集合的平均数都有一个统计分布,而中心极限定理则阐明,无论初始数据是怎么来的,这个分布都可以用正态概率分布来逼近。这个正态概率分布与拉普拉斯的误差函数(Laplace’s error function)相同,有时也叫做高斯分布(Gaussian distribution),而在浅显通俗的普及书里,也常被称为“钟形曲线”(bellshaped curve)。在18世纪晚期,亚伯拉罕?棣莫弗(Abraham de Moivre)已经证明,由机会博弈(games of chance)所得数字的简单集合符合中心极限定理。然而,在此之后的150年里,对这个猜想的证明没有丝毫的深入进展。
用正态分布来描述大部分数据都是正确有效的,因此,中心极限定理普遍被认为是一个正确的猜想。一旦假定数据服从正态分布,数学上的处理就容易多了。正态分布具备某些非常优良的性质:如果有两个随机变量服从正态分布,那么两变量之和也同样服从正态分布。就一般而言,正态变量的各种类型的和与差也都服从正态分布。因此,由正态随机变量(variate)推演得出的许多统计量,其自身也服从正态分布。
正态分布只有K?皮尔逊四个参数中的两个——平均数和标准差,另外两个参数对称性偏度(symmetry)和峰度(kurtosis)均为零。因此,一量知道了平均数和标准差这两个参数值,其他的一切也就一清二楚了。费歇尔曾指出,由一组数据得出的平均数与标准差的估计值就是他所说的充分估计量(sufficient estimator),因为这两个参数值已经把这些数据中所有的信息都包括在内了。既然这两个参数值已经涵盖了能够从那些原始测量值中揭示出的一切,就根本没有必要去占有任何原始测量值了。如果有足够的测量值可以用来相当精确地估计出平均数与标准差,就不再需要其他任何测量值了,任何为搜集这些数据所做的努力,都不过是浪费时间而已。例如,有两个重要指标服从正态分布,如果你正打算得出这样一个正态分布的那两个参数,那么你只需要收集大约50个测量值就足够了。
正态分布的这种数学上便于处理的特性,使科学家能够构建一个复杂关系模型。只要其基本分布是正态的,费歇尔的似然函数通常就有了以简单代数进行处理的一种形式。即便模型复杂到必须用迭代运算法去解的程度,只要其分布是正态的,用纳恩?莱尔德(Nan Laird)和詹姆斯?韦尔(James Ware)的EM演算法去解,就变得轻而易举了。由于正态分布在数学上的计算处理非常敏捷,因此在建模时,统计学家常常要假定所有的
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架