Bo Zhang's Homepage
..The universe is unfolding as it should..

2009-5-16

天文学中的统计

归档于: 天文空间科学, 知识理论 @ 11:34 pm

本文的主要内容来自arXiv:0903.0416,属于在线版统计学辞典中的一个词条。由于天文学研究对象的特点(也就是进行地面实验的困难性),这门学科对于统计学的依赖更甚于其他。

统计学在天文学中的最初应用远比个人印象中的更早。如古希腊的依巴古为了从古巴比伦学者的测量数据求得回归年长度,是将所有数据分布范围的中点而非平均值视为最佳。以现代的眼光来看,这样做不无道理。当然由于不了解仪器及操作过程中引入的种种误差,两种方法孰优孰劣也难下定论。当代所熟知的误差传递以及三点方法也可以追溯到11世纪的波斯学者比鲁尼。第谷更是充分利用了重复观测以弥补各种随机误差的思想,精度几乎达到了肉眼观测的极限。

现代统计学起源于17至18世纪。自此以后,统计方法就与天文学紧密相连,如最小二乘法的发明最先用于彗星轨道的计算,高斯分布起初是用于拟合行星轨道的观测误差。更晚近的工作包括通过恒星计数来探讨银河系的结构、应用傅里叶方法来进行时变分析,还有宇宙学方面的话题。按照原文的说法,如今天文学最为依赖统计的几大热点是:大规模巡天、对太阳系以外行星的搜索、暗弱源的研究、星系成团性的分析、宇宙微波背景辐射。

其中巡天要大量利用多变量回归来搜寻统计关系。哈勃当年仅仅凭借几个星系的低质量数据就提出了著名的哈勃定律,认为星系的退行速度与距离成正比,不能不让人佩服其胆识。但是话说回来,如此操作也有运气的成分在其中。当今的巡天数据质量自然是比当年提高了几个量级,但是海量数据的应用却是又一个问题。象哈勃定律那样简洁而明了的统计关系比较少见,更多的是要找到包括不同波段光度、各种形态参数等多个物理量之间的关联。多变量分析本来并非复杂问题,但天文应用有其特殊性。一来是样本的不完备性,如某些天体由于亮度或者某些其他参数在可探测范围之外,可能无法被观测到;而来考虑不同时间利用不同仪器进行的观测是异方差的,定标也是必要的工作。Lynden-Bell和Woodroofe提出的非参数检验是解决这个问题的途径之一,不过对于文中介绍的其他方法如tau关联之类,本人就所知甚少了。

行星搜索主要仰仗傅里叶分析,其实与变星观测很类似,只是光变范围要小得多。傅里叶分析适合探讨具有周期性的问题,在这个领域就是由于行星环绕恒星转动而使恒星产生周期性的光变。关键的麻烦在于,对于拥有多个行星的系统,单纯由傅里叶分析所得的参数有时并不唯一,因此往往要用到基于Markov链蒙特卡洛计算的贝叶斯选择法来最终确定待测。

暗弱源的观测结果一般表现为不同能量、不同来源的粒子序列,入射的可能是光子,也可能是中微子或带电宇宙线粒子。流量、方位、光谱等信息的确定一般通过泊松方法来实现。空间傅里叶谱分析和两点相关函数是星系成团性分析的关键,微波背景辐射所应用的则主要是模型选择的方法。考虑本人对这些方面的了解不多,暂时先不展开详述

原文没有太多提及的一个问题是选择效应的改正,比如著名的Malmquist Bias。此外还有一些不算太热门的领域照旧离不开统计,包括天文学最为传统的领域,如行星位置的测定。

No Comments

No comments yet.

RSS feed for comments on this post.

Sorry, the comment form is closed at this time.

首页 | 天文 | 科学 | 摄影 | 模型 | CV | 版权声明 | 联系站长
京ICP备05002854号-2 Powered by WordPress Version 2.0.6
Licensed under Creative Commons Licenses

porno izle