Download presentation
Presentation is loading. Please wait.
1
樊东卫 中国科学院国家天文台 Tamás Budavári Johns Hopkins University
基于几何模型的射电星表交叉证认方法 樊东卫 中国科学院国家天文台 Tamás Budavári Johns Hopkins University
2
Crossmatching交叉证认 检测多个观测目标是否为同一天体 典型应用 主要技术方法 e.g.两个星表内的天体的对应关系
CDS Simbadhttp://simbad.u-strasbg.fr/simbad/ IPAC NEDhttp://ned.ipac.caltech.edu 主要技术方法 基于位置(R.A., Dec.)接近程度进行计算,给出一个距离边 界(threshold),在该范围内称两天体为同一天体 只能进行point-to-point证认
3
Difficulties 射电目标带有延展结构,如AGN 可能有一个中心射电源Core+两侧喷流瓣Lobe 光学星表等点源星表只有中心目标
传统星表交叉证认方法只能根据两点的位置关系点 对点证认。Lobe离Core较远,只能被忽略掉。
4
Goal 对射电星表与点源星表进行交叉证认,并确认各个 射电目标所对应部分 目前只能靠手工方式
5
工作基础 ATLAS CDF-S & SWIRE CDF-S crossmatching by HAND
Norris, R.~P., Afonso,J., Appleton, P.~N., et al. 2006, aj, 132, 2409 ATLAS: Australia Telescope Large Area Survey SWIRE: Spitzer Wide-Area Infrared Extragalactic Survey CDF-S: Chandra Deep Field-South Probabilistic Cross-Identification of Astronomical Sources Budavári, T., & Szalay, A.~S. 2008, apj, 679, 301
6
贝叶斯因子 坐标集合𝐷={ 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 }对应n次不同观测 给定一个假设H,D全部来自同一天体m
相应的对立假设K,D分别来自不同天体,且它们 都不源自m 定义贝叶斯因子𝐵 𝐻,𝐾 𝐷 = 𝑃 𝐻 𝐷 /𝑃(𝐻) 𝑃 𝐾 𝐷 /𝑃(𝐾) 应用贝叶斯定理,得𝐵 𝐻,𝐾 𝐷 = 𝑃(𝐷|𝐻) 𝑃(𝐷|𝐾) 贝叶斯因子即两个假设的似然函数的比值 给定一个假设H,所有的数据都来自同一天体m 相应的对立假设K,所有的观测数据都来自不同天体,且它们都不源自m 坐标集合𝐷={ 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 }对应n次不同观测,就可以得到贝叶斯因子 应用贝叶斯定理,我们可以看到,这里的贝叶斯因子实际上就是两个假设的似然函数的比值
7
似然函数的参数化模型 H假设所有观测对象都是同一目标,因而可以用 一个共同位置m来对它进行参数化 𝑝 𝐷 𝐻 = 𝑑 3 𝑚∙𝑝 𝒎 𝐻 𝑖=1 𝑛 𝑝 𝑖 ( 𝒙 𝒊 |𝒎,𝐻) 对立假设K将被不同的位置{ 𝑚 𝑖 }参数化,其概率为 各次观测的概率密度函数的积分的乘积 𝑝 𝐷 𝐾 = 𝑖=1 𝑛 𝑑 3 𝑚 𝑖 ∙𝑝( 𝒎 𝒊 |𝐾) 𝑝 𝑖 𝒙 𝒊 𝒎 𝒊 ,𝐾 𝐵 𝐻,𝐾 𝐷 ≫1, 𝐻成立 𝐵 𝐻,𝐾 𝐷 <1, 𝐾成立 𝑜𝑡ℎ𝑒𝑟𝑤𝑖𝑠𝑒, 需要进一步检验 想要计算贝叶斯因子,需要将这些假设的似然函数参数化 H假设中所有观测对象都是同一目标,因而可以用一个共同位置m来对它进行参数化,积分内的概率密度函数相乘 对立假设K将被不同的位置{ 𝑚 𝑖 }参数化,其概率为各次观测的概率密度函数的积分的乘积 当贝叶斯因子远大于1时,H假设成立 贝叶斯因子小于1时,K假设成立 其它情况则需要更多的证据进行检验
8
将赤道坐标转换为天球切平面坐标 3维降为2维,简化几何计算及多重积分计算 在光学源 𝑥 0 (𝛼,𝛽)处作天球切平面
令x0在切平面上的坐标为(0,0) 其他相关坐标也可投影到这个切平面上,如点 𝑟 ′ (𝛼,𝛽)在 x0切平面上的坐标(p, q)的计算公式为 为了降低计算复杂度,我们将赤道坐标转换为天球切平面坐标,而不是直接使用最直观的3维空间坐标 方法是在在光学源 𝑥 0 (𝛼,𝛽)处作天球切平面 令x0在切平面上的坐标为(0,0) 然后相关的射电源们的坐标就可以通过下面的两个公式转换成切平面上的坐标(p,q)
9
直线对称模型 寻找带有喷流结构的射电源 使用直线对称模型来模拟这一结构 其特征是可能有一个中心射电源+两侧喷流瓣
光学源为 𝒎 𝟎 ,中心点(core)矢量为m,一侧瓣(lobe)矢量 为 𝒎 ′ ,则另一侧瓣为 𝒎 ′′ =𝟐𝒎−𝒎′ 为了寻找带有喷流结构的射电源,我们直观地使用了直线对称模型 其特征是可能有一个中心射电源+两侧喷流瓣 像下面的这两个图 使用直线对称模型来模拟这一结构需要四个矢量 要令光学源为 𝒎 𝟎 ,中心点矢量为m,一侧瓣矢量为 𝒎 ′ ,则另一侧瓣可以计算出来 𝒎 ′′ =𝟐𝒎−𝒎′ 对于这三个射电源,中心点称为core,两侧瓣称为lobe 由于仅通过坐标我们难以知道一个射电源在整体中是什么成分 实际上我们需要将任一可能的射电源设为m、 𝒎 ′ 或 𝒎 ′′ 。再分别计算每种组合的似然函数值
10
基于直线对称模型的假设计算 假设有四个射电源𝐷={ 𝑦 0 , 𝑦 1 , 𝑦 2 , 𝑦 3 } 可以构成数种 假设: (core, lobe, lobe, none) (core, lobe, none, none) (none, lobe, lobe, none) (core, none, none, none) ……. ,𝐷={ 𝑦 0 , 𝑦 1 , 𝑦 2 , 𝑦 3 } 各点的位置可以互换,以遍历各种组 合情形 需要将这些组合一一计算出来,对比结果 四个射电源𝐷={ 𝑦 0 , 𝑦 1 , 𝑦 2 , 𝑦 3 } 还可以构成数种假设: (core, lobe, none, none) (none, lobe, lobe, none) (core, none, none, none)等等,且𝐷={ 𝑦 0 , 𝑦 1 , 𝑦 2 , 𝑦 3 } 各点的位置可以互换,以遍历各种组合情形 我们需要将这些组合一一计算出来,对比它们的结果
11
基于直线对称模型的假设计算 其中一个(CORE,LOBE,LOBE,NONE)假设的似然 函数计算公式为
前面的(core, lobe, lobe)作为一个整体,而 none表示y3与它们相独立。按前述对立假设K的 似然函数计算方法。两者的似然函数须相乘 假设有四个射电源𝐷={ 𝑦 0 , 𝑦 1 , 𝑦 2 , 𝑦 3 } ,它们其中一个(CORE,LOBE,LOBE,NONE)假设的似然函数计算公式像这样 其中p(m0)是验前概率密度函数 L打头的是观测到的点和理想位置的接近概率 p(m1|m0)是lobe对core的条件概率密度函数 前面的(core, lobe, lobe)作为一个整体,而none表示y3与它们相独立。按前述对立假设K的似然函数计算方法。两者的似然函数相乘
12
概率密度函数的选择 而验前概率密度函数𝑝 𝑚 𝑖 = 1 4𝜋 𝑟 2 =1.87× 10 −12 ,即假设每平方角秒上有一个天体
𝐿 𝑥0 、 𝐿 𝑦0 、 𝐿 𝑦1 、 𝐿 𝑦2 、 𝐿 𝑦3 等概率密度函数选择二维正 态分布 𝐿 𝑥0 𝒎 𝟎 =𝑔( 𝒙 𝟎 | 𝒎 𝟎 , Σ 𝑥0 ) 而验前概率密度函数𝑝 𝑚 𝑖 = 1 4𝜋 𝑟 2 =1.87× 10 −12 ,即假设每平方角秒上有一个天体 为了真正计算各个假设的似然函数值,我们需要指定公式中的所有概率密度函数 最复杂的带有(core, lobe, lobe)的情形包括了所有其他类型组合需要的概率密度函数 像 𝐿 𝑥0 、 𝐿 𝑦0 、 𝐿 𝑦1 、 𝐿 𝑦2 、 𝐿 𝑦3 等概率密度函数,我们选择二维正态分布 而验前概率密度函数𝑝 𝑚 𝑖 = 1 4𝜋 𝑟 2 =1.87× 10 −12 ,即假设每平方角秒上有一个天体
13
概率密度函数的选择 lobe与core的条件概率密度函数,可用均匀分布 𝑝 𝒎 𝟏 | 𝒎 𝟎 = 𝑅 2 − 𝑟 2 −1 ,𝑟<| 𝒎 𝟏 − 𝒎 𝟎 |<𝑅 , 其它 lobe与core的条件概率密度函数,可用均匀分布 实际上就是将右边这个图的直线上只出现在灰色区域的天体视为lobe
14
Lobe与Core的条件概率密度函数的其他选择
瑞利分布 对数正态分布 Lobe与Core的条件概率密度函数也可以选择瑞利分布和对数正态分布 选择这两个概率密度函数的原因,是一个lobe离core越远它越不可能是一个真正的lobe。 实际实验结果表明,不管是均匀分布,还是瑞利分布或者对数正态分布概率密度函数,它们的效果都差不多
15
直线非对称模型 两侧瓣的观测位置相对于中心不一定对称
引入一个k因子,给予一侧瓣在直线上一定的活动 范围2 𝑚 0 − 𝑚 1 +𝑘 𝑚 0 − 𝑚 1 = 2+𝑘 𝑚 0 −(1+𝑘) 𝑚 1 由于观测位置等因素的影响,观测到的两侧瓣的位置相对于中心不一定是对称的 需要对模型进行一些调整 我们引入了一个k因子,给予一侧瓣在直线上一定的活动范围。 这里还作了一个变换,主要是为了方便后面计算的进一步简化
16
直线非对称模型 这样(core, lobe, lobe, none)的似然函数的计算公 式变为 p(k)是一维正态分布概率密度函数
加入k之后,(core, lobe, lobe, none)组合的似然函数的计算公式变成这样。 多了一重p(k)的积分,一共五重积分,我们给k使用的是一维正态分布概率密度函数
17
数据分析算法 人为地给较好的core设定一个标准,比如设为 10.5,表明它是一个很好的core。这样的core不 能作为任何假设的lobe。从计算结果中删除掉这些 将它作为lobe的假设 首先取最好的(core, lobe, lobe)型,然后将涉及到 它们其中任一成员的计算结果删除 再选最好的(lobe, lobe)及(core, lobe),同样将涉 及到它们其中任一成员的计算删除 剩下的结果中,寻找最好的(core)型配对 根据这些情况,我们拟定了这样的数据分析方法: 人为地给较好的core设定一个标准,比如设为10,表明它是一个很好的core。这样的core不能作为任何假设的lobe。从计算结果中删除掉这些将它作为lobe的假设 首先取最好的(core, lobe, lobe)型,然后将涉及到它们其中任一成员的计算结果删除 再选最好的(lobe, lobe)及(core, lobe),同样将涉及到它们其中任一成员的计算删除 剩下的结果中,寻找最好的(core)型配对
18
结果对比 经过大量积分计算及结果分析之后,对比程序计算 结果与澳大利亚射电天文学家手工交叉证认结果
经过大量积分计算及结果分析之后,对比程序得到的结果和澳大利亚射电天文学家手工交叉证认结果 可以看到,triple,也就是(core, lobe, lobe)的结果非常好。 下面,Double也就是(core, lobe)或者(lobe, lobe)相对差一些。 而core的情形,也就是通常的像Zones Algorithm那样一对一的交叉证认的结果也非常不错
19
Nine Good Triplets
20
Triple with Big Angle, B=8.3
21
5 more triplets
22
Good Doubles
23
Bad Doubles
24
小结 使用直线非对称模型+贝叶斯假设推断方法,对点 源星表与射电星表的进行交叉证认
可应用到未来的大规模射电波段巡天(如SKA)观 测结果与光学观测结果的数据融合中来 此方法还存在一些问题,比如对于喷流瓣夹角较大 的情形适应不佳,CORE-LOBE型过度匹配等等, 需要进一步改进模型。 小结 我们提出了一种基于贝叶斯假设推断,使用直线非对称模型 对光学星表与可能带有喷流射电源射电星表 进行交叉证认的方法 此方法可应用到未来的大规模射电波段巡天观测结果,比如SKA,与光学观测结果的数据融合中来 这个方法还存在一些问题,比如模型不能适应喷流瓣夹角较大的情形,需要进一步修正模型。
Similar presentations