- +1
AI算法+云算力,為探索脈沖星裝個“加速器”
明月幾時有?把酒問青天。不知天上宮闕,今夕是何年?
與千年前的詩詞遙相呼應,是一群“追星人”的夢想:在浩瀚太空里,百萬光年外的脈沖星向地球持續發射信號,這也是中國“天眼”——500米口徑球面射電望遠鏡FAST(Five-hundred-meter Aperture Spherical radio Telescope,簡稱FAST)探測的邊界。
2016年Fast在貴州落成。它相當于30個標準足球場的反射面積,極大地拓展了“追星人”觀測星空的視野,也為地球上的射電天文學家帶回了更多有價值的宇宙“心跳”。
而這些猶如心電圖般跳躍的聲響,也在為人類探索和認識宇宙創造更多的可能性。
王珅是“追星人”的一員。
他畢業于中國科學院國家天文臺,獲得天體物理博士學位,目前正在復旦大學計算機科學技術學院副教授、博士生導師池明旻實驗室做博士后研究,主要研究方向是射電天文觀測、脈沖星及射電暫現源的搜索,以及計算天文相關的交叉學科研究。
2014年,王珅第一次去FAST參觀。繞過彎彎曲曲的泥濘山路到達現場,王珅看到的還是處于平整場地,搭建支撐塔的FAST,但他還是一眼就被這個雄偉的工程吸引了。
在王珅眼前的FAST,身量巨大。但與此相比,它所搜集到的百萬光年外的信號,卻十分“微弱”。
王珅形容到:“我們接收到的所有宇宙的信號轉化成能量還不足以翻動一頁書,信號強度非常微弱。但脈沖星有個好處,它是周期性的,所以我們可以采用一種周期折疊的方式,也是一種傅里葉變換,把它多個周期信號累加在一起,來進行探測和數據處理。”
FAST解決了脈沖星的信號收集問題,這些微弱信號經過累加,每天會產生約500TB的原始數據。
但新的問題卻出現了——其一,通過專業的天文軟件對信號做圖形轉化的預處理需要耗費龐大的計算資源;其二,當預處理完成后,像王珅這樣的天文科研工作者要從預處理生成的3千萬—1億張圖片中完成脈沖星的特征比對,可能要花上一年時間才能成功找出脈沖星的候選體,工作量大且耗時長。
在龐大的數據量面前,用AI“找星星”,被納入考量范圍。
不過現實的難題是,脈沖星的樣本量極小。自FAST啟用以來,中國發現的脈沖星共有600多顆,但能用于訓練AI模型的樣本量只有100顆左右。這使得國家天文臺的AI篩選模型難以施展拳腳。
轉機發生在2021年,當時汪鋮杰與王亞彪所在的騰訊優圖實驗室研究團隊,正在尋求AI+Science的落地場景。
在了解到復旦大學參與的脈沖星項目后,汪鋮杰與王亞彪迅速拉起三方合作。2021年,騰訊聯合國家天文臺、攜手復旦大學計算機科學技術學院正式開啟“探星計劃”。依托騰訊優圖實驗室的計算機視覺技術及騰訊云計算能力,他們希望能通過“云+AI”提高探索脈沖星效率。
探星計劃
AI算法和云算力,可以為“追星人”帶來哪些加持?
復旦大學計算機科學技術學院副教授池明旻是“探星計劃”的創始成員之一。在她看來,騰訊優圖的加入帶來了幾項突破,包括基于多模態+半監督學習的AI解決方案、AI+動態譜信號的解決方案等。
要從1億張圖片里找星星并不是件容易的事。為了解決樣本學習量不足的問題,探星計劃團隊設計了域遷移半監督學習的解決方案——使用非FAST觀測設備獲取的標記數據,并同時使用少量FAST標記數據以及大量未標記數據進行深度神經網絡建模。通過主動學習獲得“偽標簽”數據,模型訓練可用的樣本要比人工標注大的多,因此極大提升了脈沖星自動識別能力。
與此同時,“探星計劃”團隊還嘗試了多模態的應用。由FAST收集回來的太空信號轉化成圖像后,可以獲取不同維度的信息,比如色散、相位-時間、頻率-時間圖等等。池明旻表示,多模態輸入信號的深度融合,遠好于常源信號的直接分析。多模態融合的方式,就是將不同維度的數據的脈沖星信息進行關聯分析,提高脈沖周期信號確認的可信度,也就提升了尋找脈沖星效率和準確率。

在來自工業界和學術界的共同努力下,在同等算力下,“云+AI”的方式助力尋找脈沖星的數據處理效率提升了 120 倍。新設計的多模態+半監督學習的AI解決方案,相比業界原有的AI篩選模型,不僅具有更高的召回率,也促進誤報率下降98%。
為什么是脈沖星?
不到一年的時間,“探星計劃”已經從FAST巡天觀測數據中找到了22顆脈沖星。
在這22顆脈沖星中,包含7顆高速自轉的毫秒脈沖星,還包含6顆具有間歇輻射現象的疑似生命周期末期的脈沖星。同時,“探星計劃”的聯合團隊還運用自行研發的動態譜AI模型,初次完成了對某磁陀星的射電脈沖的探測,并將開啟對M31仙女座星系的AI+射電天文信號分析處理——這也將是天文界對該星系中脈沖星類致密天體的最深度最完整的探測。
脈沖星是一種快速旋轉的中子星,由超新星爆發產生,對它的發現可以看作一架橋梁,將加深人類對浩瀚宇宙的進一步認識。
王珅解釋說,天文學的核心研究叫“兩暗一黑三起源”。“兩暗”就是暗物質、暗能量。“一黑”就是黑洞。“三起源”就是宇宙起源、天體起源和生命起源,而脈沖星一下子就涉及到其中三項研究。
大質量恒星演化晚期目前已知的有三種產物,一是白矮星,二是以脈沖星為代表的中子星,三是黑洞。黑洞的直接觀測很困難,研究脈沖星對理解它的“表兄弟”黑洞有一定幫助。
其次,對脈沖星的研究,還能幫助我們解決天體起源和生命起源的問題。超新星爆炸遺留的物質就是以脈沖星為代表的中子星。“我們研究脈沖星其實就是在研究大質量恒星晚期的生命過程,進而研究了天體演化和生命的形成。”生命形成所需比鐵重的元素,由超新星爆炸產生。換句話說,人類皆由星塵而來。
而“探星計劃”所帶來的研究方式的創新,同樣也在延展至更廣泛的領域。
例如,“探星計劃”的團隊已經用脈沖星的單脈沖搜索技術發現了快速射電暴。快速射電暴的起源還不清楚,它的能量強度相當于一毫秒時間內爆發出太陽一整年的能量,是極其劇烈的活動。研究學者推測它很大可能是來自于銀河系外,并期待發現更多快速射電暴的細節。
這些基于脈沖星探索而來的模型算法,一直在持續優化,有望在不久的將來對外開放,用于更廣泛的天文探索。

動態譜信號圖
在王珅看來,由于脈沖星自身就是擁有巨大磁場高速旋轉,甚至周邊環境是非常極端的天體,很多地球上面達不到的實驗室條件都可以在它的周圍進行觀測到。“比如說我們就用脈沖星來衡量銀河系的磁場分布,雖然現在只是一個初步的銀河系磁場分布,但確實是能讓我們對自己所生活的星系有更多的了解,而這也將賦予探索脈沖星和‘探星計劃’更多的探索價值。”
以及,我們生活在時空當中,旅行是在時間和空間上位移。任何一個發展到行星航行的文明,都需要有一個定位指南,指示自己在宇宙中位置的物品參照物。毫秒脈沖星擁有極端穩定的周期運動性質,比地球上面的原子鐘更準確。
對脈沖星的發現和研究,是FAST需要完成的一個重要科學目標。對像王珅這樣的“追星人”所言:“從我個人來說,當時看到FAST的時候,就覺得此生值得為此努力。”
星際導航
脈沖星的本質是中子星。
一些質量較大的恒星在演化的終點發生爆炸,并隨之迸發出強烈的太空焰火,在這過程中質量巨大的恒星殘骸留下,最終成為快速自轉的中子星。當中子星能發射脈沖信號,并且正好是沖著地球方向,就成為了我們所碰到的“脈沖星”。
“它的波束非常準直且恰好對準地球方向,才能跨越‘萬水千山’,然后到地球上面被接收到。”王珅表示。
人類發現的第一顆脈沖星,是1967年由英國的喬絲琳·貝爾和她的導師休伊什發現的。它發出一個規律性的信號,起初他們認為這可能是外星文明給我們發的,所以把它稱之為“小綠人”。但是經過后續科學研究,發現它實際上是早在30多年前就被預言的中子星。
但數萬光年外的星體,跟我們到底有什么關系?
用池明旻的話來說——地球導航靠GPS,星際導航靠脈沖星。
因為脈沖星在高速旋轉的同時,會周期性地向外釋放出強烈的射電脈沖信號,這種信號非常有規律。每一顆脈沖星的信號都不同,它就相當于宇宙中的一個個明燈,只要有三個脈沖星就可以對一個位置進行定位。發現的脈沖星越多,能夠定位的空間范圍也越大。
繁星給人類指引,星際導航需要燈塔。

全天區脈沖星分布圖
“我們最近找到的脈沖星第22顆是3.8萬光年的”,池明旻說“我們正在騰訊優圖云+AI的幫助下,努力發現更多更特殊的脈沖星樣本,比如會不會有脈沖三星或其他星,這都需要更大范圍的搜索。”
今年,“探星計劃”已經在往宇宙深處前進——銀河系外的仙女座星系。
“仙女座距離我們有250萬光年,理論上找到短周期脈沖星的概率實在太低了,只有信號特別強的情況下,類似快速射電暴更有可能被FAST探測到。”池明旻表示,仙女座在銀河系外,距離地球非常遙遠,信號的傳輸經過復雜的宇宙環境,比如星系間介質會使高頻信號延遲到達,嚴重扭曲信號。數據預處理可以在一定程度上進行修正,但所需的計算開銷更大,搜索模型也更加復雜。
“但如果能在仙女座星系有發現,那就是0到1的突破,對我們來說這個意義非常大,也是最令人期待的時刻。”
科幻作品《三體》中有句話,給歲月以文明,而不是給文明以歲月。
從天文觀測來考慮,文明有時候充滿偶然性。毛利文明發展了非常強大的航海技術,甚至很早就能從新西蘭渡海到夏威夷,有船到達美洲,但是他們一直以來就沒有形成一個非常強大的文明,沒統治整個南半球。一個有趣的觀點是,缺少肉眼可見的“南極星”所以他們沒辦法在發明望遠鏡之前精確導航。因此文明的發展就被鎖死在比較狹小的區域內,很難進一步進化到更高級的文明。
而人們正期待,脈沖星的這個導航,能帶領人類看到廣闊的宇宙文明。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司