人工智能可以幫助天文學家快速產生假說

作者:林暐哲　来源:平井堅　浏览:　【大 中 小】　发布时间:2025-11-02 10:24:36 评论数:

使用OpenAI的GPT-4模型的對抗性上下文提示工作流。程序從銀河天文學論文的預處理和嵌入開始。對嵌入的查詢進行相似性搜索，並檢索相關的文檔塊。執行進一步的上下文壓縮以從組塊中移除不相關的信息。這些壓縮文本作為GPT-4實例的輸入，產生一個想法。這個想法然後被第二個GPT-4模型評論，反饋被第三個GPT-4模型調節。學分:arXiv (2023)。DOI: 10.48550/arxiv.2306.11648
（神秘的地球uux.cn）據今日宇宙（安迪·托馬威克）：幾乎在互聯網上的任何地方，你都幾乎不可能避開關於人工智能的文章。即使在德州大學，我們也出版了幾本。通常，他們關注的是特定研究小組如何利用技術來理解大量數據。但這種模式識別並不是人工智能擅長的全部。事實上，它變得很有抽象思維的能力。抽象思維有助於發展新的科學理論。帶著這種想法，來自歐空局、哥倫比亞大學和澳大利亞國立大學(ANU)的一組研究人員利用人工智能提出了天文學中的科學假設。
具體來說，他們是在星係天文學的子領域這樣做的，這個子領域專門研究星係的形成和物理學。最近發表的一篇關於arXiv預印服務器的論文提到，他們選擇這個子領域是因為它的“綜合性”，這需要“來自不同子領域的知識”
這聽起來正是人工智能已經擅長的。而是一個標準的大型語言模型(LLM ),就像最近變得最熟悉的那些(ChatGPT、Bard等)。)沒有足夠的學科知識來在那個領域發展合理的假設。它甚至可能成為“幻覺”的犧牲品，一些研究人員(和記者)警告說，這是與模型互動的負麵影響之一。
為了避免這個問題，由ANU的Ioana Ciuc和Yuan-Sen Ting領導的研究人員使用了一段被稱為應用程序編程接口(API)的代碼，它是用Python編寫的，稱為Langchain。這個API允許更高級的用戶操作像GPT-4這樣的LLM，它是ChatGPT的最新基礎。在研究人員的案例中，他們從美國宇航局的天體物理數據係統下載了1000多篇與銀河天文學有關的科學文章，然後將其加載到GPT 4號上。
研究人員的實驗之一是測試該模型可以訪問的論文數量如何影響其得出的假設。他們注意到，該研究所提出的假設中，隻有10篇論文與全部1000篇論文之間存在顯著差異。
但是他們自己是如何判斷假說的有效性的呢？他們做了任何自尊的科學家都會做的事情，招募了該領域的專家。準確地說，是兩個。他們要求他們隻是假設基於思想的獨創性，測試假設的可行性，以及其基礎的科學準確性。專家們發現，即使隻有10篇論文的有限數據集，阿斯特羅-GPT提出的假設(他們稱之為他們的模型)的評分也僅略低於一名合格的博士生。通過查閱全部1000篇論文，阿斯特羅·GPT的得分達到了“近乎專家的水平”
決定提交給專家的最終假設的一個關鍵因素是使用“對抗性提示”對假設進行提煉。雖然這聽起來有些咄咄逼人，但它隻是意味著，除了開發假設的程序之外，另一個程序也在相同的數據集上接受了訓練，然後向第一個程序提供了關於其假設的反饋，從而迫使原始程序改善其邏輯謬誤，並通常創造出更好的想法。
即使有對抗性的反饋，天文學博士生也沒有理由放棄在自己的領域提出自己獨特的想法。但是，這項研究確實指出了這些LLM未被充分利用的能力。隨著它們被越來越廣泛地采用，科學家和外行人可以越來越多地利用它們來提出新的更好的想法進行測試。

2021年三星OLED手機麵板份額將下降至77%，國產份額進一步加大
動漫服裝圖片時尚潮流（動漫服裝素材圖片）