- +1
AI育種大模型“豐登”發布:具備品種選育、栽培技術回答能力
·種業大語言模型“豐登”已具有品種選育、農藝性狀、栽培技術和推廣區域四大核心領域的解釋和回答能力。可通過自主學習,發掘生物、遺傳、氣象及土壤間的復雜關聯,形成新的知識結構。

通過“豐登”選擇適合在廣東省種植的水稻品種。
科學高效的生物育種對于糧食安全及經濟效益意義重大,為填補中國在AI育種領域的技術空白,4月28日,上海人工智能實驗室聯合崖州灣國家實驗室和中國農業大學發布首個種業大語言模型“豐登”(SeedLLM),希望借此降低育種學習門檻,提升從業者的研究和實踐效率。
由于作物及畜類品種的多樣性,長期以來,育種信息缺乏統一平臺,數據知識“孤島式”分布,為育種知識普及學習帶來壁壘。同時,由于生物育種涉及生物學、遺傳學、氣象學、土壤學等多學科交叉,專業人員在從事育種工作時不得不跨越眾多領域的文獻、數據,甚至需要編寫代碼進行數據訪問,工作效率受到極大限制。
為此,上海人工智能實驗室聯合團隊提出大模型賦能生物育種的思路,在上海人工智能實驗室研發的大語言模型“書生·浦語2.0”(InternLM2)的基礎上,科研人員注入科技文獻、產業實踐報告等海量專業數據,訓練出具備理解和分析能力的種業大模型,把“豐登”訓練成初具“AI研究員”潛力的大模型,它可通過自主學習,發掘生物、遺傳、氣象及土壤間的復雜關聯,形成新的知識結構。目前,“豐登”已具有品種選育、農藝性狀、栽培技術和推廣區域四大核心領域的解釋和回答能力。
上海人工智能實驗室介紹,相較于國內外主流大語言模型,“豐登”專注于生物育種。當前,育種領域涉及的知識資源包括學術文獻、田間日志及政府公示等,這些知識資源呈現分散狀態。科研人員深度挖掘相關知識,將文本信息中提煉出的知識通過大模型技術手段匯聚到模型權重中,再將分散在不同文獻中的同一知識點整合歸納,最終使育種專業知識以結構化方式呈現。基于“書生·浦語2.0”的基座模型能力,科研人員不僅對“豐登”進行了作物學、農學和遺傳學等育種專業學科的知識訓練,還整合了生物學、遺傳學、氣象學、土壤學等多學科知識,提示詞的合理運用讓“豐登”對相關領域間的知識“融會貫通”。
此外,“豐登”使用自然語言對話接口,降低使用門檻,用戶可直接提出問題并迅速獲得易于理解的信息。相較于傳統的文獻數據庫查詢和網絡搜索,多輪對話方式確保了信息的實時性和高效獲取。“豐登”未來還可實現語音輸入,進一步降低使用門檻,并在大語言模型基礎上引入圖像分析、多組學分析和決策育種能力,針對育種工作場景進一步提升使用效率。
為了全面評估大模型在科學育種工作中的性能效用,上海AI實驗室聯合崖州灣國家實驗室和中國農業大學共同組織了國際首個種業領域的標準化人工評估評測。組織育種專家制定了大量水稻育種專業問題及對應標準答案,涵蓋品種選育過程、農藝性狀描述、栽培技術推薦和歷史推廣區域查詢四大任務,并以此構建首個種業大語言模型評測基準,為AI興農研究提供客觀能力參考。通過國內各級農業部門認定的水稻品種已超2萬個,“豐登”已率先開放水稻領域知識測試接口。
據上海人工智能實驗室消息,目前,隆平高科、正大集團、中國科學院、中國農業科學院、上海市農業科學院、廣東省農業科學院、華中農業大學、華南農業大學、復旦大學等機構已加入“豐登”測試,大模型助力科學育種正在真實應用場景下得到驗證并優化。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司