- +1
夸克發(fā)布首個可生成完整志愿報告的Agent
6月12日,夸克發(fā)布國內(nèi)首個為高考志愿填報場景開發(fā)的高考志愿大模型,并同步上線“高考深度搜索”、“志愿報告”、“智能選志愿”三大核心功能。該模型具備專家級決策能力,能夠為每位考生提供精準(zhǔn)、個性化的志愿填報服務(wù)。

讓每位考生都有自己的AI志愿顧問
高考志愿大模型驅(qū)動的夸克“志愿報告”以Agent方式運(yùn)行,目前已開放試用。它能像經(jīng)驗豐富的志愿填報專家一樣,為考生提供個性化的規(guī)劃建議。基于“任務(wù)規(guī)劃—執(zhí)行—檢查—反思”的鏈?zhǔn)酵评砹鞒蹋淇酥驹笀蟾鏁詣虞敵龊w沖穩(wěn)保策略、志愿表、院校專業(yè)推薦等內(nèi)容的完整報告。
“志愿報告”Agent以考生的成績、興趣偏好、家庭背景和地域傾向等為基礎(chǔ),會首先制定個性化任務(wù)規(guī)劃(如定位成績段、篩選專業(yè)方向、制定填報策略等);隨后將任務(wù)轉(zhuǎn)化為指令,基于高質(zhì)量數(shù)據(jù)完成任務(wù)執(zhí)行。
每輪執(zhí)行結(jié)果模型經(jīng)過自動檢查,會判斷是否存在邏輯沖突、數(shù)據(jù)缺漏、排序異常等問題,并將結(jié)果反饋至“反思”模塊。通過評估結(jié)果與需求的差異不斷優(yōu)化后續(xù)策略,從而實現(xiàn)動態(tài)修正與智能迭代。
例如,當(dāng)考生傾向選擇省內(nèi)且要求985院校時,模型在執(zhí)行任務(wù)后,面對省內(nèi)985院校較少的情況,會像志愿專家一樣嘗試推薦適合的外省985高校。
夸克高考志愿大模型支撐的另一個功能是“高考深度搜索”,當(dāng)用戶輸入如“江蘇物理組考生584分,性格內(nèi)向,想找穩(wěn)定工作”這類復(fù)雜查詢時便會觸發(fā)。為提升回答的準(zhǔn)確性與專業(yè)性,模型會將考生的真實需求精細(xì)化拆解,每一類需求都對應(yīng)定制化的回答范式與要點,確保回復(fù)兼具針對性與深度。
訓(xùn)練機(jī)制揭秘:多階段、高復(fù)雜度訓(xùn)練,實現(xiàn)像專家一樣思考與決策
以通義千問為基座,夸克高考志愿大模型基于領(lǐng)域數(shù)據(jù)優(yōu)勢,通過專項訓(xùn)練具備對復(fù)雜規(guī)則與用戶需求的理解與推理能力,讓模型真正“像志愿專家一樣思考與決策”。
夸克高考志愿大模型通過一個多階段、高復(fù)雜度的訓(xùn)練范式構(gòu)建流程,融合了自監(jiān)督語義建模、監(jiān)督式對齊調(diào)優(yōu)、由專家判別價值引導(dǎo)的策略精化機(jī)制。

在指令微調(diào)階段,夸克高考志愿大模型將數(shù)百名資深高考志愿規(guī)劃師的溝通、決策過程進(jìn)行結(jié)構(gòu)化。圍繞他們與考生或家長的多輪真實對話,提取出完整分析路徑與語言風(fēng)格。通過將上萬條真實專家“推理鏈”轉(zhuǎn)化為高質(zhì)量監(jiān)督數(shù)據(jù),夸克高考志愿大模型得以深度學(xué)習(xí)人類專家的分析過程。
夸克高考志愿大模型還在復(fù)雜推理任務(wù)中生成了中間可驗證結(jié)構(gòu),顯著降低幻覺率、增強(qiáng)跨模態(tài)演繹能力,并實現(xiàn)分布外泛化魯棒性,解決各種需要專業(yè)知識的復(fù)雜問題。
最后通過基于人類偏好強(qiáng)化學(xué)習(xí)(RLHF)精化策略層,夸克高考志愿大模型構(gòu)建了一個閉環(huán)優(yōu)化機(jī)制,將“模擬填報 → 專家反饋 → 策略評分”引入到模型迭代過程中。
模型會基于模擬的考生檔案生成志愿填報方案,隨后這些方案將被提交給多位高考志愿專家進(jìn)行評估。評估標(biāo)準(zhǔn)包括:專業(yè)建議是否準(zhǔn)確易懂、排序邏輯是否貼合考生特征、是否兼顧分?jǐn)?shù)與興趣、是否充分提示風(fēng)險并給出可行應(yīng)對策略等。
夸克團(tuán)隊已完成對數(shù)千份志愿報告的專家標(biāo)注與打分,通過“人類挑刺 + 模型修正”的方式,使模型輸出在專業(yè)度與匹配度上持續(xù)逼近專家的真實判斷標(biāo)準(zhǔn)。
構(gòu)建最大高考知識庫,夯實智能決策基礎(chǔ)
與常見通用大模型多依賴網(wǎng)絡(luò)文章或過往年份數(shù)據(jù)不同,夸克高考志愿大模型搭載了一套國內(nèi)最大的實時更新、結(jié)構(gòu)嚴(yán)謹(jǐn)?shù)母呖贾R庫。該知識庫對高考相關(guān)權(quán)威站點實現(xiàn)近100%覆蓋,涵蓋全國2900多所高校、近1600個本科專業(yè),系統(tǒng)整合了院校分?jǐn)?shù)線、專業(yè)設(shè)置、課程體系等核心教學(xué)信息。
夸克高考知識庫還投入海量資源對每個省份的高考政策及權(quán)威解讀進(jìn)行梳理、實時更新。通過OCR提取、多源交叉比對與人工抽檢等多重機(jī)制,實現(xiàn)高可信度的數(shù)據(jù)引入與結(jié)構(gòu)化治理,確保模型所依賴的數(shù)據(jù)具備權(quán)威性和可驗證性。
此外考慮到志愿填報與未來就業(yè)強(qiáng)相關(guān),夸克高考知識庫還進(jìn)一步將高校畢業(yè)生就業(yè)相關(guān)信息、產(chǎn)業(yè)趨勢規(guī)劃、就業(yè)報告等納入。豐富、準(zhǔn)確的數(shù)據(jù)為模型在“沖—穩(wěn)—保”排序、就業(yè)前景評估等環(huán)節(jié)提供了有力支撐。
夸克算法負(fù)責(zé)人蔣冠軍表示:“高考志愿填報是一個信息密集、決策復(fù)雜的場景。我們希望通過高考志愿大模型在信息處理和需求理解方面的專業(yè)優(yōu)勢,讓每一個考生、每一個家庭都能夠獲得全面的參考。”
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司