▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

DeepSeek深度解析政府工作報告:今年有兩大關鍵詞

澎湃新聞記者 杜海燕 陳良賢 衛瑤 孔家興
2025-03-05 13:44
來源:澎湃新聞
? 美數課 >
字號

2025年3月5日上午,十四屆全國人大三次會議在人民大會堂舉行開幕會,國務院總理李強作政府工作報告。

基于2025年《政府工作報告》,澎湃新聞透過DeepSeek AI大模型,使用文本向量化的數據分析方法,深度解析報告中的政策密碼。

澎湃新聞分析發現,根據2025年《政府工作報告》,今年的經濟社會發展任務里,“發展”和“建設”是兩大關鍵詞。

以“發展”為關鍵詞,通過文本向量化分析,澎湃新聞找到了上百個關聯度較高的詞匯,如“經濟”“創新”“產業”“民生”等。

不僅如此,2025年《政府工作報告》中,“建設”也在圍繞著“現代化”“教育”“科技”等維度展開。

結合中國政府網上的1978年-2024年的《政府工作報告》,澎湃新聞進一步回顧了這48年的《政府工作報告》。

分析發現,48年間,“發展”“建設”以及“經濟”等詞匯,一直高頻出現,是《政府工作報告》中的“常青詞匯”。

還有部分詞語愈發頻繁地出現在《政府工作報告》中,比如“創新”“民生”“就業”。因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”。

另外,在2025年《政府工作報告》中,還出現了過去47年未曾提及的詞語,例如“具身智能”“智能機器人”“投資于人”等。

分析方法:

1. 本文所有原始文本材料來自中國政府網1978年至2025年政府工作報告。

2. 基于DeepSeek等AI大模型的文本向量化技術,對2025年工作展望的高頻詞進行關聯分析,通過提取共現向量和語義相似度向量,量化計算高頻詞間的關聯關系。

3. 本文使用jieba分詞(https://github.com/fxsjy/jieba/)。采用精確分詞模式,避免重復分詞和歧義。分詞結果均去掉數字、單字、標點符號。

4. 為增加分詞正確率,在jieba分詞的基礎上加入自定義詞典,自定義詞典主要包含了往年人民網和新華網統計的兩會熱詞。

5. 在分詞基礎上,采用TF-IDF加權技術。詞語的重要性隨著它在文本中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。本文使用的語料庫為1978年至2025年政府工作報告文本。

    責任編輯:呂妍
    校對:丁曉
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            主站蜘蛛池模板: 星子县| 汾西县| 尼玛县| 贡山| 保亭| 东方市| 上高县| 吴江市| 玉溪市| 阿巴嘎旗| 龙南县| 常宁市| 乌鲁木齐县| 任丘市| 栾川县| 三台县| 乐东| 江达县| 思茅市| 鹰潭市| 金湖县| 洪洞县| 溧阳市| 山东省| 罗田县| SHOW| 高邑县| 西吉县| 合山市| 祁门县| 道孚县| 乌兰县| 紫云| 海兴县| 乌审旗| 卓尼县| 开封县| 永川市| 博湖县| 遂川县| 烟台市|