▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

DeepSeek深度解析政府工作報告:今年有兩大關鍵詞

澎湃新聞記者 杜海燕 陳良賢 衛瑤 孔家興
2025-03-05 13:44
來源:澎湃新聞
? 美數課 >
字號

2025年3月5日上午,十四屆全國人大三次會議在人民大會堂舉行開幕會,國務院總理李強作政府工作報告。

基于2025年《政府工作報告》,澎湃新聞透過DeepSeek AI大模型,使用文本向量化的數據分析方法,深度解析報告中的政策密碼。

澎湃新聞分析發現,根據2025年《政府工作報告》,今年的經濟社會發展任務里,“發展”和“建設”是兩大關鍵詞。

以“發展”為關鍵詞,通過文本向量化分析,澎湃新聞找到了上百個關聯度較高的詞匯,如“經濟”“創新”“產業”“民生”等。

不僅如此,2025年《政府工作報告》中,“建設”也在圍繞著“現代化”“教育”“科技”等維度展開。

結合中國政府網上的1978年-2024年的《政府工作報告》,澎湃新聞進一步回顧了這48年的《政府工作報告》。

分析發現,48年間,“發展”“建設”以及“經濟”等詞匯,一直高頻出現,是《政府工作報告》中的“常青詞匯”。

還有部分詞語愈發頻繁地出現在《政府工作報告》中,比如“創新”“民生”“就業”。因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”。

另外,在2025年《政府工作報告》中,還出現了過去47年未曾提及的詞語,例如“具身智能”“智能機器人”“投資于人”等。

分析方法:

1. 本文所有原始文本材料來自中國政府網1978年至2025年政府工作報告。

2. 基于DeepSeek等AI大模型的文本向量化技術,對2025年工作展望的高頻詞進行關聯分析,通過提取共現向量和語義相似度向量,量化計算高頻詞間的關聯關系。

3. 本文使用jieba分詞(https://github.com/fxsjy/jieba/)。采用精確分詞模式,避免重復分詞和歧義。分詞結果均去掉數字、單字、標點符號。

4. 為增加分詞正確率,在jieba分詞的基礎上加入自定義詞典,自定義詞典主要包含了往年人民網和新華網統計的兩會熱詞。

5. 在分詞基礎上,采用TF-IDF加權技術。詞語的重要性隨著它在文本中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。本文使用的語料庫為1978年至2025年政府工作報告文本。

    責任編輯:呂妍
    校對:丁曉
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            主站蜘蛛池模板: 张家港市| 龙州县| 望谟县| 台前县| 革吉县| 广灵县| 大丰市| 岳阳县| 庆阳市| 夏津县| 大埔县| 兴安县| 玉林市| 桂阳县| 惠东县| 浦城县| 泰州市| 游戏| 两当县| 万荣县| 卢龙县| 临夏县| 兴业县| 安徽省| 海林市| 滦平县| 淮安市| 青龙| 略阳县| 临桂县| 天全县| 安义县| 汤原县| 曲松县| 耒阳市| 巴彦县| 彭阳县| 铜梁县| 德清县| 苗栗县| 华蓥市|