- +1
大模型+數據分析,改變人類使用數據的習慣

“小李,幫我分析一下我們的貸款業務增長趨勢如何?哪個分支行的表現最好?新開設的線上理財產品的銷售額是多少?馬上給我一個分析報告”,某大型銀行的副總經理王先生,對李經理提出了這樣的數據分析需求。為了完成這個任務,李經理需要從銀行的數據平臺中獲取和分析數據,以回答領導的問題。然而,這可能涉及到一些復雜的數據操作,如連接不同的數據源(例如貸款數據庫和理財產品數據庫)、過濾和聚合數據、創建數據可視化圖表等。
以上,只是一個業務人員進行數據分析的模擬場景。事實上,隨著各行各業數字化轉型升級的持續推進,類似的數據分析場景已經遍布各個領域。隨著數據驅動決策在全球范圍內的廣泛應用,數據分析的價值日益凸顯。然而,傳統的數據分析方法往往需要深厚的技術知識和專業技能,這在一定程度上限制了其在更廣泛的場景中的應用。隨著科技的發展,數據分析的交互方式也在不斷演進。從早期的編程語言和SQL查詢,到拖拉拽的數據分析工具,我們可以看到一種明顯的趨勢,那就是讓數據分析變得更加直觀和易用。那么,我們能否更進一步呢?
在7月14日舉辦的2023 Kyligence “釋放數智生產力”用戶大會上,筆者見證了一種全新的可能——基于大模型的自然語言交互方式,來實現數據分析。接下來,我們將探討數據分析方式的演進邏輯,分析Kyligence如何將指標平臺、數據分析與大模型融合,實現基于自然語言的指標數據分析,為數據分析的未來描繪一幅可能的藍圖。
更自然的人機交互,是永恒的追求
數據分析交互方式的演進,可以視作是一場尋求更佳人機交互方式、降低分析門檻的持久探索。從早期的編程語言和SQL查詢,到拖拉拽的數據分析工具,再到基于大模型的自然語言交互方式,我們不斷在推進數據分析的普及化和易用性。
早期,數據分析主要依賴于編程語言,比如Python、R等。這類語言通常包含專門用于數據分析的庫和工具,如Python的Pandas、NumPy、SciPy等,使得程序員可以通過編寫代碼來處理和分析數據。然而,這類方式的明顯短板在于門檻較高。一方面,用戶需要掌握編程知識,包括語法、數據結構和算法等;另一方面,還需了解專門的數據處理庫和工具。這樣的要求使得非技術背景的用戶難以應對。
隨著SQL的誕生和流行,數據查詢與處理的門檻降低了一些。SQL為結構化的數據提供了一種更為高效和直觀的查詢方式,其語句近似自然語言,比如“SELECT * FROM table WHERE condition”,直觀且易學。然而,SQL仍然需要用戶掌握一定的語法知識,而且對于復雜的查詢和分析任務,SQL的語句可能會變得冗長且難以理解。此外,SQL主要用于結構化數據,對于非結構化數據,其處理能力有限。
為了進一步降低使用門檻,一種新型的數據分析工具應運而生,即所謂的拖拉拽式數據分析工具,如Tableau、PowerBI等。這些工具通過可視化的界面,讓用戶可以直觀地選擇和操作數據,創建數據可視化圖表。這種方式相比編程語言和SQL,大大降低了數據分析的門檻,使得非技術用戶也能夠進行數據分析。
然而,拖拉拽的數據分析交互方式在易用性方面還存在一些問題,主要表現在以下三個方面:
首先,盡管拖拉拽工具相對直觀,但用戶仍需要花費時間學習如何使用它們。例如,用戶需要知道如何添加和刪除數據源、如何選擇正確的圖表類型、如何應用和理解不同的數據操作(如篩選、排序、聚合等)。這些功能和概念,尤其是一些高級的數據操作和分析功能,對于沒有數據分析背景的用戶來說,可能仍然需要一段時間去理解和掌握。
其次,拖拉拽工具的操作可能會變得相當復雜,特別是對于一些高級的數據操作和分析任務。例如,用戶可能需要通過多次拖拉拽和選擇操作,才能創建一個復雜的數據儀表板或執行一次復雜的數據分析。對于一些更復雜的需求,例如需要聯結多個數據源或需要進行復雜的數據預處理,拖拉拽工具可能無法滿足,或者操作起來非常復雜和困難。
最后,盡管拖拉拽工具通常提供了豐富的數據操作和可視化功能,但用戶仍需要對數據和數據分析有一定的理解,才能有效地使用這些工具。例如,用戶需要知道哪些數據是相關的,哪些數據是可以比較的,哪種圖表可以有效地表達某種數據關系等。如果用戶對數據分析的基本概念和方法沒有足夠的理解,他們可能會感到困惑,不知道如何選擇和使用這些功能。
因此,拖拉拽的數據分析方式,門檻還是不夠低,交互方式還是不夠自然。那么什么才是最自然的人機交互方式呢?回想一下,人類平時是用什么交流的?——自然語言。既然人與人之間可以用自然語言交流,那為什么不能用自然語言來進行人機“交流”呢?如果能夠實現基于自然語言的數據分析交互,那在易用性上必然會更進一步。
Kyligence就是按照這個思路,來變革數據分析交互體驗的。
基于大模型,構建基于自然語言的數據分析方式
依據Kyligence的實踐經驗,要做好這個事情,關鍵的有三個方面:基于大語言模型來準確理解用戶數據分析需求;聯通指標平臺來進行數據計算和分析,給出分析結果;打通各個SaaS系統,以分析結果推動業務流程改善,提升管理與經營效率,實現組織協同。
首先,基于大語言模型來準確理解用戶數據分析需求。大語言模型如ChatGPT,通過訓練大量的文本數據,它們可以理解和生成自然語言,使得人機交互更加自然、便捷。在數據分析場景下,用戶可以用自然語言描述他們的數據需求,例如“我想知道上個季度的銷售額”或者“請告訴我我們最暢銷的產品是什么”。大語言模型可以解析這些需求,轉化為可以執行的數據查詢和分析任務。這大大降低了數據分析的門檻,讓非技術用戶也可以輕松地進行數據分析。
其次,聯通指標平臺進行數據計算和分析。指標平臺是一個專門為數據分析設計的系統,它可以處理各種數據,包括結構化和非結構化數據,進行復雜的數據計算和分析。在理解用戶需求后,我們需要依賴指標平臺來執行具體的數據操作,例如數據查詢、篩選、排序、聚合等,并生成分析結果。這一步是數據分析的核心環節,它決定了數據分析的質量和效率。
最后,打通各個SaaS系統,以分析結果推動業務流程改善。數據分析的目標不僅僅是獲取數據洞察,更重要的是,根據這些洞察來改善業務流程,提升管理與經營效率。因此,我們需要將數據分析結果反饋到各個業務系統中,例如CRM、ERP等,以支持業務決策和操作。例如,如果我們發現某個產品的銷售額下降,我們可以通過CRM系統調整銷售策略;如果我們發現某個供應商的供貨速度太慢,我們可以通過ERP系統調整采購計劃。這樣,我們可以實現數據驅動的業務流程改善,提升整個組織的運營效率。
需要指出的是,Kyligence并不是推出了一個“PPT產品”,而是可供客戶使用的商用版本。接下來,我們就以Kyligence Copilot這一產品,來看看基于自然語言的數據分析交互方式到底是怎樣一種體驗。
據了解,Kyligence Copilot AI 數智助理是基于 Kyligence Zen 一站式指標平臺的 AI 數智助理,結合大語言模型能力,幫助用戶通過自然語言對話完成圍繞業務指標的分析和洞察,大幅降低業務人員用數的門檻、提升工作效率。
從上面的演示我們可以看到,用戶可以直接問Kyligence Copilot“公司最近利潤情況如何?”,系統會推薦凈利潤、凈利潤月環比、凈利潤月累計等指標,用戶選定之后,Kyligence Copilot會給出分析結果。在此基礎上,Kyligence Copilot基于數據給出結論和建議,比如哪一個月利潤高、哪一個月利潤低,凈利潤的整體趨勢是怎樣的。
進一步的,Kyligence Copilot還會對更深入的數據分析給出建議,比如“可以進一步分析各個地區、商品類別的凈利潤情況,找出優勢區域和商品,進一步優化經營策略”,用戶可以依據建議一步步進行更深入的數據探索。最終,可以把這些所有的數據分析生成儀表盤,來直觀的展現數據分析結果。

對于企業管理者而言,數據分析只是手段,目的是通過數據分析找到業務上的問題,進而通過優化管理和業務流程,來提升經營效率。因而,在Kyligence Copilot的數據分析基礎上,作出管理和業務決策,并將這些決策通過打通飛書、釘釘、企業微信等系統,嵌入到整個組織的管理和業務流程中,讓數據分析的結果反饋到經營管理體系當中。
這是一條剛剛開始的征途
需要指出的是,盡管基于大模型的自然語言交互方式在理解用戶數據分析需求方面已經展現出了強大的潛力,但變革才剛剛開始,我們還需要努力解決一些挑戰,不斷提升能力和用戶體驗。
例如,需要優化大模型與指標平臺、數據分析平臺的對接方式。大模型理解并生成的是自然語言,而指標平臺通常接受的是具體的數據查詢和操作指令。我們需要一個轉換器,將大模型的輸出轉化為指標平臺可以理解和執行的指令。這可能涉及到一些技術難題,如自然語言到SQL的轉換,以及如何將復雜的數據分析需求分解為一系列可以執行的數據操作。
此外,大模型的準確性和穩定性也是一大挑戰。雖然大模型可以理解和生成自然語言,但是在一些復雜和模糊的場景下,它的理解可能并不準確,或者產生的結果可能有多種可能。我們需要提供足夠的反饋機制,以及在必要時提供人工干預,確保數據分析的結果準確和可靠。而且,數據分析通常涉及到大量的敏感數據,如用戶信息、交易數據等,我們需要確保大模型在處理這些數據時,可以充分保護數據的安全和用戶的隱私。
當然,雖然還存在一些挑戰,但這條路有異常廣闊的應用前景。將大模型與指標平臺和數據分析平臺融合,實現以自然語言進行數據分析,是數據科技領域的一次重大創新,它將深刻改變數據分析的面貌,推動各行業的數字化轉型,帶來廣泛而深遠的影響。
對于個人而言,將大大降低數據分析門檻,提升分析效率。傳統的數據分析需要學習和理解復雜的查詢語言和工具,而基于自然語言的數據分析只需要用戶用他們熟悉的語言描述他們的需求。這意味著任何人,無論他們的技術背景如何,都可以進行數據分析,實現真正的普惠數據分析。其次,這將顯著提高數據分析的效率和效果。傳統的數據分析往往需要大量的數據操作和計算,而基于自然語言的數據分析可以直接從用戶需求出發,自動進行數據查詢和分析,提供直接的數據洞察。這使得數據分析更加快速和準確,更能滿足用戶的實際需求。
對于企業而言,將加快決策速度和精準度,提升經營管理效率和業務創新能力。自然語言的交互方式,大大加快數據分析的速度,使得決策者可以更快地得到數據洞察,更快地做出決策。而且,基于大模型的自然語言理解,可以處理復雜的數據分析需求,如比較分析、因果分析、預測分析等。這將大大增強數據分析的深度和精度,使得決策者可以得到更深入、更準確的數據洞察,做出更好的決策。管理者不僅可以快速獲取業務洞察,還可以根據洞察調整業務流程,甚至是與其他SaaS系統的集成,這將極大地提高企業的業務效率和運營效率。數據分析是數字化轉型的關鍵環節,它可以幫助企業理解和利用他們的數據,創新產品和服務。
對于社會而言,將推動社會數字化轉型。基于自然語言的數據分析,可以讓更多的企業和個人參與到數據分析中來,進一步推動各行業的數字化轉型。數據分析可以幫助我們理解和解決各種社會問題,如公共衛生、環境保護、教育公平等。基于自然語言的數據分析,可以讓更多的人參與到這些工作中來,共同推動社會的進步。可以預見,隨著數據分析的普及和深入,社會將有更多的機會發現新的業務模式、新的市場機會、新的社會需求。
想象一下,當這種數據分析方式大規模推廣后,我們將會看到一個全新的數據分析生態。在這個生態中,任何人都可以輕松地進行數據分析,找到他們需要的答案和洞察。各行各業都可以充分利用他們的數據,優化業務,提高效率,創新產品。我們的社會也會因此變得更加公正、更加高效、更加創新。這將是一個美好的未來,值得我們共同期待和努力。
文:月滿西樓 / 數據猿
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司