- +1
螞蟻集團發布PB級實時分析數據庫
·OceanBase 4.3推出列式存儲引擎,構建PB級實時分析數據庫,可實現秒級實時分析,進一步加強TP(事務處理)/AP(分析處理)一體化。

OceanBase 4.3推出列式存儲引擎,構建PB級實時分析數據庫。
數據庫是基礎設施的基礎設施,是存放數據的倉庫。4月20日,在第二屆OceanBase開發者大會上,螞蟻集團原生分布式數據庫OceanBase 4.3發布。該版本推出列式存儲引擎,構建PB級實時分析數據庫,可實現秒級實時分析,進一步加強TP(事務處理)/AP(分析處理)一體化。
OceanBase首席科學家陽振坤表示,數據庫尤其是事務處理的數據庫需要大量業務長時間打磨才能做起來,但沒有多少業務愿意做數據庫的“小白鼠”,這使得數據庫的成長非常艱難。從上世紀80年代商業數據庫誕生到今天,主流數據庫仍是一個手都數得過來。
“上世紀80年代的商業數據庫和數據庫產業一起成長起來。到了上世紀90年代,一些人覺得商業數據庫太貴了,他們希望做一些大家都用得起的數據庫,所以就出現了兩個開源數據庫。這兩個開源數據庫在市場上經過長時間廣泛使用,從邊緣到中心成長起來。再之后,就沒有數據庫長出來了。”但陽振坤表示,互聯網帶來了挑戰也帶來了希望,“因為有新需求,有大量并發,有海量數據,還有對數據庫性價比更高的要求。”
2022年發布的OceanBase 4.0是一款100%根自研數據庫,從技術上首次突破分布式數據庫的單機性能瓶頸,實現單機分布式一體化。目前在一體化上,OceanBase已實現單機分布式一體化、TP/AP一體化、云上云下一體化、多模一體化等,用一個數據庫滿足客戶80%的場景需求。
此前,面向企業在強OLTP(在線事務處理)場景中的AP需求,OceanBase構建了混合事務和實時分析處理(HTAP)能力,在OLTP基礎上提供復雜查詢優化、秒級低時延響應、水平線性擴展(千/億級數據關聯查詢)能力,部分滿足了企業的AP場景需求。但隨著數字化發展,越來越多企業需要更強的數據實時分析能力,在分布式數據庫的架構中實現更強的AP性能成為新的探索命題。
OceanBase 4.3從AP存儲入手,推出列式存儲引擎,實現可行存、可行列混存和可列存的多種存儲方式,同時融入分布式TP核心能力小事務寫入技術,有效消除數據導入延遲,滿足更嚴苛的AP實時分析需求。同時推出基于Column數據格式描述的2.0向量化引擎和物化視圖,進一步提升深度AP場景下的性能表現,可實現秒級實時分析,極大提升OLAP(在線分析處理)實時分析的能力。
目前,OceanBase已服務超過1000家行業客戶,其中30%將其應用于核心系統。例如海底撈將OceanBase應用于會員系統,既做事務處理又進行實時分析,為每位會員推薦定制化內容,實時分析算力提升30%,數據庫成本下降35%,更從容應對節假日流量高峰。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司