- +1
國產數據庫的逆襲,OceanBase再造OceanBase

有這樣一群人,他們原本是互聯網大廠的“工程獅”,卻一路選擇了最難的道路,2010年,20人團隊要“去IOE”中的O,甚至要和Oracle甲骨文、Google谷歌這些公司在數據庫上較量一番。
“不知天高地厚,是不是只是玩票。”質疑聲從未停止。但偏偏這群最偏執的追夢人,在2019年的「數據庫領域的世界杯」,打敗了稱霸這一領域9年的Oracle。他們的夢想還不止于此,要讓更多的企業都用上新一代分布式數據庫。2020年6月8日,為了完成這個夢想,他們從大廠中獨立出來創業。
十年冷板凳,這是屬于這群最“偏執”人的追夢歷程。今年,他們把300萬行代碼開源,創造屬于自己的社區生態,這又是一項國內技術領域創舉。在上周六的HICOOL 全球創業者峰會上,再次宣布“創計劃”為中小企業“全免服務”。
聚集這群人的公司名為“北京奧星貝斯科技有限公司”,如果你對這個名字陌生,那并不意外。提起他們的產品,你也許聽說過,名為“OceanBase”分布式數據庫。如果再說起他們服務的客戶,你一定不陌生,10億級用戶的支付寶平臺,工商銀行等200多家客戶。
10年前,OceanBase為何立下Flag,10年后,他們為何又從螞蟻集團中獨立?如今,又為何要獨立打造自主的開源技術社區?現在,為何又要為中小企業提供全免服務?
在剛剛結束的HICOOL全球創業者峰會期間,北京奧星貝斯CEO楊冰接受了Tech星球的專訪,講述了OceanBase戰略發展的思考,以及開源、服務中小企業背后,再造OceanBase的邏輯,這群追夢人將自己演繹成了數字時代的主角。
01 底氣
在科技互聯網時代,芯片和操作系統是大家熟知的技術高峰,而數據庫由于概念難懂,大眾對其認知并不深刻。實際上數據庫也是俗稱的“卡脖子”技術。在 2020 年 6 月科技日報發布了制約我國工業發展的 35 項技術,數據庫管理系統即名列其中。
一直以來,國內企業的數據庫,大都采用的是Oracle和IBM的傳統關系型數據庫。這兩家企業在全球范圍內,也是數據庫的執牛耳者,Oracle一家的全球市場份額就超過50%。但對于很多快速發展的互聯網企業來說,數據呈指數級增長,數據庫卻只能搭積木式的維持。
“這個事情有專業詞語叫Scale up。”楊冰告訴Tech星球,”就像是你拿了一輛車,不斷地給它裝更高的配件。四缸變八缸變十二缸,但是再怎么樣加配,你也是只能不斷的升級,而不是換代。“
傳統關系型數據庫的水平擴展能力的缺失以及高昂價格,讓不少企業開始思考有沒有更好的替代方案。方案肯定是有,當時谷歌發布了 Google Spanner分布式數據庫。“這種新型數據庫架構也叫scale out,支持水平擴展。“楊冰形象地向Tech星球解釋:”它可以連接形成一個網絡,可以線性的擴展,只要加機器就有,這種方式就讓它的處理性能沒有天花板。”
當時,Oracle不是沒有意識到這種新型數據庫的潛力,只是自己傳統集中式的數據庫,與互聯網時代的分布式數據庫,天然存在利益沖突。Oracle沒有決心革掉自己的命,還得在8年之后才深刻意識到。
Oracle躺著賺錢的心思不難理解,但對于阿里來說,其不僅是Oracle亞太地區最大客戶,還是擁有全球最大的Oracle集群。每年繳納巨額的費用,卻日漸無法滿足淘寶和天貓的發展。這讓阿里動了換掉Oracle的心思。
楊冰回憶當時的起步緣由,創業團隊從2方面考慮后決定做數據庫。第一,現在淘寶的發展需要新型數據庫,業務發展需要;第二個數據庫相當于畢竟是軟件領域當中的“芯片”,應該是軟件當中,除了操作系統以外最難的產品。
“所以在這個層面上,我們也希望能夠去打造一個中國的品牌,真正純正的中國品牌,不是基于開源的技術。”很少有人知道,當時Oracle是最好的外企offer,畢業生都以進入Oracle、IBM和SAP為榮,阿里和騰訊無論是薪資還是名氣都還排不上號。
就是在這樣的背景下,現北京奧星貝斯首席科學家、OceanBase創始人陽振坤等人,已經開始了研發之路。這里還有插曲,也正是當年選擇了全部自研,10年后,OceanBase才能選擇 Open Core 商業模式,將300萬行核心代碼全部開源。
沒人能打包票一定成功,那時阿里還有很多團隊在做數據庫,大家的技術路線也并不相同。留給OceanBase的機會并不多,最早只是在淘寶的收藏夾,這樣一個小場景中適用。
在OceanBase發展的第二階段,得到了“阿里云之父”的王堅博士的支持,他說服了原螞蟻集團的CTO魯肅。“新型分布式數據庫在金融場景下應該是更適合。”
就這樣,OceanBase并入螞蟻,真正迎來跨越式發展,開始在螞蟻集團的業務中登臺亮相。楊冰說,“有一年雙十一計劃給我們1%的業務量,后來公司問我們雙十一交易高峰給你10%行不行,我們說行。也沒有別的選擇,就來吧。然后頂過去了,頂過去就一戰成名。”

在互聯網場景中淬火的OceanBase,尤其經歷螞蟻集團的金融+互聯網的鍛煉,驗證了其能力,也成就了OceanBase一張閃亮的名片。
最值得紀念的時刻,也是在OceanBase,他們實現了挑戰技術霸主的愿望。
在2020年9月,數據庫領域最權威的國際機構國際事務處理性能委員會 TPC 在官網發表了最新的 TPC-C 基準測試結果, OceanBase 以 7.07 億 tpmC 的在線事務處理性能,打破了自己在 2019 年創造的世界紀錄。
02 硬仗
技術上登頂后,能不能改變國內數據庫市場的格局?
在OceanBase成立10年后,這群偏執的人又給自己提出了這些疑問。離開巨頭的懷抱,OceanBase獨立出發了。
產品能不能經受的住客戶考研?能不能讓客戶心甘情愿換代?獨立后怎么養活自己?這些疑問是這幫技術人才,過去沒有考慮過的問題。在2020年6月份成立后,他們還是勇敢邁出了這步。
但迎接OB的,并不是鮮花和掌聲。如今中國現在兩百多家數據庫,現在數據庫已經構成當年滴網約車大戰,共享單車大戰那種感覺。“大家都在搞,也是因為開源把入門的門檻變低了。”
這些開源的數據庫產品,往往是基于MySQL或PostgreSQL 進行二次開發。演化的路徑也分為兩個派系,一方面OLTP(事務型),另一方面是OLAP(分析型)。但企業發展至今,往往需要兩者數據庫配合使用,但兩者配合使用時存在延時的問題。這時候,HTAP型數據庫就開始成為新一代主流數據庫類型。
OceanBase就是這種數據庫的代表,由于HTAP基于分布式架構,支持彈性擴容,可輕松應對高并發和海量數據庫場景。但也是相對傳統關系型數據庫的這些優點,讓不少企業開始質疑,OceanBase的產品,真的有這么厲害嗎?
中國人保健康也經歷了這種從質疑到相信的過程,在最初,中國人保健康后臺需要離線處理保單,系統效率平均下來每單需要耗費 5 秒的時間。在接入支付寶合作后,巨大的流量沖垮了其傳統的集中式架構。這時候支付寶自身采用的OceanBase分布式架構,走向其視野。
采用OceanBase的架構后,最明顯的變化是,處理能力也從過去的 5 秒 1 單到現在每秒千單,系統保單的處理速度從 4 個小時縮短為 6 分鐘。業務前臺接入互聯網,后端采用新一代數據庫處理業務,中國人保健康也體驗了一把“互聯網速度”。

不僅是中國人保健康,在為期3個月的觀察驗證之后,中國工商銀行與螞蟻集團OceanBase、阿里云技術團隊共同制定主機下移方案,并于今年9月正式投產。兩地三中心的分布式集群,五副本+主備模式的高可用,傳統金融單位也越來越信任OceanBase。
事實上,國內外的金融和電信行業,曾經是Oracle和IBM的數據庫絕對壟斷的領域。在OceanBase不斷攻克傳統金融巨頭時,難道Oracle沒有反擊嗎?
Oracle一直是王者,但英雄遲暮也是眾所周知。2019年5月,一則Oracle中國區首批裁員900人,賠償N+6的消息爆出,揭開了Oracle大調整的序幕。背后OceanBase等國產數據庫的進擊,以及Oracle市場份額從壟斷到跌落至17%左右。
03 OceanBase的成人禮
創業后,OceanBase也體會到獨立過日子的不容易。
“以前是一個產品技術主導的一個體系,但是從去年開始,我們成立商業化團隊之后,我們要把客戶放在第一位。因為我們得從內走到外面,得到市場的肯定。這個時候客戶的業務環境不同就有定制化的要求,我們就要去做定制化的開發。”
獨立后的OceanBase樹立10大標桿客戶,主動上門布道,主動提供VIP服務,讓客戶真正把OceanBase用起來。

在這些企業中,使用效果如何?據楊冰告訴Tech星球,比原來集中式的數據庫使用成本幾乎降低一半:"50-80%都有可能,規模越大節約成本久會越大"。
但是它會有個下限,據楊冰介紹,如果客戶只有三、五臺,那就沒有這個效果,如果說超過七、八十臺,一百臺MySQL的實力,這個規模下如果全部換成OceanBase,效果會很明顯,起碼砍一半成本以上。
但對于想顛覆國內傳統數據庫的局面,OceanBase還有很多事情要做。最關鍵的地方在于,盡管OceanBase兼容MySQL、Oracle等傳統數據庫,但是OceanBase的產品如何更快被企業接受,如何快速建立起不同于MySQL和PostgreSQL的第三套自研生態體系,都是一件任重道遠的事情。
過去10年,楊冰形容OceanBase是在阿里巴巴和螞蟻的這種“雙十一”喂出來,磨出來的,在最復雜和海量的業務環境中磨練出來。但在未來如何打動中小企業,吸引其替換底層數據庫是重點,“分布式數據庫還是一個巨大的新興的市場,Google Spanner 還沒有開源,OceanBase在國內率先開源共創,就是期待抓住這一時代機遇。”
楊冰具體解釋道:“因為開源開放很多參數可以調,很多其實他自己可以去適配,所以會更容易。我們在今年的6月1號,正好成立1年的大會上宣布開源。”這次開源后,開發者更容易下到OceanBase的代碼,看到OceanBase的原理,中小企業可以去DIY去使用和調配。
據了解,在9月份的HICOOL 2021全球創業者峰會上,楊冰正式宣布“創計劃”。“創計劃”強調“全免服務費”, 解決中小企業數據庫的技術痛點,首期“全免服務費”權益向100家中小企業開放。免費服務項目包括:前期的技術咨詢、人才培訓、數據遷移等全鏈路的技術服務。
創計劃的推出,也意味著國產數據庫的開源與服務中小企業口號,不是玩虛的。與國內眾多企業一起共創未來,這將促使100%自主研發的OceanBase進化成何種模樣,也是件值得關注的事情。
據介紹,目前在生態合作方面,OceanBase 在產業端也與40家伙伴完成了深度合作;OceanBase 認證工程師達到1萬+;技術/服務類伙伴也拓展至12家;此外還投入千萬級資源參與高校人才建設;而在客戶服務方面,目前 OceanBase 也累計服務200家客戶。
“在中國并不缺一家數據庫的公司,但卻缺少一家真正能夠完成核心替代的高端數據庫。”楊冰總結道,期待OceanBase 可以實現最終夢想,成為國內外企業做最多選用的分布式數據庫。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司