男生插女生下面的视频_麻豆视频福利_国产视频不卡在线_黑人巨大精品欧美一区二区区

GBase新聞

專注于數據庫軟件產品和服務,致力于成為用戶最信賴的數據庫產品供應商

GBASE視角:云原生數倉選型關注性能、監控運維、多云等因素

發布時間:2024-05-23

隨著云計算技術的迅速發展和企業數字化轉型的需求日益增強,云原生數據庫已經受到越來越多企業的關注。IT168&ITPUB啟動《云原生數據庫選型指南》選題,調研采訪一線專家,了解云原生數據庫的發展現狀、核心技術特性,以及云原生數據庫在各行業落地的痛點、難點和實踐經驗,梳理企業機構在云原生數據庫選型時的重點關注因素,供業內參考。

近期,南大通用GBase 8a產品經營部總經理關連坡接受了ITPUB的采訪,介紹了南大通用對云原生數據庫的定義,以及云原生數倉應用場景和企業選型關注因素。

 

什么是真正的云原生數據庫?

云原生數據庫是數據庫未來趨勢,也是當前一個比較熱門的話題。然而,業內對云原生數據庫還沒有統一的定義。

根據百度百科詞條,云原生數據庫是一種云原生數據基礎設施,是一種完全利用公有云優勢的數據庫服務,具備極致的彈性伸縮能力、無服務器(Serverless)特性、全球架構高可用與低成本,并可以與云上其他服務集成聯動。

根據沙利文《2023年中國云原生數據庫十大廠商推薦》,云原生數據庫是基于云計算基礎設施特點進行架構設計,充分利用云上計算、存儲、網絡等資源,從而實現性能增強與功能范圍擴大的數據庫。

關連坡指出,市場上對云原生數據庫存在定義不統一的現象,比如有人認為數據庫上云就是云原生數據庫,有的人認為云廠商的云上數據庫就是云原生數據庫,這樣的理解比較片面。

云的特征是大規模、靈活、共享、充分彈性,云原生數據庫一定要滿足各個資源能夠充分彈性擴展,支持大規模使用,在部署和使用時具有靈活性、便利性,才能稱為云原生。”關連坡說。原來計算資源和存儲資源都部署在一個盒子(硬件)里,云能夠將計算和存儲分別虛擬化,所以云原生數據庫需要支撐計算和存儲的資源都能虛擬化使用。

存算分離可以說是云原生數倉的基礎前提,傳統的MPP數倉是存算一體架構,計算資源擴容,需要數據重新分布,要做數據搬遷,即便上云也無法做到靈活彈性擴容,成為限制數倉進一步發展的瓶頸。以Snowflake、GBase GCDW為代表的云原生數倉,采用存算分離架構,將存儲和計算解耦,可以充分發揮云原生的靈活彈性優勢,能夠按需付費,這是數據倉庫技術的一個突破。

關連坡進一步指出,以GBase GCDW為例,實現計算資源、存儲資源和元數據的管理可以充分彈性,并且很多組件都充分容器化,能夠易運維管理,這是判斷云原生數據庫的一些技術指標。

總體而言,從供給與需求的角度來看,數據庫作為中間層,需要隨著上層應用需求以及底層基礎設施的變化而演變,從架構、內核等層面基于云時代的存儲、計算、網絡資源進行重構,以充分發揮云的優勢,并不是數據庫簡單上云就能稱為云原生數據庫。

 

云原生數倉應用場景及需求

關連坡介紹,業務快速發展,對數據庫的擴展性、彈性、運維管理提出了更高的要求,可能會用到云原生數倉,不同業務的需求會存在差異,據他觀察,云原生數倉主要有以下場景:

一是敏態業務,需要資源彈性伸縮同時對穩定性有較高要求的場景,比如金融業的報表計算和精準報送,需要滿足監管需求,這樣的場景不能有時間延遲,跑批和報表加工時間需要嚴格把控。云上資源是共享資源,容易出現爭搶,為了避免出現性能波動影響跑批,往往采用云內裸金屬充分隔離的方式部署云數倉。

二是分析師業務和互聯網金融實時分析場景,需要數據充分共享,存儲資源和計算資源按需使用,這是比較典型的云原生數倉場景。尤其是一些敏態開發ToC業務,很適合使用云原生數倉。

三是政務云業務,其時效性沒有金融報表那樣高,政務云上很多是政務辦公系統,使用云原生數倉對于敏捷應用開發比較友好,更加靈活彈性。

關連坡與一些客戶交流發現,隨著云計算多年發展,現在數據庫上云已經被大多數頭部企業接受,不過像金融這樣的關鍵行業相對謹慎,雖然對云原生數倉比較感興趣,但是目前大多還處在觀望、試探中。

這些金融客戶會存在一些顧慮,會考慮云原生數倉在其他大行的應用落地情況,此外,云原生數倉與傳統的MPP數倉架構不同,Schema 設計、算法和運維存在差異,比如容器化后的日志收集、查看等有較大大不同,行業內需要培養更多的兼顧云和數據倉庫產品運維技能的人員,來滿足云化后基礎設施的用人需求。

 

選型關注因素:性能、監控運維、成本、多云

數據庫選型從來不是一件容易的事情,關連坡介紹,企業機構在選擇云原生數倉時主要考慮以下幾個因素:

一是監控運維,問題定位。當業務出現問題,很多客戶會關注能否區分是云的問題還是數倉的問題,這需要云原生數倉的指標監控更加細致。傳統數倉技術棧,數倉跑在操作系統和硬件上,是一個相對成熟可信的環境,有成熟的監測能力,出問題的概率也較低。云原生數倉,網絡、CPU、內存、存儲都進行了虛擬化,增加了技術棧的復雜性,對于問題的定位增加了難度,一旦出現網絡波動,能否快速定位問題非常重要。

二是版本維護。傳統MPP數倉直接部署在物理環境,業務之間充分隔離,以銀行為例,每套業務單獨部署一套,升級維護相對簡單。但是上云之后,所有組件都是靈活狀態,作為統一的云原生數倉,擁有很多公共組件,如何隨著業務需求改變進行組件升級是一個問題,這與產品標準化程度相關,GCDW具備灰度在線升級能力,可做到無感升級。

三是性能問題,是否能保證與原有相同資源的情況下性能不降,提供更優的性能。

四是成本管理問題,傳統部署模式在原有硬件基礎上的資源消耗成本相對可控,容易評估,在云上如何評估成本讓成本變得可控是企業會關注的問題。

五是充分容器化后,關于容器的易失性問題是否可以解決。

六是多云支持,為了避免云鎖定、規避風險,充分利用不同云的優勢,企業通常會采用多云戰略。企業會關注云原生數倉是否與主流云進行了適配,不同云對于外部組件的應用權限開放并不一樣,需要數據庫層面做很多適配工作。

關連坡指出,數據倉庫不應該挑選基礎設施,云也是一種基礎設施,像南大通用這樣的云中立數據庫廠商,一方面要和主流云廠商進行適配,以滿足企業多云戰略需求,同時數據倉庫要打破包括云在內的所有基礎設施的限制,屏蔽底層基礎設施的復雜性,不管是一朵云還是多云,不管是公有云、私有云或是混合云,甚至傳統硬件部署,都可以支持,滿足各種業務場景需求。

云原生數據庫是整個云生態的一員,未來的發展需要云基礎設施、數據庫、應用整個云生態一起努力。