GBase GCDW
云原生數據倉庫GCDW
產品簡介
產品介紹
南大通用云數據倉庫GBase Cloud Data Warehouse(簡稱 GCDW)是一款自主研發的基于列存儲的海量分布式大規模并行處理的多實例彈性云數據倉庫。GCDW既支持本地部署(私有云下的計算與存儲分離模式)也支持云上部署,采用存算分離架構,支持計算資源和存儲資源的無限獨立擴展,適用于分析類型的大數據平臺、綜合性BI系統、數據倉庫和集市系統。
產品架構
存儲計算分離,統一元數據、無狀態計算節點
云服務
- 負責云數據倉庫實例的訂購服務
- 負責創建/刪除云數據倉庫實例
- 提供云數據倉庫實例訪問入口(URL)、鑒權、訪問控制、語法解析、生成執行計劃、優化、元數據管理與存儲、事務管理及執行調度管理、用戶及權限管理、Warehouse管理、Database管理和云數據倉庫功能服務等
- 提供管理和運維服務能力,包括訂單管理、計費管理、云數據倉庫實例賬戶管理、云服務監控運維管理、云數據倉庫實例管理和升級云服務管理、升級云數據倉庫管理
虛擬倉庫
- 負責管理不同規格計算資源
- 負責提供不同規格計算資源的算力
- 負責緩存臨時數據
數據存儲
- 提供分布式對象存儲能力,用于持久化云數據倉庫數據文件
- 提供查詢過程中臨時表數據的緩存
- 提供結果集緩存的持久化
SAAS服務優質體驗
無需安裝部署
完成訂購后云數倉實例自動后臺部署,開箱即用,縮短業務上線時間
自動調優
智能索引自動維護;數據特征相關統計信息自動更新,基于CBO的優化器,保證生成最優執行計劃,省去繁復的數據庫調優工作
簡單易用的Web用戶界面
提供豐富的開發、管理功能、工具集成功能,為客戶提供簡單易用的數據庫開發和使用環境
支持多云部署
支持多種公有云環境下的部署,給客戶更多選擇;支持跨域、跨云的一致性數據服務接口,滿足大型用戶不同地域的業務運營和監管要求;提供不同公有云間數據倉庫的數據復制和遷移工具,支持跨域和跨云的數據查詢;支持混合云方式部署,兼顧私有云的自主性和公有云的彈性。
無需維護
節點故障、版本升級、負載均衡均由云數據倉庫后臺功能提供,無需客戶儲備專職DBA和系統運維人員,節省運維成本;
按實際使用計費幫助用戶降低使用成本
存儲資源根據實際使用的存儲容量計費;計算資源根據集群的規模和使用時間計費;允許用戶在無SQL任務執行的情況下自動關閉計算資源服務。
核心優勢
極致彈性
采用K8s部署方式時,GCDW提供極致彈性,可快速擴容和縮容,支持創建多虛擬倉庫,支持自動彈性。
秒級擴容縮容
采用存儲、計算分離的架構,存算獨立部署,獨立擴展;統一元數據服務,實現了計算集群、管理集群無狀態,可以實現秒級的擴容,無需進行數據重分布。
SaaS 服務
無需安裝部署,開箱即用,訂購后自動部署,縮短業務上線時間;無需運維,自動調優;提供簡單易用的WEB開發、管理功能。
物理多租
租戶間資源隔離,租戶內通過不同的虛擬倉庫計算資源負載不同的業務,多租戶資源隔離,支持按需申請計算資源徹底解決傳統數倉混合負載問題。
降低成本
在公有云上,采用 SaaS 服務提供方式,無硬件投資和部署成本;云上自動版本更新,故障恢復,服務7*24小時無停機,用戶無運維成本,僅需按使用量支付費用。
適用場景
提升算力使用場景:解決計算資源不足問題
業務場景描述:
租戶在申請云數倉實例時,申請了一個中等規模的虛擬倉庫。在其業務初期,業務負載不高,虛擬倉庫的算力可以滿足客戶的業務請求。隨著用戶業務規模的擴大,業務數據量不斷增加,虛擬倉庫對業務請求的響應時間因為數據量的增大而變長,使得客戶業務響應變慢。
云數倉解決方案:
可以通過修改虛擬數倉的規格,增加虛擬倉庫的算力。該擴容過程,可由用戶使用云數倉的界面操作完成,云數倉可以實現秒級擴容,無需數據重新分布
提升吞吐量使用場景:解決并發處理能力不足問題
業務場景描述:
租戶在申請云數倉實例時,申請了一個中等規模的虛擬倉庫。在其業務初期,虛擬倉庫的算力可以滿足客戶的業務請求。隨著用戶業務的發展,客戶數量不斷增加,對虛擬倉庫的并發請求量成倍增長,單個虛擬數倉可承載的并發量是有限的,超過部分會排隊等待處理造成時間拖延。
云數倉解決方案:
通過創建多個虛擬數倉提升并發訪問量和吞吐量。例如在1個虛擬數倉的基礎上再新創建兩個相同規格的虛擬數倉。 該擴容過程,可由用戶使用云數倉的界面操作完成,虛擬數倉秒級創建完成,多個虛擬數倉可以訪問相同的業務表。
業務消峰使用場景:解決業務請求存在波峰波谷不平穩問題
業務場景描述:
一天24小時以內,平時總數50個并發左右,總會有1個或者2個業務高峰,超過100并發連續持續1小時左右
云數倉解決方案:
使用云數倉系統的自動彈性功能。在創建虛擬倉庫時,配置該虛擬倉庫最多有3個計算集群,其中1個計算集群保持一直啟動承載業務,兩外兩個計算集群由業務的并發量自動觸發。比如每個計算集群可承載的最大并發量為50,那么,當業務并發量每大于50時,云數倉系統自動調度啟動一個新的計算集群開始承接業務請求;業務并發量下降到50以下的時候,自動啟動的計算集群在沒有業務請求的條件下自動停止。
云數倉實例內多租:解決部門級資源爭搶問題
業務場景描述:
一個企業客戶A具有多個下屬部門,各個部門期望以獨立的資源使用數據倉庫系統執行各自的業務計算。例如:5個部門,部門1、部門2、部門3各自獨立使用計算資源,部門4和部門5共享相同的計算資源。
云數倉解決方案:
企業客戶A作為租戶申請云數倉實例Ins,該租戶在云數倉實例Ins依據自身的組織結構及業務需要規劃創建多個數據庫角色,然后為每個角色創建響應的計算資源即虛擬數倉和數據庫,再分配給對應的部門使用,以滿足上述業務場景的使用需要。
混合負載使用場景:解決數據加載和數據分析同時執行導致的資源爭搶問題
業務場景描述:
一個企業客戶B在僅具有一個數據倉庫的情況下,執行加載業務時會因資源爭搶而導致查詢業務性能下降,甚至影響業務的開展。
云數倉解決方案:
企業客戶B可以創建兩個虛擬數倉,一個用于業務查詢,一個用于數據加載;前者可以始終處于集群啟動狀態,后者僅在執行加載業務的時候啟動,加載完成以后虛擬數倉停止運行,節省系統資源。