GBase新聞
GBase 8s監控平臺系列之安裝簡介
平臺簡介
統一數據平臺監控與運維系統是南大通用數據技術股份有限公司開發的數據庫配套工具。為用戶提供了可視化的數據庫節點監控數據,及時的報警功能,直觀的數據庫節點狀態和性能趨勢展示,可靠的數據分布視圖和數據庫節點會話、系統日志等展示。
統一數據平臺監控與運維系統主要包含采集代理、采集中心和監控網站三大部分功能模塊:
Agent:監控數據采集代理,部署到所有待采集數據的數據庫節點。
Center:數據采集中心,用于統一協調各個Agent的數據采集,并對采集到的數據進行邏輯運算處理,存儲到資源庫。
Website:監控網站,提供監控界面,與用戶進行交互,完成數據庫節點監控功能。
安裝與初始化
解壓自動安裝包
本平臺支持多個操作系統,以Linux操作系統為例,其他操作系統使用相應的安裝包。假設安裝包為GBase8sV8.8Monitor_1.0.0_1_Linux_x86_64.tar,并將其放置到/opt/gcm_install目錄下,并解壓該壓縮包。
啟動服務與連接配置
在部署web端的時候采用全局的統一配置,就可以實現web端的部署和啟動。簡化流程,從而實現安裝部署的易用性,并實現了再web端進行采集中心以及采集代理的頁面化安裝配置,減化了各自安裝的繁瑣步驟。
步驟一,進入解壓好的安裝包,進入tomcat的bin目錄,執行./ startup.sh命令啟動tomcat(文檔中使用tomcat)。
步驟二,啟動tomcat服務后,訪問http://[ip]:[port]/gcmonitor頁面,
點擊“配置”按鈕進行全局配置頁面。
步驟三,根據提示填寫配置頁面中的相關參數,如下圖所示:
步驟四,填寫后點擊“連接”保存配置,后臺保存信息并校驗配置項的可用性。
步驟五,根據配置的參數,后臺程序修改應用中的properties配置文件。
即可完成數據庫的初始化的配置。
在瀏覽器中輸入統一監控網站地址,如:http://[ip]:[port]/gcmonitor,進入用戶登錄界面,如下圖所示:
輸入用戶名、密碼后(默認admin:admin),單擊回車或者點擊“登錄”按鈕,系統將進行用戶校驗,如果用戶名和密碼校驗正確,則進入統一監控主界面;否則提示錯誤信息:登錄失敗,請檢查用戶名和密碼!
在成功登錄監控網站后,將進入到網站主界面,如下圖所示:
當初始化登錄監控平臺,目前尚未配置采集中心和采集代理,所以提示采集中心不可達。也并未采集到任何數據。若此時采集中心與采集代理都能正常連通,則可以顯示:數據庫節點名稱,數據最后更新時間,版本信息,報警信息,數據庫空間利用率,VP繁忙率,數據庫節點模式,會話數,DB Page R/W ,虛擬內存使用率。
新增GBase 8s監控
新增一個GBase 8s的監控,分為3個步驟:新增8s集群、初始化采集中心、初始化采集代理,這三個步驟通過監控平臺管理來完成。
平臺管理
平臺管理主要用于提供數據庫節點監控的基礎數據維護。平臺管理包括了用戶、角色、數據庫節點、采集中心、監控策略、報警級別、監控日志、監控歷史數據管理八大功能模塊。
用戶可以通過在主頁導航中點擊“平臺管理”進入到平臺管理界面,如下圖所示:
新建8s集群
選擇平臺管理后,可以新建8s集群,如下圖所示:
在彈出框中填寫對應的信息,并選擇是否新建策略,即可完成新建集群的工作。
新建集群后,即可在右側操作欄,進行初始化采集中心和采集代理的工作。
初始化采集中心
步驟一,頁面中進入采集中心管理;
步驟二,輸入相關的配置信息,如下圖所示:
步驟三,保存成功后進行自動化安裝(安裝前需要用戶輸入服務器的連接密碼);
步驟四,安裝成功后,點擊“啟動”按鈕啟動center;
步驟五,查看列表中的狀態,確保安裝啟動完成;
初始化采集代理
步驟一, 首先進入采集代理服務管理頁面,點輸入相關的配置信息,如下圖所示:
步驟二,保存成功后進行自動化安裝(安裝前需要用戶輸入服務器的連接密碼);
步驟三,點擊服務狀態和監控狀態的“啟動”按鈕,啟動采集代理;
采集中心和采集代理正常工作下,等待一個采集周期的數據回傳,在集群狀態頁面就可以顯示采集信息了。
監控展示
數據庫整體狀態監控
在集群監管頁面中,我們可以監管本平臺所有類型實例的集群,并展示各個集群當前的狀態,單獨選擇某個集群,可以查看其下所有采集中心與采集代理的節點情況。
數據庫節點監管
點擊數據庫節點監管主界面的8s數據庫節點名稱,進入該數據庫節點的節點概要信息界面,左側顯示8s數據庫節點監控導航欄,界面顯示如下:
本界面包括三部分功能,
節點概要信息:數據庫當前狀態,以及基本信息;
趨勢圖信息:系統信息趨勢圖,以及數據庫信息趨勢圖;
Top Busy Session列表信息。
會話監控概要信息
會話監控中的會話監控概要信息,會向趨勢圖中實時加載當前會話活躍的sql,數據庫事務以及鎖請求。
Top Lock Table
本功能展示top50的lock table的鎖情況,如下圖所示:
報警信息
報警信息展示了所選時間范圍內,不同類型的報警信息以及具體報錯信息,包含報錯所在的ip以及對應的指標。可以通過該頁面進行錯誤信息的一覽,以便及時有效的根據報警級別,進行報警的歸類以及處理。
性能分析報告
性能分析報告通過選擇性能分析包括的分析時段,以及選擇需要分析的子項,系統會自動給出一個分析報告。
可以查看執行數據庫,指定時間段,指定子項的分析報告,點擊“結果分析”,在結果分析下方展示具體的分析報告,還有對應的指標的趨勢圖表。
如上圖,選擇CPU使用情況趨勢圖后,分析出當前數據庫活動最高的表還有對應的cpu平均繁忙率,數據庫繁忙率和操作系統平均加載情況的趨勢圖,更加清晰的了解過去某一段時間內的情況。
本平臺還支持將所選分析報告導出Word已經pdf文檔。
總結
統一數據平臺監控與運維系統支持對單個或多個數據庫節點的監控,通過對數據庫節點系統資源利用情況、網絡通訊情況、進程運行情況和數據庫節點運行狀態等信息的采集,并根據用戶設定的報警策略進行計算,如有報警,及時通知用戶報警信息,以避免數據庫節點出現故障。支持采集信息持久化到數據庫中,并提供從多個維度對數據庫節點的性能進行分析、展示,大大方便用戶對數據庫節點進行調優或排查問題。