讓快更快,火山引擎ByteHouse為ClickHouse提速
2023-09-01 06:04:03 來源:中關村在線
近日,火山引擎數(shù)智平臺VeDI與DataFun聯(lián)合舉辦以“OLAP計算引擎”為主題的直播活動,來自火山引擎數(shù)智平臺VeDI的產品專家從技術選型、能力分析、性能優(yōu)化以及應用場景落地多個角度,介紹火山引擎ByteHouse如何基于ClickHouse實現(xiàn)實時計算能力升級。
據(jù)介紹,火山引擎ByteHouse來源于字節(jié)跳動多年內部沉淀。由于場景越來越豐富以及數(shù)據(jù)分析需求增長,業(yè)務對于實時數(shù)倉的要求也越來越高。首先是數(shù)據(jù)體量大以及不斷增長的問題。早在2019 年,字節(jié)內部每天新增的數(shù)據(jù)量就達到了100TB。其次,在海量數(shù)據(jù)基礎上,由于數(shù)據(jù)類型多樣(包括批式數(shù)據(jù)和流式數(shù)據(jù))、查詢需求多樣、交互式分析復雜,數(shù)據(jù)引擎需要具備靈活性。目前,行業(yè)Redis、 SparkSQL 等開源方案可以從不同角度滿足上述兩個需求,但是維護多個開源數(shù)據(jù)庫將導致成本高,選擇一款可以避免成本無限擴展的計算引擎成為字節(jié)數(shù)據(jù)研發(fā)首要考慮的問題。
(資料圖片僅供參考)
ClickHouse性能高、靈活性強,且主要依賴磁盤、成本相對可控,成為字節(jié)跳動內部計算引擎的首選。但原生 ClickHouse 能力難以支持 upset 、實時數(shù)據(jù)更新等一些場景,在很多層面有局限性,例如:
· 單表性能強勁,但多表能力局限,且對標準 SQL 兼容性低。
· 缺乏成熟運維管理工具,運維復雜程度高。
· ClickHouse 為 MPP 架構(存算一體架構),性能強,但橫向擴容成本非常高、數(shù)據(jù)隔離性差。
ByteHouse產品專家在直播中介紹到,“為了解決以上問題,我們主要從4個方向進行優(yōu)化,讓OLAP引擎能力、性能、運維、架構進一步升級?!?/strong>
第一,豐富的自研表引擎,實現(xiàn)OLAP引擎能力進化。 ByteHouse 彌補了ClickHouse表引擎的不足,并衍生出全新的表引擎,包括使高可用表引擎、實時數(shù)據(jù)引擎、Unique 引擎、Bitmap 引擎。以Unique 引擎為例,它解決了社區(qū)版 ReplacingMergeTree 實時更新延遲問題,真正做到實時 upset。
第二,新增優(yōu)化器、字典、索引支持能力,實現(xiàn)OLAP引擎性能進化。ClickHouse在多表場景中性能存在缺陷,而ByteHouse 通過自研CBO 和 RBO(基于代價和基于規(guī)則的優(yōu)化器),支持了多層嵌套的下推、Join 子查詢的下推、Join-Reorder、Bucket Join、Runtime Filter 等優(yōu)化器特性,做到 TPC-DS 的性能可以達到 99 條sql100%覆蓋,極大提升多表場景下的性能。另外,ByteHouse還支持了全局字典以及更多索引,如 Bitmap index,讓查詢效率更快。
第三, 自動化、可視化,實現(xiàn)OLAP引擎運維進化。ByteHouse 提供標準化運維、集群健康度檢測、問題發(fā)生時的診斷工具,幫助運維人員提高效率。例如,集群健康度的檢測工具,類似于集群的實時巡檢,能夠報告當前集群狀態(tài)、出現(xiàn)了什么問題、問題如何解決,最大程度把問題前置化,降低運維風險。從效果上看, 18000 個節(jié)點只需要不到 10 個運維人員來支持。
第四, 存算分離,實現(xiàn)OLAP引擎架構進化。ByteHouse推出了 MPP 2. 0 即存算分離架構。一方面, 存算分離可以更好實現(xiàn)資源隔離,每一個計算任務都會提交到不同的計算資源中,做到用戶之間互不影響,還能靈活擴容、縮容存儲計算資源;另一方面,存算分離能做到真正云原生(Cloud native),ByteHouse 存儲層既支持 HDFS,也支持 S3 對象或者其他的對象存儲,實現(xiàn)云原生部署。
目前,ByteHouse已經(jīng)在行為分析、精準營銷、實時監(jiān)控等業(yè)務場景中落地。以實時監(jiān)控為例,很多互聯(lián)網(wǎng)APP有線上運營活動、直播電商等業(yè)務,數(shù)據(jù)實時性格外重要。數(shù)據(jù)從生產到展現(xiàn)在大屏上,延遲往往要控制在分鐘級甚至秒級以內。而ByteHouse高吞吐性能、查詢性能,使數(shù)據(jù)從輸入端到輸出端的流程達到秒級。在數(shù)據(jù)保障層面,ByteHouse 也能精細到Exactly Once 的語義,保證數(shù)據(jù)不丟失、不重復,最終達到數(shù)據(jù)高效存儲、準確查詢。(作者:吳卓港)
關鍵詞:
相關閱讀
- (2023-09-01)讓快更快,火山引擎ByteHouse為ClickHouse提速
- (2023-09-01)【世界說】暴力執(zhí)法、隨意槍殺、抹煞歷史……美非裔無妄之災數(shù)不勝數(shù) 美媒:“種族主義才是美國最致命的恐怖主義之一”
- (2023-09-01)方太:專注創(chuàng)新科技“長期主義”,引領廚電行業(yè)高質量發(fā)展
- (2023-09-01)氣溫高達46.6℃!高溫預警又來!美國南部遭遇大范圍熱浪襲擊
- (2023-09-01)00后姑娘從北京騎摩托來浙江上學 “讀萬卷書 行萬里路”!
- (2023-09-01)男籃進軍巴黎希望渺茫:日本大逆轉委內瑞拉 一只腳邁進奧運大門
- (2023-09-01)通道:學前檢查116所學校,為校園擦亮“平安”底色
- (2023-09-01)武漢青山公安持續(xù)打造融合效能警務
- (2023-09-01)思念她的句子 思念她的語句
- (2023-09-01)這個暑期,他的12家影院能賺七八百萬元!電影正在拉動消費
- (2023-09-01)存量房貸利率下調靴子落地,銀行體系凈息差會受多大影響?
- (2023-09-01)電子連接器業(yè)務穩(wěn)步發(fā)展 珠城科技上半年凈利同比增長12%
- (2023-09-01)科技財報觀丨360二季度營收25.37億元 安全業(yè)務占比超25%
- (2023-09-01)小眾旅游文案?
- (2023-09-01)東京真實房價?
- (2023-09-01)東莞+1!廣東已有五地官宣“認房不認貸”
- (2023-09-01)原來久坐人會變丑是真的:不要再久坐了
- (2023-09-01)洋房啟動!957隊伍解說杯拿下首勝 隊長直接與隊員約線下團建慶祝
- (2023-09-01)15歲女生經(jīng)常被同齡男同學信息騷擾,甚至用我的照片做視頻做背景
- (2023-09-01)《不朽者傳奇》PC版性能表現(xiàn)分析:奇葩的謎之優(yōu)化
- (2023-09-01)死緩是不是可以不死(死緩不會死嗎)
- (2023-09-01)畢節(jié)納雍:3000米排水溝扮靚村莊“顏值”
- (2023-09-01)一個暑假跑了900萬次,香港人“擠爆”深圳!深圳本地人大受震撼:“差點以為我到了香港”
- (2023-09-01)補陽虛補脾腎的菜 大廚推薦冬天吃這種肉
- (2023-09-01)北向資金凈賣出超40億元
- (2023-09-01)遠東控股國際(00036)公布中期業(yè)績,股東應占虧損1280萬港元 同比增16%
- (2023-09-01)受臺風影響,深圳機場將暫停航班運行
- (2023-09-01)建設銀行:依法有序推進降低存量首套住房商業(yè)性個人住房貸款利率工作
- (2023-09-01)5個項目簽署投資意向書 河南鄭州繼續(xù)擴大資本“朋友圈”
- (2023-09-01)?一點靈犀/本港如何競逐“馀量經(jīng)濟”?\李靈修