Flink通過實現兩階段提交和狀態保存來實現端到端的一致性語義。
分為以下幾個步驟:
開始事務( beginTransaction ) 創建一個臨時文件夾,來寫把數據寫入到這個文件夾里面
預提交( preCommit ) 將內存中緩存的數據寫入文件并關閉
正式提交( commit ) 將之前寫完的臨時文件放入目標目錄下。
這代表著最終的 數據會有一些延遲
丟棄( abort ) 丟棄臨時文件 若失敗發生在預提交成功后, 正式提交前。 可以根據狀態來提交預提交的數據, 也可刪除預提交的數據。
千鋒教育-做有情懷、有良心、有品質的職業教育機構
Flink通過實現兩階段提交和狀態保存來實現端到端的一致性語義。
分為以下幾個步驟:
開始事務( beginTransaction ) 創建一個臨時文件夾,來寫把數據寫入到這個文件夾里面
預提交( preCommit ) 將內存中緩存的數據寫入文件并關閉
正式提交( commit ) 將之前寫完的臨時文件放入目標目錄下。
這代表著最終的 數據會有一些延遲
丟棄( abort ) 丟棄臨時文件 若失敗發生在預提交成功后, 正式提交前。 可以根據狀態來提交預提交的數據, 也可刪除預提交的數據。
上一篇
CEP復雜事件處理下一篇
Hive 排序(重點)
hive外部表是使用external關鍵字并指定一個hdfs目錄創建的表。hive內部表在創建時會在對應hive目錄下創建相應的文件夾,外部表則以指定文件夾為...詳情>>
2022-09-02 17:21:00
Checkpoint是為runtime準備的,Savepoint 是為用戶準備的。Checkpoint 機制的目標在于保證Flink作業意外崩潰重啟不影響exactly once 準確性,通...詳情>>
2022-09-02 16:59:22
State:指一個具體的Task/Operator的狀態。State可以被記錄,在失敗的情況下數據還可以恢復,Flink中有兩種基本類型的State: Keyed State, Op...詳情>>
2022-09-02 16:59:19
Flink 內部是基于producer-consumer模型來進行消息傳遞的,Flink的反壓設計也是基于這個模型。Flink 使用了高效有界的分布式阻塞隊列,就像 Jav...詳情>>
2022-09-02 16:59:16
雖說水位線(Watermark)表明早于它的事件不應該再出現,但是接收到水位線以前的的消息是不可避免的,這就是所謂的遲到事件。實際上遲到事件是亂...詳情>>
2022-09-02 16:59:00