flink系列之flink的應用場景(一)
1樓:溫嶼
dt時代,人們對於資料的要求越來越嚴格,從開始的 大資料 到現在慢慢轉變成 快資料 ,我們很多公司都是基於hadoop生態搭建自己的資料倉儲,將不同源的資料按照一定的 週期 (時/天等)通過 etl (提取,轉換,載入)放到我們的數倉以供分析師使用,但是隨著業務發展,我們不得不面對乙個事實,我們上述做的都屬於批處理,我們的分析師或者我們的業務需要即時的資料,那麼在批處理轉到流計算的時候,我們會面臨很多很多問題,例如低延時、高吞吐、exactly-once、無序問題等等。storm 實現了低延遲,還做不到高吞吐,也不能在故障發生時準確地處理計算狀態;spark streaming通過採用微批處理方法實現了高吞吐和容錯性,但是犧牲了低延遲和即時處理能力,也不能使視窗與自然時間相匹配,並且表現力欠佳。而flink就是目前為止的。
我們扮李在選擇乙個新的技術框架的時候,首先考慮的是他的應用場景,再牛逼的框架沒有應用場景也是一無是處,當然牛逼的框架大多都是基於某乙個或者某一類應用場景而產生,而flink主要應用於以下三個場景:
1.事件驅動型應用。
2.資料分析型應用。
3.資料管道 etl
什麼是事情驅動型應用?
定義:事件驅動型應用是一類具有狀態轎扒的應用,該應用會根據事件流中的 事件 觸發 計算 、 更新狀態 或 進行外部系統操作 。
每條資料(事件)觸發變化。
在說這個之前,先說一下什麼是分析,我們從事資料分析相關行業,有時候經常忘記分析本身到底是什麼,下邊是維基百科對於分析的定義。
看到定義之後,再看我們工作中經常對各種資料按照不同維度拆分來分析資料代表的現象,來更好的理解資料,這是我們做資料分析的本質。
那麼定義首先:
它的主要應用在於對資料集進行操作,重在分析。
典行的資料分析型應用比如今年的疫情,我們會統計每天每地上傳的資訊,然後展示在包括支付寶等平臺。
那事件驅動型應用和資料分析型應用有何本質區別?
簡單總結一下:
資料觸發計算會派發新的動作(狀態/訊息)
資料只是分析不派生新的動作(只是輸出結果)
看到過很多大咖分享自己對於資料倉儲etl的看法,自己也做了一些資料倉儲的工作,但是從來沒有認真總結過,會在下一篇文章總結一下我對etl的認知,也會談一下最近新興起的資料湖的看法。以上。
flink元件擅長什麼
2樓:yhukl雙魚
flink是乙個框架和分散式處理引擎,用於對無限制和有限制的資料進行有狀態的計算。flink被設計為可在所有常見的叢集環境中執行,以記憶體速度和任何規模執行計算。
flink擅長處理無邊界和有界的資料集。對事件和狀態的精確控制使flink的執行時能夠在無限制的流上執行任何型別的應用程式。有鄭弊界流由專門為固定大小的資料集設計的演算法和資料結構在內部進行處理,從而產生出色的效能。
部署flink應用程困清序時,flink會根據應用程汪叢前序配置的並行性自動識別所需的資源,並向資源管理器請求它們。如果發生故障,flink會通過請求新資源來替換髮生故障的容器。提交或控制應用程式的所有通訊均通過rest呼叫進行。
簡化了flink在許多環境中的整合。
flink旨在執行任何規模的有狀態流應用程式。將應用程式並行化可能在叢集中分佈並同時執行的數千個任務。因此,應用程式幾乎可以利用無限數量的cpu,主記憶體,磁碟和網路io。
並且,flink易於維護非常大的應用程式狀態。它的非同步和增量檢查點演算法可確保對處理延遲的影響降至最低,同時保證一次狀態一致性。
3樓:哇咔咔茜拉啦
nk擅長處理無界和有界資料集。精確控制時間和狀態使flink的執行時能夠在無界流上執行任何型別的應用程式。有界流由演算法和資料結構內部棗團飢處理,或哪這些演算法和資料結構專門針對固定大小的數凳返據集而設計,從而產生出色的效能。
組織架構調整屬於哪個部門職能,組織架構調整是什麼意思啊?
我們與客戶交流過程中遇到過這樣的情況,他們把部門分為兩大類,一類是 務實 的部門,銷售部 生產部 採購部 物流部等實際給客戶帶來效益的部門 一類是 務虛 的部門,質量控制部 計劃協調部等主要做溝通協調和管理的部門。企業在規模比較小和快速發展時期,主要設定的 務實 部門,認為務虛的部門給企業帶來的價值...
組織架構圖用什麼軟體做,visio 組織架構圖用什麼軟體做
下面是我用該工具繪製的組織結構圖 希望上述的分享可以幫助到你 推薦億圖軟體 edraw max 製作組織架構圖的特色 1.智慧化組織結構圖 使用組織結構圖製作軟體可以突破傳統的組織結構圖的侷限性。2.相容主流軟體 作為專業實用性軟體,和其他的軟體有很好的相容性,可以將組織結構圖匯出為word,ppt...
學習CS架構看什麼書好,學習CS架構看什麼書好
試著學學c唄,如果覺得不好理解,看看c 也行.windows領域的,看一下 的書吧,比如essential inside 這個是基礎,也是基 於這個構建的,然後就是winform,wpf這些 如果是linux下面,那就是qt了。最好熟悉幾個主流資料庫操作,像我就是oracle和mssql,對資料庫這...