Conference: PyCon Taiwan 2023
Date: 2023/9/2
Abstract:
公司長期以來存在某些工作排程需要較長的執行時間,由於專案使用的資料表本身就較為肥大,我們很容易自然的接受這些排程需要較長執行時間、資源的現狀,然而隨著上線的排程數量的快速增加,系統負擔與效能的問題也開始受到越來越多的重視
除了盲目加大硬體資源的方案外,其實我們可以先從 spark 的資源配置、參數設定以及程式邏輯等面向進行優化,讓工作排程能兼顧執行效率與系統資源
在這次的演講中我將以公司某項工作排程為例,和大家分享我分析這項工作排程的思路,並說明我逐步測試、優化的過程,最終成功將排程的執行時間從 5 小時大幅縮短至 30 分鐘