4.4 Data Lake#
Data Lakeλ λ€μν ννμ λ°μ΄ν°λ₯Ό μ μ₯νκΈ° μν κ°μ²΄ μ€ν λ¦¬μ§ νμμ μ μ₯μμ λλ€.
λΉμ ν λ°μ΄ν°λ μ€μκ° λ°μ΄ν°μ κ°μ΄ λ€μν ννμ ν¬κΈ°μ λ°μ΄ν° μ μ₯μ μ ν©ν©λλ€.
λ°μ΄ν°λ₯Ό μμ§ ν λ°λ‘ μ μ κ³Όμ μ μ§ννλ ETL Processμλ λ€λ₯΄κ² λ¨Όμ λ°μ΄ν°λ₯Ό κΈ°μ‘΄ ννλ‘ μ μ₯ν ν, μ΄νμ μ€ν€λ§λ₯Ό μ μνκ³ μ μ¬νλ ELT Processλ₯Ό μ¬μ©ν©λλ€.
κΈ°λ₯ λ° νΉμ§
λΉμ ν λ°μ΄ν°, μ ν λ°μ΄ν°, μ€μκ° λ°μ΄ν° λ± λͺ¨λ μ’ λ₯μ λ°μ΄ν°λ₯Ό κΈ°μ‘΄ ννλ‘ μ μ₯ν©λλ€.
μ μ°νκ³ λΉμ©μ κ°μ΄ κ°λ₯νλ©° λΉμ ν λ°μ΄ν°λ₯Ό μ μ νμ§ μκ³ λ ad-hoc λΆμ λ±μ νμ© ν μ μμ΅λλ€.
λ¨μ
μ κ·Ό κΆν κ΄λ¦¬, λμμ±, ACID Transaction, BI μ νκ³Όμ νΈνμ±μ΄ κΈ°μ‘΄ data warehouseλ³΄λ€ μ½ν©λλ€.
μμ μ΄ νμν κ²½μ° νμΌμ κ΅μ²΄νλ λ°©λ²λ°μ μκΈ° λλ¬Έμ μμλ‘ λ³κ²½μ΄ νμν λ°μ΄ν°μ λΆμ ν©ν©λλ€.
κ°μ²΄ μ€ν 리μ§
κ°μ²΄ μ€ν 리μ§λ λ°μ΄ν°κ° μ μ₯λ λ, λ€μμ μ»΄ν¨ν°λ₯Ό μ¬μ©νμ¬ λΆν λΆμ°μ΄ μ΄λ€μ§λ μ μ₯μμ λλ€.
κ°μ²΄ μ€ν λ¦¬μ§ κΈ°λ°μ μ μ₯μλ λ°©λν μμ λ°μ΄ν°λ₯Ό μ μ₯νμ¬λ μ±λ₯μ ν¬κ² μ§μ₯μ΄ μμ§λ§ μλμ λ°μ΄ν°λ₯Ό μ μ₯νκΈ°μ λΉν¨μ¨μ μ λλ€.
ex) gcs, s3, HDFS