5.12 MapReduce#
MapReduce๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ํ ๋ถ์ฐ ์ปดํจํ ํ๋ ์์ํฌ๋ก, Apache Hadoop์ ์ผ๋ถ์ ๋๋ค. MapReduce๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ๋งต ํจ์์ ๋ฆฌ๋์ค ํจ์๋ก ๋ถํ ํ์ฌ ์ํํฉ๋๋ค. ๋งต ํจ์๋ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ฝ๊ณ ํค-๊ฐ ์์ผ๋ก ๋ณํํ๋ฉฐ, ๋ฆฌ๋์ค ํจ์๋ ๋งต ํจ์์์ ์์ฑ๋ ํค-๊ฐ ์์ ๊ฐ์ ธ์ ์ฒ๋ฆฌํฉ๋๋ค. MapReduce๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ฌ๋ฌ ๋ ธ๋์ ๋ถ์ฐํ์ฌ ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ์ํํ๋ฏ๋ก, ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ํจ๊ณผ์ ์ ๋๋ค.
๊ตฌ๊ธ์์ ๋งต๋ฆฌ๋์ค ๋ ผ๋ฌธ์ด ๋์ค๊ฒ ๋ ์ด์ #
๋ฐ์ดํฐ๊ฐ ๋์ด๋๋ฉด์ ๊ฒ์์๋๊ฐ ์ ํ๋๋ ๋ฌธ์ ๊ฐ ์์์ต๋๋ค.
๊ณ ์ฑ๋ฅ ์๋ฒ ๋์ ์ ํ๊ณ๊ฐ ์์์ต๋๋ค.
๊ณ ์ฑ๋ฅ ์๋ฒ๋ฅผ ์ถ๊ฐํ๊ฑฐ๋ ๊ตํํ๋๋ฐ ๋น์ฉ์ ๋ฌธ์ ๋ก ํ๊ณ๊ฐ ์์ต๋๋ค.
๋๋ถ์ด ์๋ฒ๋ฅผ ์ฆ์คํ๋ ๊ฒ๋ณด๋ค ๋ฐ์ดํฐ ์ฆ๊ฐ ์ถ์ด๊ฐ ๋ ๋น ๋ฅด๋ค๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค.
MapReduce์ ๋ฑ์ฅ#
๐โโ๏ธย ์ฑ๋ฅ์ด ์ฝํ๊ณ ์ ๋ ดํ ๋ฐ์ดํฐ ์๋ฒ๋ฅผ ๋ง์ด ์ฐ๊ฒฐํ์!
๊ฐ ๋ฐ์ดํฐ ์๋ฒ์์ ์ฐ์ฐํด์ ์ต์ข ๊ฒฐ๊ณผ๋ฅผ ํฉ์ฐํด์ ๊ณ์ฐํ๋ ๊ธฐ์ ์ ๊ณ ์ํ์๊ณ ์ฌ๊ธฐ์์ MapReduce ๊ธฐ์ ์ด ์ฌ์ฉ๋ฉ๋๋ค!
MapReduce๋ ์ฌ๋ฌ ๋์ ์๋ฒ๊ฐ ์ฐ๊ฒฐ๋์ด ํ๋์ ์์คํ ์ฒ๋ผ ์๋ํ๋ ์ปดํจํฐ ํด๋ฌ์คํฐ ํ๊ฒฝ์์ ๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ๋ณ๋ ฌ ์ฒ๋ฆฌํ๋๋ก ์ง์ํ๋ ๊ธฐ์ ์ ์๋ฏธํฉ๋๋ค.
Map ๋จ๊ณ#
๋ถ์ฐ ์ ์ฅ๋์ด ์๋ ํ์ผ์ ๊ฐ ์๋ฒ์ cpu, memory ๋ฑ ํ๋์จ์ด๋ฅผ ์ด์ฉํด ๋น ๋ฅด๊ฒ ๋ถ์ํฉ๋๋ค.
Reduce ๋จ๊ณ#
๋ถ์ ๋์์ผ๋ก ์ ์ ๋ ๋ฐ์ดํฐ๋ค์ ๋ถ์, ํตํฉ ์์ผ์ ์ํ๋ ๋ฐ์ดํฐ๋ฅผ ์ป์ ์ ์๊ฒ ํฉ๋๋ค.
์๋์ ์์๋ฅผ ์ดํด๋ณด๋ฉด์ MapReduce์ ํ๋ฆ์ ์ดํดํด ๋ด ์๋ค.
MapReduce ์ดํ#
ํ์ง๋ง MapReduce ๊ธฐ์ ์ด ๋์ค๊ณ ์๊ฐ์ด ํ์ฐธ ์ง๋ ๋ค๋ถํฐ ์ฌ๋ฌ ๋จ์ ์ด ๋ณด์ด๊ธฐ ์์ํ๊ณ , ๊ทธ ๋์์ผ๋ก ๋์จ ๊ฒ์ด ์คํํฌ์ ๋๋ค. MapReduce์ ๋น์ทํ ๋ชฉ์ ์ ์ ๋ฌด๋ฅผ ์ํํ์ง๋ง ๋ฉ๋ชจ๋ฆฌ๋ฅผ ํ์ฉํ๊ธฐ ๋๋ฌธ์ ๊ต์ฅํ ๋น ๋ฅธ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํน์ง์ ๊ฐ์ง๊ณ ์์ต๋๋ค.