ํจ๋ฆฌ์ค์ฌ ๋ ๋๊ฒ์ด๋ ๊ธฐ์กด ์ฑ๋ฅ ๋๋ฐฐ ์ ๋ ฅํจ์จ ๊ฐ์ ์์๋ณด๊ธฐ
ํจ๋ฆฌ์ค์ฌ ๋ ๋๊ฒ์ด๋(RNGD)๊ฐ ์๋น๋์๋ณด๋ค ์ฐ์ํ๋ค”๋ ํํ์ ๋ถ๋ถ์ ์ผ๋ก๋ง ๋ง๋ ๋ง์
๋๋ค. ์ด๋ค ์ฉ๋(ํนํ LLM ์ถ๋ก , ์ ๋ ฅ ํจ์จ)์์๋ ๊ฐ์ ์ด ์์ง๋ง, ๋ฒ์ฉ์ผ๋ก “์๋น๋์๋ณด๋ค ์ฐ์”๋ผ๊ณ ๋งํ๊ธฐ์๋ ๊ณผ์ฅ์
๋๋ค. ๋ญ๊ฐ ๋ ์ข์์ง ‘์กฐ๊ฑด’๋ถํฐ ๋ค๋ฆ RNGD๋ AI ์ถ๋ก (inference) ์ ์ฉ NPU๋ผ์, ์ด๋ฏธ ํ์ต๋ LLM·๋น์ ๋ชจ๋ธ์ ๋๋ฆด ๋ ์ ๋ ฅ ๋๋น ์ฑ๋ฅ์ด ๋งค์ฐ ์ข๊ฒ ์ค๊ณ๋ ์นฉ์
๋๋ค. ์๋น๋์ A100·H100·B200 ๊ฐ์ GPU๋ ํ์ต+์ถ๋ก ๋ชจ๋๋ฅผ ๋
ธ๋ฆฌ๋ ๋ฒ์ฉ ๊ฐ์๊ธฐ๋ผ์, ์ ๋ ์ฑ๋ฅ·์ํ๊ณ(CUDA, ๋ผ์ด๋ธ๋ฌ๋ฆฌ, ํด)๊น์ง ํฌํจํ๋ฉด ์์ง ์์ฅ ์ง๋ฐฐ์ ์
๋๋ค. ์ฆ “๋ฌด์์ ๊ธฐ์ค์ผ๋ก ์ฐ์ํ๋ค๊ณ ํ๋๋”๊ฐ ํต์ฌ์
๋๋ค. ์ ๋ ฅ ํจ์จ·๋น์ฉ ์ธก๋ฉด์์๋ ๊ฐ์ FuriosaAI ์๋ฒ(8์ฅ RNGD)๋ FP8 ๊ธฐ์ค 4 PFLOPS์ 3kW๋ก, ๊ฐ์ ๊ธ ์ถ๋ก ์ฑ๋ฅ ๋๋น ์ ๋ ฅ ์๋ชจ๊ฐ ์ ์ด ์ฑ๋ฅ/W(ํจ์จ)์ด ๋๋ค๊ณ ํ๊ฐ๋ฉ๋๋ค. LG AI ์ฐ๊ตฌ์๋ ์์ฌ EXAONE ๋ชจ๋ธ ์ถ๋ก ์์ GPU ๋๋น 2๋ฐฐ ์ด์ ๋์ ์ฑ๋ฅ/์ํธ๋ฅผ ๋ดค๋ค๊ณ ํ๊ณ , ์ผ๋ถ ํ
์คํธ์์๋ ์๋น๋์ 5๋
์ ์ธ๋ GPU๋ณด๋ค ์ต๋ 2.25๋ฐฐ ํจ์จ ์ฐ์๊ฐ ๋์ค๊ธฐ๋ ํ์ต๋๋ค. ๊ทธ๋์ “๋์ผ ์ถ๋ก ์ฒ๋ฆฌ๋์ ๋ ์ ์ ์ ๋ ฅ·๋น์ฉ์ผ๋ก ๋๋ฆฐ๋ค”๋ ์๋ฏธ์์ ํจ์จ์ด ๋ ์ฐ์ํ๋ค๋ ์ฃผ์ฅ์ ๊ฝค ๊ทผ๊ฑฐ๊ฐ ์์ต๋๋ค. ์ ๋ ์ฑ๋ฅ·์ํ๊ณ๋ ์์ง ์๋น๋์ ์ฐ์ ๋จ์ผ ์นด๋ ๊ธฐ์ค์ผ๋ก ๋ณด๋ฉด RNGD๋ H100/B200๋ณด๋ค ์ ๋ ์ฐ์ฐ๋·๋ฉ๋ชจ๋ฆฌ ๋์ญํญ์ด ๋ฎ๊ณ , ์ฃผ๋ก ์ถ๋ก ์ ์ต์ ํ๋ ๊ตฌ์กฐ๋ผ ํ์ต ์ฑ๋ฅ์์๋ ์ง์ ๋น๊ต ์๋๊ฐ ์๋๋๋ค. ๋ฌด์๋ณด๋ค CUDA, cuDNN, Triton, ๋ค์ํ ํ๋ ์์ํฌ ์ต์ ํ ๋ฑ ์ํํธ์จ์ด ์ํ๊ณ๋ ์์ง ์๋น๋์๊ฐ ์๋์ ์ด๋ผ “๊ทธ๋ฅ ๊ฝ์ผ๋ฉด ์ ๋์๊ฐ๋ ํ๊ฒฝ”์ ์๋น๋์ ์ชฝ์ด ํจ์ฌ ์์ ์์ต๋๋ค. ๊ทธ๋์ ๋ํ ํด๋ผ์ฐ๋(AWS, GCP, Azure)๋ ๋น
ํ
ํฌ๊ฐ ํ์ต·์ถ๋ก ๋ชจ๋ ๊ณ ๋ คํ ๋ ์ฌ์ ํ ์๋น๋์๋ฅผ ๊ธฐ๋ณธ ์ต์
์ผ๋ก ์ฐ๋ ์ํฉ์
๋๋ค. ์ ๋ฆฌํ๋ฉด (ํฌ์/์ค์ฌ์ฉ ๊ด์ ) “RNGD๊ฐ ์๋น๋์ ์นฉ๋ณด๋ค ์ฐ์ํ๋ค” → ์ถ๋ก ์ ์ฉ,...