Deep Learning ์ด๋ ๋ฌด์์ธ๊ฐ? Hidden Layer ๋ ๋ฌด์์ธ๊ฐ? ์ด๋ฐ ๊ฐ๋
์ ๊ฐ๋จํ ์ดํดํ๊ณ ์๋๊ฐ? ์ ์ฅ์ ์์ ๋ฅผ ์ดํด๋ณด๋ฉด 1X784 ๋ฐ์ดํฐ์ 784X10 ์จ์ดํธ ๋ฐ์ดํฐ์ 10๊ฐ์ ๋ฐ์ด์์ค๋ฅผ ์ฌ์ฉํ์ฌ hypothesis states๋ฅผ ๊ณ์ฐํ๊ณ ํ์ฑํ ํจ์ Softmax๋ฅผ ์ ์ฉํ์ฌ Cross Entropy Cost ํจ์๋ฅผ ๊ตฌ์ฑ ํ Optimizer๋ฅผ ์ค์ ํ์ฌ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์ ์ฉํ๊ฒ ๋๋ค. ์ฌ๊ธฐ์ Dense(128)์ฒ๋ผ ์๋์ธต์ด ์ถ๊ฐ๋ ๋ One layer ๋งํผ Deep ํด์ก๋ค๊ณ ํ๋ฉฐ ์ด๋์ ๋์
๋๋ ์จ์ดํธ ๋งคํธ๋ฆญ์ค์ ํฌ๊ธฐ๊ฐ 128X10 ์ด๋ผ๋ฉด 128 ๋งํผ Wide ํด์ก๋ค๊ณ ๋ณผ ์ ์๋ค. ์ฆ 784X10 ์จ์ดํธ ๋งคํธ๋ฆญ์ค ์ฌ์ฉ์์ (784X128) ๊ณผ (128X10) ์ด ๊ณฑํด์ง ๋งํผ์ ์จ์ดํธ ๋งคํธ๋ฆญ์ค๊ฐ ์ฌ์ฉ๋๋ ๊ฒ์ด๋ค. ์ด ์จ์ดํธ๋ค์ ์ด๊ธฐ์ ๋๋ค๋๋ฒ๋ฅผ ์ฌ์ฉํ๋ฏ๋ก free parameter๋ผ๊ณ ๋ถ๋ฅด๊ธฐ๋ ํ๋ค. ์ฆ MNIST ๋ฌธ์ ๋ ๋ฐ์ด์์ค ํฌํจ 7850๊ฐ์ ํ๋ผ๋ฉํฐ๋ค์ด ์ฌ์ฉ๋๋ฉฐ 128 ์๋์ธต์ด ์ฌ์ฉ๋๋ ์์ ์์๋ 785X128+(128+1)X10=101,770๊ฐ์ ํ๋ผ๋ฉํฐ๊ฐ ์ฌ์ฉ๋๋ ์
์ด๋ค. ํ๋ผ๋ฉํฐ ์๊ฐ ๋ง์์๋ก ํ์ตํจ์จ์ด ๋์์ง๊ณ ์ธ์๋ฅ ์ด ํฅ์๋๋ ๊ฒฝํฅ์ด ์๋ค.
์๋ URL ์ฃผ์๋ก ์ด๋ํ์ฌ ๋ง์ ์ฝ์ด ๋ณด์ธ์.
http://blog.daum.net/ejleep1/945
![๋ง๋๋ง์ธ๋ก๊ณ .png]
