์์ฆ coursera์์ ๋ฃ๊ณ ์๋ ๊ฐ์๋ Sequence Models(sequence๋ ์ฐ์์ ์ธ ์ฌ๊ฑด๋ค, ๋ฐฐ์ด, ์์๋ผ๋ ๋ป์ด๊ณ Model์ ๋ชจํ)์ด๋ผ๋ ๊ฐ์์ธ๋ฐ ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋์ ๊ตฌํํ ๋ ์ฌ์ฉ๋๋ RNN(Recurrent Neural Networks)์ด๋ผ๋ ๋ชจ๋ธ์ ํ ๋๋ก ๊ณต๋ถํ๋ ๋ด์ฉ์ด๋ค. ๊ตฌ๊ธ์ RNN์ผ๋ก ๊ฒ์๋ง ํด๋ ์์ง์ ์๋ฃ๊ฐ ๊ฒ์์ด ๋๊ธฐ์ ์ฌ๊ธฐ์ ์์ ํ ๊ฒ์ ๊ทธ ๋ชจ๋ธ ์์ฒด๋ณด๋ค๋ ํ์ตํ๋ฉด์ ๋๋๋ฐ๋ฅผ ์ ์ด๋ณด๋ ค๊ณ ํ๋ค.
๊ธ์ ์ดํด๋ฅผ ๋๊ธฐ์ํด์ ๊ฐ๋จํ RNN์ ๋ํ ์ด์ผ๊ธฐ๋ก ์์ํ ๊นํ๋ค. RNN์ Recurrent Neural Networks ์ฝ์์ด๋ค. Neural Networks๋ผ๋ ๋ง์ ์ฐ๋ฆฌ ๋ชธ์ ๋์ ๊ฒฝ์ธํฌ์ ์ฐ๊ฒฐ๋ง์ ๋ณธ๋ฐ์ ๋ง๋ ๋ชจ๋ธ์ด๋ผ๋ ๋ป์ด๊ณ Reccurent๋ผ๋ ๋ง์ ๋ํ์ด๋๊ณ ๋ฐ๋ณต์ด ๋๋ค๋ ๋ง์ด๋ค. ์ ๊ฒฝ๋ง์ ๊ธฐ๋ณธ๊ตฌ์กฐ๋ Input(์
๋ ฅ)์ ๋ฐ์์ ์ด๋ค ์กฐ์ ์ ๊ฑฐ์น ํ์ Output(์ถ๋ ฅ)์ ๋ด๋ ๊ฒ์ด๋ค. ์ด๋ค ์กฐ์ ์ ๋ฐฉ๋ฒ์ ๋ฐ๋ผ ๊ฐ ๋ชจ๋ธ์ ํน์ฑ์ด ๊ฒฐ์ ์ด ๋๋ค.
์ฌ๋์ ์ ๊ฒฝ์ ๋ฌ ๊ณผ์
์ธ๊ณต์ ๊ฒฝ๋ง
RNN์ Recurrent์ current๋ผ๋ ๋จ์ด๋ฅผ ํฌํจํ๊ณ ์์ด์์ธ์ง ์ง๊ด์ ์ผ๋ก ํ๋ฆ๊ณผ ๊ด๋ จ๋ ๋๋์ ์ฃผ๋๋ฐ, ์ค์ ๋ก RNN์ ๊ฐ ๋ด๋ฐ์ ์ ๋ณด๋ฅผ ์กฐ์ ํ๋ ์กฐ์ ๊ฐ์ด ์ดํ์ ์กฐ์ ๊ฐ์๋ ์ํฅ์ ๋ฏธ์ณ์ ์์ ์ ๋ณด๊ฐ ๋ท ์ ๋ณด์ ์ํฅ์ ๋ฏธ์น๋ ํฐ ํ๋ฆ์ ๋ง๋ ๋ค. ์ด๊ฒ์ Sequence์ ํน์ฑ์ ๊ฐ์ง๋ ์ ๋ณด์ ์์ธก์ ๊ฐ๋ฅํ๊ฒ ํ๋ค. ์ฐ์์ ์ธ ํ๋ฆ์ด ํน์ง์ธ ๋ฐ์ดํฐ, ์์ฑ, ์์ , ๊ธ ๋ฑ์ ํ์ฉํ์ฌ ์๋ฆฌ๋ฅผ ๋ฌธ์๋ก ๋ฐ๊พธ๊ฑฐ๋, ์๋ก์ด ์์ ์ ์ฐฝ์กฐํ๊ธฐ๋ ํ๊ณ , ๊ธ์ ๋ฒ์ญํ๊ฑฐ๋ ์ด์ธ๋ฆฌ๋ ๋จ์ด๋ฅผ ์์ธกํ๊ธฐ๋ ํ๋ค.
๊ธ์ด๋ ๋ฌธ์๋ฅผ ํ์ตํ๋ ค๋ฉด ์ปดํจํฐ๊ฐ ์ฝ๊ฒ ์ฐ์ฐํ ์ ์๋ ์ซ์๋ก ํํํด์ฃผ๋ฉด ์ข์๋ฐ ๊ฑฐ๊ธฐ์ ์ฐ์ด๋ ๊ธฐ์ ์ค์ ํ๋๊ฐ Word2vec์ด๋ผ๋ ๊ฒ์ด๋ค. ๋ง๊ทธ๋๋ก ๋จ์ด๋ฅผ ๋ฒกํฐ ํ์์ผ๋ก ๋ณํํ๋ ๊ฒ์ด๋ค. ๊ธ์ด๋ ๋ฌธ์๋ฅผ ํ์ตํ๋ค๋ ๋ง์ ๋ค์ ๋งํ๋ฉด ๊ฐ ๋ฌธ์ฅ, ๋จ์ด๋ค์ ๊ด๊ณ๋ฅผ ํ์ ํด์ ์ด๋ค ์๋ฏธ๋ฅผ ์ง๋๊ณ ์๋์ง๋ฅผ ์์๋ด๋ ์์ ์ด๋ผ๊ณ ์ดํดํ๋ฉด ๋๊ฒ ๋ค.
์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํ๋์ค์ ์ดํ๋ฆฌ์๋ ๊ตญ๊ฐ๋ผ๋ ๊ณตํต์ ์ ๊ฐ์ง๊ณ ์์ด์ ๊ฐ๋๊ฐ ํฌ์ง ์๊ณ , ๊ณต๊ณผ ์ ์ด๋ ์ ํ ๋น์ทํ์ง ์๊ธฐ์ ๊ฐ๋๋ 90๋์ ๊ฐ๊น๋ค. ๋ฐ๋ฉด ๋ก๋ง-์ดํ๋ฆฌ์์ ์ง๊ณผ ํ๋์ค์ ํ๋ฆฌ์ ์ง์ ๋น์ทํ๊ธดํ๋ ๋ฐฐ์ด์ด ์๋-๊ตญ๊ฐ, ๊ตญ๊ฐ-์๋ ์์ผ๋ก ๋ฐ๋์ฌ์ 180๋์ ๊ฐ๊น์ด ๊ฐ์ ๋ํ๋ธ๋ค. ์ด์ ๊ฐ์ด ๋จ์ด๊ฐ์ ์ฐ๊ด์ฑ์ ํํํ๋ ๊ฒ์ cosine similarity๋ผ๊ณ ํ๋๋ฐ ๊ทธ ๋ด์ฉ์ ์ด ๊ธ์ด ๋ฒ์๋ฅผ ๋ฒ์ด๋๋ ์๋ตํ๋ค.
๊ทธ๋ฆผ 1 : ์ถ์ฒ coursera ๊ฐ์
๊ทธ๋ฆผ 2 : ์ถ์ฒ coursera ๊ฐ์
์ฐจ๋ณ, ํธ๊ฒฌ์ด ์ฌ์ค์ ์๋ ์ธ์์ ์ฐ๋ฆฌ๋ ์ด๊ณ ์๋ค. ๊ทธ๋ฐ ์ธ์์์์ ํ์ํ ๊ธ๋ค๋ ๋ฌผ๋ก ํน์ ๋ถ๋ฅ์ ๋ํ ์ฐจ๋ณ์ ์ธ ์ธ์์ด ๋ด๊ฒจ์๋ค. ์๋ฌด๋ฆฌ ๊ธฐ๊ณ๋ผ์ง๋ง ์ด๋ฐ ์ธ์ ์์ ์ด๊ณ ์๋ ์ฐ๋ฆฌ๊ฐ ์ด ๊ธ์ ํ์ตํ๋ค๋ฉด ๊ทธ ํธ๊ฒฌ ๋ํ ํ์ตํ๊ฒ ๋๋๋ผ. ์ค์ ๋ก Sequence Models week2 ์ ๊ณผ์ ๋ฅผ ํ ๋ ์ฌ์ฉํ ๋ฒกํฐ๋ 50-dimensional GloVe vectors ๋ผ๋ ๊ฒ์ธ๋ฐ ์ด ๋ฒกํฐ๋ฅผ ํตํด ํ์ตํ๊ฒ ๋ ๋ ์ง์ ์ ๋ํ ๋จ๋ ์ฐจ๋ณ์ ์ธ ์์๊ฐ ๋ฐ์๋์ด ๋ฐ๋์ค๊ฐ ๋ง์ง ์์๋ค. ๊ทธ๋ฐ bias๋ฅผ ์กฐ์ ํ๋ ์์ ์ด debiasing ์ด๋ผ๋ ๊ฒ์ด๋ค. ๊ทธ๋ฆผ1์์ ๋ณด๋ ๊ฒ๊ณผ ๊ฐ์ด ์ ์์์ด๋ผ๋ ์ง์ ์ ๋จ๋ ๋ชจ๋๊ฐ ํ ์ ์๋ ์ง์ ์ธ๋ฐ ๊ทธ๋ํ์์ ๋ณด๋ฏ ์ฑ๋ณ์ ๊ตฌ๋ณํ๋ ๋ฒกํฐ์ ํฌ๊ธฐ๊ฐ ์กด์ฌํ์ฌ ์ค๋ฅธ์ชฝ ์๋ก ํฅํ๋ค. ๊ทธ๊ฒ์ ์ค์ฑํ ์ํค๋ฉด ๊ทธ๋ฆผ 1์ ์ค๋ฅธ์ชฝ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๊ทธ๋ฆผ 2์์ actor์ actress ๋ํ gender๋ผ๋ ์์์์ ๋์ผํ ์์น๋ฅผ ๊ฐ์ง๊ณ ์์ง ์๋๋ฐ ๊ทธ๊ฒ์ ์กฐ์ ํ๋ ๊ฒ์ equalize๋ผ๊ณ ํ๋ค. equalize์ ๊ฒฐ๊ณผ๋ ๊ทธ๋ฆผ2์ ์ค๋ฅธ์ชฝ๊ณผ ๊ฐ๋ค.
These debiasing algorithms are very helpful for reducing bias, but are not perfect and do not eliminate all traces of bias.
๊ณผ์ ์ ๋ง๋ฏธ์ ๋์๋ ํ ์ค์ธ๋ฐ, ์ ๋ง ๊ณต๊ฐ์ด ๋์๋ค. ํธ๊ฒฌ๊ณผ ๊ณ ์ ๊ด๋ ์ ๊นจ๋๋ฐ ์ด ์๊ณ ๋ฆฌ์ฆ์ด ๋งค์ฐ ๋์์ด ๋์ง๋ง ์๋ฒฝํ์ง์๊ณ ๊ทธ๋ฆฌ๊ณ ๋ชจ๋ ํธ๊ฒฌ์ ์ ๊ฑฐํ ์ ์๋ค๋ ๋ง. ์ฌํ๋ฉด์๋ ์ํ๊น์ด ํ์ค์ด๋ค. ์์ด๋ฌ๋ํ๊ฒ๋ ์ด์ฑ์ ์ด๋ผ ๋ฏฟ์๋ ๊ธฐ๊ณ๋ ์ธ๊ฐ์ด ๋ฐํํด์๋ ์ธ์ด๋ฅผ ํ์ตํ๋ฉด ํธ๊ฒฌ์ ๊ฐ๊ฒ ๋๊ณ ๊ทธ๊ฑธ ๋ค์ ์ธ๊ฐ์ด ์ ๊ฑฐํด์ผํ๋ ์ํฉ. ๋ญ๊ฐ ์ ๊ธฐํ๋ฉด์๋ ์ค๋ฌํ๋ค.