NLP ๐ฃ3 seq2seq(sequence to sequence), attention seq2seq๋ ์ฑ๋ด(chatBot), ๊ธฐ๊ณ ๋ฒ์ญ(machine-traslation), STT(Speach-to-Text)๋ฑ์์ ์ฌ์ฉ๋๋ ๋ชจ๋ธ์ด๋ค. seq2seq๋ฅผ ์์ธํ ๋ณด๋ฉด Encoder์ Decoder๋ก ์ด๋ฃจ์ด์ ธ์๋ค. ์ธ์ฝ๋ ๋ชจ๋ ๋จ์ด๋ค์ ์์ฐจ์ ์ผ๋ก ์ ๋ ฅ ๋ฐ์ ๋ง์ง๋ง์ ๋ชจ๋ ๋จ์ด ์ ๋ณด๋ค์ ์์ถํด context vector๋ฅผ ๋ง๋ ๋ค. ๋์ฝ๋ context vector๋ฅผ ์ ๋ ฅ์ผ๋ก ํ์ฌ ๋ฒ์ญ๋ ๋จ์ด๋ฅผ ํ๊ฐ์ฉ ์์ฐจ์ ์ผ๋ก ์ถ๋ ฅํ๋ค. ์ ๊ทธ๋ฆผ์ ์กฐ๊ธ ๋ ์์ธํ ๊ทธ๋ ค๋ณด๋ฉด ์ฌ์ค ์ธ์ฝ๋์ ๋์ฝ๋๋ ๋๊ฐ์ RNN์ด๋ค. ์ธ์ฝ๋๋ฅผ ์์ธํ ์ดํด๋ณด๋ฉด ์ ๋ ฅ ๋ฌธ์ฅ์ ๋จ์ด ํ ํฐํ๋ฅผ ํตํด ๋จ์ด ๋จ์๋ก ์ชผ๊ฐ์ง๊ณ ๋จ์ด ํ ํฐ ๊ฐ๊ฐ์ RNN ์ ๊ฐ ์์ ์์ ์ ๋ ฅ์ด ๋๋ค. ์ธ์ฝ๋ฐ RNN ์ ์ ๋ชจ๋ ๋จ์ด๋ฅผ ์ ๋ ฅ ๋ฐ์ ๋ค ์ธ์ฝ๋ RNN ์ ์ .. 2022. 1. 25. one-hot encoding ๋จ์ด๋ฅผ ์๋ฒ ๋ฉํ๋๋ฐ ์์ด ๊ฐ์ฅ ์์ด์ ์ธ ๋ฐฉ๋ฒ ๋จ์ด ์งํฉ์ ํฌ๊ธฐ๊ฐ ์ฐจ์์ด ๋๋ค. [the, cat, sat, on, the, mat] 5๊ฐ์ง ๋จ์ด๋ก ์ด๋ฃจ์ด์ง ๋ฌธ์ฅ์ 3์ฐจ์์ ๋ฒกํฐ๋ฅผ ๊ฐ์ง๋ค. from konlpy.tag import Komoran import numpy as np komoran = Komoran() text = "์ค๋ ๋ ์จ๋ ๊ตฌ๋ฆ์ด ๋ง์์" nouns = komoran.nouns(text) print(nouns) dics = {} for word in nouns: if word not in dics.keys(): dics[word] = len(dics) #0, 1, 2 print(dics) #one-hot-encoding nb_classes = len(dics) targets = list(d.. 2022. 1. 21. 1. Embedding 1.1 ์๋ฒ ๋ฉ์ด๋ ์ฌ๋์ด ์ฐ๋ ์์ฐ์ด๋ฅผ ๊ธฐ๊ณ๊ฐ ์ดํดํ ์ ์๋ ๋ฒกํฐ๋ก ๋ฐ๊พธ๋ ๊ณผ์ 1.2 ์๋ฒ ๋ฉ์ ์ญํ 1) ๋จ์ด/ ๋ฌธ์ฅ ๊ฐ ๊ด๋ จ๋ ๊ณ์ฐ ๋จ์ด๋ฅผ ๋ฒกํฐ๋ก ํํํ๋ ์๊ฐ ๋จ์ด๊ฐ์ ์ ์ฌ๋๋ฅผ ๊ณ์ฐ ๊ฐ๋ฅ ex> ์ฝ์ฌ์ธ ์ ์ฌ๋ 2) ์๋ฏธ/๋ฌธ๋ฒ ์ ๋ณด ํจ์ถ ๋ฒกํฐ๊ฐ์ ์ฌ์น ์ฐ์ฐ์ผ๋ก ๋จ์ด ๊ฐ์ ์ ์ถ ํ๊ฐ ๊ฐ๋ฅ ex> ๋จ์ด1 + ๋จ์ด 2 - ๋จ์ด 3 = ์๋ค + ๋ธ - ์๋ = ์๋ 3) ์ ์ด ํ์ต ๋จ์ด๋ฅผ ์๋ฒ ๋ฉ ํ ๊ฐ์ด input ์ผ๋ก ์ฐ์ธ๋ค. 1.3 ์๋ฒ ๋ฉ ๊ธฐ๋ฒ 0) ๊ทธ ์ ์ ์์๋ฌ์ค๋ฅผ ํ์ฉํ ๋ฐฉ๋ฒ (์์๋ฌ์ค ๊ธฐ๋ฐ ๊ธฐ๋ฒ) wordNet์๋ง์ ๋จ์ด์ ๋ํ ๋์์ด์ ๊ณ์ธต ๊ตฌ์กฐ ๋ฑ ์ ์ ํ์ง๋ง ์์์ ์ผ๋ก ์๋ ๋ณํ์ ๋์ํ๊ธฐ ์ด๋ ต๋ค. ๋น์ฉ์ด ๋ง์ด ๋ ๋ค. ๋จ์ด๊ฐ ๋ฏธ๋ฌํ ์ฐจ์ด๋ฅผ ํํ ํ ์ ์๋ค. nlp์์ ๊ฐ์ฅ ์ ๋ช ํ ์์๋ฌ์ค.. 2021. 12. 10. ์ด์ 1 ๋ค์