在自然語言處理中,若有個字典或字庫里有N個單字,則每個單字可以被一個N維的one-hot向量代表。譬如若字庫里僅有apple(蘋果),banana(香蕉),以及pineapple(鳳梨)這三個單字,則他們各自的one-hot向量可以為:
由于電腦無法理解非數(shù)字類的數(shù)據(jù),One-hot編碼可以將類別性數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)字格式,方便機器學(xué)習(xí)的算法進(jìn)行處理及計算。而轉(zhuǎn)換成固定維度的向量則方便機器學(xué)習(xí)算法進(jìn)行線性代數(shù)上的計算。另外由于一個one-hot向量中,絕大部分的數(shù)字都是0,所以若使用稀疏矩陣的數(shù)據(jù)結(jié)構(gòu),則可以節(jié)省電腦內(nèi)存的使用量
由于電腦無法理解非數(shù)字類的數(shù)據(jù),One-hot編碼可以將類別性數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)字格式,方便機器學(xué)習(xí)的算法進(jìn)行處理及計算。而轉(zhuǎn)換成固定維度的向量則方便機器學(xué)習(xí)算法進(jìn)行線性代數(shù)上的計算。另外由于一個one-hot向量中,絕大部分的數(shù)字都是0,所以若使用稀疏矩陣的數(shù)據(jù)結(jié)構(gòu),則可以節(jié)省電腦內(nèi)存的使用量
2021-07-24
視頻中的地址
https://paperswithcode.com/area/natural-language-processing
https://paperswithcode.com/area/natural-language-processing