自動編碼器的一個典型應用是特征降維,和PCA的作用一樣,但是比PCA的性能更強。
可回以想這樣答一個場景:我們要訓練一個CNN模型,這個模型最終可以識別貓、狗、船等,那么我們需要給它喂入大量的貓狗等圖像,假如這些圖像都是高清的,即數(shù)據(jù)維度很大,那么CNN訓練的時間就會變長。這時候需要將圖片壓縮一下,我們當然可以考慮使用圖像壓縮算法,這里只是舉一個例子,如果某些數(shù)據(jù)集不是圖片,如何壓縮呢?
答案可以使用自編碼器,自編碼器可以將高維的數(shù)據(jù)特征用一個低維的特征來表示,
自動編碼器的作用是通過編碼器只學習其典型特征(維度降低了),該特征通過解碼器可以大致復原原來的數(shù)據(jù)即可。這樣再將這個學習到的低維特征輸入到相應的神經(jīng)網(wǎng)絡中,可以大大減少訓練的時間。在實際應用中,我們訓練好自動編碼器后,一般只使用其編碼器部分,從而獲得低維的數(shù)據(jù)。再將這個數(shù)據(jù)輸入到其它分類模型中進行訓練。