Keras IMDb

IMDb是一個電影相關的線上資料庫

這次要利用IMDb的影評文字預測它是正面評價或是負面評價

在深度學習模型中只能接受數字,Keras有提供Tokenizer模組

會依照英文次數進行排序,在給每個單字編號:Keras Tokenizer

在利用Word embedding 將數字list 轉換成向量list,最後丟進去LSTM做學習

(在Keras 使用 RNN LSTM 模型很方便,一行解決)

IMDb1

Keras也提供讓我們方便把英文轉成數字的模型

IMDb2

這是model summary

把數字list轉換成64維的向量list,並且用三層的隱藏層來做訓練。

準確率:0.8543

實際使用

進入IMDb網站,抓取Spider-Man: Homecoming評論,檢驗是否正確。

拿了正面評論結果也是顯示正面(1:正面,0:負面)

My Github



發表留言