Ruby 爬蟲小技巧 - 處理 Html Entity
這是一個在工作上遇到的小問題。
把網頁爬回來的時候有 HTML Entity 的編碼,看起來很不美觀。
舉例來說,爬回來的標題如果含有 HTML Entity 會是這個樣子:
1 |
|
如果我想要使用資料建立自己資料庫的時候勢必要對 html entity 做一些處理
這時候 Gemhtmlentities
就派上用場了。使用方法:
1 |
|
現在你可以把品名存進資料庫了 :D
其實這篇只是想記錄一下,HTML Entity這個名詞。歸類到編碼的類別方便以後查找。