[問題] python 爬蟲遇到big5擴充字亂碼 ... 遇到這個詞: "宏碁電腦",發現爬下來時候會變成亂碼, https://imgur.com/ZSV4gAe ... 有big5哦,requests有encoding的參數. ... <看更多>
big5亂碼 在 中文編碼(encoding) - Using QGIS - 人口地圖繪製 的推薦與評價
如果用預設的編碼打開圖層,會出現亂碼。 在這些操作中,使用者需要知道檔案本身是用哪種編碼作儲存,否則就需要一個個測試。台灣常用的編碼包括Big5 及utf-8。 ... <看更多>
big5亂碼 在 #外掛字幕#繁體中文big5#亂碼 - 3C板 | Dcard 的推薦與評價
請問板上的電腦天才同學,為什麼外掛字幕和電影轉檔出來是亂碼?而點進去看字幕word檔是正常的繁體中文,我的編碼是繁體中文big5,請問是哪裡需要修定 ... ... <看更多>
big5亂碼 在 [問題] python 爬蟲遇到big5擴充字亂碼 - 批踢踢實業坊 的推薦與評價
大家好,又上來打擾了,最近在爬蟲的時候遇到這個詞:
"宏碁電腦",發現爬下來時候會變成亂碼,
經爬文查詢後發現這樣的問題:
https://blog.hoamon.info/2008/05/python-big5.html
不過該解法似乎不能應用在python3.7
想問一下有沒有類似的情況該怎麼解@@?
補上網站:
https://tw.stock.yahoo.com/news/%E5%A4%96%E8%B3%87-%E8%B3%A3%E8%B6%85%E8%82%A1-%E5%AE%8F-%E7%A2%81-%E9%B4%BB-234706227.html
程式碼:
import requests
from bs4 import BeautifulSoup
url='https://tw.stock.yahoo.com/news/%E5%A4%96%E8%B3%87-%E8%B3%A3%E8%B6%85%E8%82%A1-%E5%AE%8F-%E7%A2%81-%E9%B4%BB-234706227.html'
req=requests.get(url)
bs=BeautifulSoup(req.text,'html.parser')
print(bs.find('h1').text)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.133.44.129
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1543208095.A.47E.html
... <看更多>