Markdown 常用语法标题一级标题: “#” + 空格+ “一级标题” 二级标题: “##” + 空格+ “二级标题” 三级 ... 使用p标签:(在Jupyter Notebook中不适用). ... <看更多>
jupyter notebook markdown空格 在 JackieMium/py4ds_2nd_zh: 《利用Python进行数据分析·第2版》 的推薦與評價
... 安装好conda(Anaconda 或者Miniconda),在目录文件夹中用Jupyter notebook 打开 ... 将所有markdown 文件中文与英语、数字间添加了空格,方法来自robot527/add- ... ... <看更多>
jupyter notebook markdown空格 在 [問題] 爬蟲時href有空格- 看板Python - 批踢踢實業坊 的推薦與評價
小弟爬蟲新手想請教各位前輩
目前有一個專題是要爬518人力銀行的徵才網頁
小弟目前是用beautifulsoup爬列表頁裡面的Anchor
但是518連結內文檔的Anchor href有空白像這樣
https://www.518.com.tw/外商線上娛樂集團 徵聘 JAVA Developer 2名 工作地點
菲律賓-其它亞洲-東南亞-job-1471387.html?kw=java&pi=1
導致使用
for link in soup.find_all('a'):
print(link.get('href'))
爬出來的href只到https://www.518.com.tw/外商線上娛樂集團
空格後面的變成純字串造成爬出來的href連到錯誤的網頁
所以想請問此情況要如何解決讓空格後面的內容也可以放進去href?
感謝各位前輩幫忙~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.150.143
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1516022128.A.3FE.html
※ 編輯: keroromoa (114.25.150.143), 01/15/2018 21:24:43
不好意思,我表達的不夠清楚,
因為我是在jupyter notebook操作,所以希望抓下來的URL能夠保有連結的功能,
不過出來的URL還是一樣連結只到空格前,空格後變成純字串,
這樣來看是不是jupyter notebook在塞URL只要遇到空格都會出現同樣的狀況?感謝~
※ 編輯: keroromoa (118.165.209.19), 01/16/2018 20:28:03
最後是用先將所有anchor放進陣列再用特定字篩選出想要的anchor做成新的陣列
把新的陣列用for迴圈放進_repr_html_了,
只是包成_main.anchor_物件就沒辦法直接用陣列顯示出超連結,
必須要加index才能一個個把超連結顯示出,不過至少是能用的超連結了~感謝~
※ 編輯: keroromoa (140.115.236.203), 01/21/2018 18:35:09
... <看更多>