創(chuàng)作立場(chǎng)聲明:看到一款好軟件,簡(jiǎn)單的操作可以替代繁雜的工作,推薦給大家。我也是剛剛接觸,正在學(xué)習(xí)中,希望能夠拋磚引玉。無利益相關(guān)。
前幾天寫了篇長(zhǎng)文《一分鐘學(xué)會(huì)制作網(wǎng)絡(luò)爬蟲》。
今天再來看下怎么得到的網(wǎng)頁上的信息。
第一步還是綁定帶有插件的瀏覽器。
我們還是以某電影網(wǎng)站為例,獲得最近電影的網(wǎng)址和名稱。具體步驟看上一篇內(nèi)容。
也就是逐個(gè)打開網(wǎng)頁。使用自帶的遍歷。遍歷字典和遍歷數(shù)組都可以,使用略微有點(diǎn)不同,我這里使用略微麻煩點(diǎn)的字典。
到這里就可以逐個(gè)打開網(wǎng)址了。
我們先看下網(wǎng)頁中文本內(nèi)容都有神馬。
先使用獲取元素文本內(nèi)容,獲取文字。點(diǎn)擊紅框中的部分,會(huì)出現(xiàn)一個(gè)箭頭,將箭頭指向需要獲取的文本然后再點(diǎn)擊。
就可以獲得文字信息了。
獲取文本后,用打開文檔(指向你想要打開的)--寫入文檔--另存為文檔(存到新建文件夾里)--關(guān)閉文檔,這幾步就可以保存文字內(nèi)容了。
是不是非常的簡(jiǎn)單?可以愉快的下載想看的文檔和小說啦。
聯(lián)系客服