學(xué)習(xí)學(xué)習(xí)gogogo 篇三：一分鐘學(xué)會(huì)爬取網(wǎng)頁文本內(nèi)容

2021.08.28

創(chuàng)作立場(chǎng)聲明：看到一款好軟件，簡(jiǎn)單的操作可以替代繁雜的工作，推薦給大家。我也是剛剛接觸，正在學(xué)習(xí)中，希望能夠拋磚引玉。無利益相關(guān)。

前幾天寫了篇長(zhǎng)文《一分鐘學(xué)會(huì)制作網(wǎng)絡(luò)爬蟲》。

今天再來看下怎么得到的網(wǎng)頁上的信息。

操作過程

第一步還是綁定帶有插件的瀏覽器。

我們還是以某電影網(wǎng)站為例，獲得最近電影的網(wǎng)址和名稱。具體步驟看上一篇內(nèi)容。

也就是逐個(gè)打開網(wǎng)頁。使用自帶的遍歷。遍歷字典和遍歷數(shù)組都可以，使用略微有點(diǎn)不同，我這里使用略微麻煩點(diǎn)的字典。

使用遍歷字典，將字典名稱改為arrayData。字典含鍵和值。

到這里就可以逐個(gè)打開網(wǎng)址了。

注意將右邊的加載鏈接替換為value[1]。

注意將右側(cè)的路徑設(shè)置成你電腦想放的地方，后面的& value[0]，是用電影的名字命名這個(gè)文件夾。value[0]是value里的第一個(gè)元素，也就是我們抓取到的電影名字。

我們先看下網(wǎng)頁中文本內(nèi)容都有神馬。

先使用獲取元素文本內(nèi)容，獲取文字。點(diǎn)擊紅框中的部分，會(huì)出現(xiàn)一個(gè)箭頭，將箭頭指向需要獲取的文本然后再點(diǎn)擊。

就可以獲得文字信息了。

獲取文本后，用打開文檔（指向你想要打開的）--寫入文檔--另存為文檔（存到新建文件夾里）--關(guān)閉文檔，這幾步就可以保存文字內(nèi)容了。

是不是非常的簡(jiǎn)單？可以愉快的下載想看的文檔和小說啦。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版