程序中使用的scrapy的安裝方法見/p/d2c8b1496949。在這裏,妳可以直接用CMD創建壹個scrapy項目,只需輸入scrapy startproject的名稱,當前目錄下就會新建壹個文件夾。cd在這個文件夾中之後,輸入scrapy genspider的名稱和目標URL來創建您的爬蟲文件(例如,scrapy gen spider sample/v)。
爬蟲創建成功後,可以對其進行編輯,可以看到打開的爬蟲文件(本例中為sample.py)。
接下來,我們需要定義parse()函數,並使用Xpath選擇器提取web頁面中的標簽內容。在這裏使用Xpath helper可以提高/v/digital(數字區域)的效率。
/v/音樂(音樂區)
雖然方法很蠢,但是最後運行成功還是很開心的。我以後會繼續研究爬行動物。愚蠢的方法終究是不可取的。