今天小千來發福利了,教大家如何從網上爬取美女街拍圖片,然后批量插入到word里面,沒事的時候可以拿出來養養眼不是,看下去文末附源碼獲取方式:
本文涉及知識主要包括Ajax動態加載網頁爬取、requests保存網頁圖片以及word批量插入圖片。
第一步:分析圖片數據接口打開今日頭條主頁,搜索街拍,會出現好多街拍圖片
一直往下拉,圖片會一直加載,但是網頁url未變化,這時我們要打開流量分析工具。以火狐瀏覽器為例,依次右鍵-查看元素-網絡,然后點擊左上角清除按鈕
下拉網頁:
出現一大堆加載數據,這時我們打開第一個的json文件的響應窗口:
發現這返回的就是街拍圖片信息,每次返回20條,再看看它的請求參數:
經過試驗發現,timestamp和_signature是變化參數,但是可以舍棄,最后以offset的變化來改變換頁(0代表第1頁,20代表第2頁,依次類推...)
第二步:python下載圖片準備下載20頁的數據
1.首先構造url
2.模擬請求數據,并將返回數據轉換成json格式
一定要帶上登錄后的cookie數據,否則無法返回圖片信息
3.從返回數據中取出標題和圖片url
4.requests下載圖片,并以標題命名
5.圖片效果展示
第三步:word批量插入圖片安裝docx和PIL模塊,直接pip安裝即可
1.導入相關模塊
2.遍歷該文件夾下所有圖片名
3.獲取每張圖片像素大小
主要是因為街拍圖片像素差別較大,想按原像素大小導入word中,img.size為元組類型數據,這里用list將其轉化為列表
4.將圖片按原像素添加至word中
5.最終效果
看完了,是不是想試一試了,想要源碼的同學可以添加我們的Python技術交流qq群:790693323,加群找群管理要學習資料和項目代碼即可,還在等什么,等你來哦~~~~