無人問津的森林系技能樹

喝咖啡,吃甜食,務必把握時間讓你胃食道逆流一下

0%

[python]利用flickrapi爬取Flickr的圖片


Flickr是世界數一數二大的圖片資料庫,雖然經過幾次轉手,經歷付費政策的風波,其仍具相當的價值
flickrapi可以幫助我們快速收集圖片資料,探索Flickr
這邊使用的python環境為3.7
使用pip install flickrapi是安裝flickrapi的好的開始

在使用flickrapi前記得去申請一組key跟secret方便後續使用

以下就是code的部分

python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
import flickrapi
from urllib.request import urlretrieve
import os

# 這邊打自己的key跟secret,不要傻傻複製貼上,跑不動阿!!!
flickr = flickrapi.FlickrAPI(api_key=KEY,
secret=SECRET,
cache=True)

# 這邊打要搜尋的關鍵字
searchword = 'office ceiling'
# 這邊放搜尋張數上限
limitnum = 500

os.makedirs('./picture/%s' % searchword, exist_ok=True)

photos = flickr.walk(text=searchword,
extras='url_c',
per_page=200,
sort='relevance')
urls = list()
for i, photo in enumerate(photos):
print(i)

try:
url = photo.get('url_c')
urls.append(url)
urlretrieve(urls[i], './picture/%s/%s-%s.jpg' % (searchword, searchword, str(i)))
except Exception as e:
print(e)

if i>limitnum-1:
break

使用自行注意著作權問題喔~