Skrypt do pobierania ISBN
Posted on Fri 22 April 2016 in Hacks (wannabe) • 1 min read
Pojawiła się potrzeba pociągnięcia z Internetów numerów ISBN na podstawie tytułów książek. Rudolf postanowił przerzucić swoją wirtualną szafkę z Biblionetki, która ponoć upada, do Goodreads. No i brak mu tych ISBN-ów.
Emsi podrzucił skrypt, a ja go ciut przerobiłem:
# -- coding: utf-8 -- import urllib2 import re import fileinput #https://www.google.pl/search?q=isbn+%22Aferzy%C5%9Bci+i+inne+opowiadania%22 for title in fileinput.input(): print title, qtitle=urllib2.quote(title) url="https://www.google.pl/search?q=isbn+%22"+qtitle+"%22" # print url # ISBN formats # 8321603564 # 83-216-0356-4 # reISBN=re.compile("ISBN[^0-9]*([\d\-]{10,17})") req = urllib2.Request(url, headers={ 'User-Agent': 'Mozilla/5.0' }) response = urllib2.urlopen(req) html = response.read() print re.findall(reISBN,html)