Pojawiła się potrzeba pociągnięcia z Internetów numerów ISBN na podstawie tytułów książek. Rudolf postanowił przerzucić swoją wirtualną szafkę z Biblionetki, która ponoć upada, do Goodreads. No i brak mu tych ISBN-ów.
Emsi podrzucił skrypt, a ja go ciut przerobiłem:
# -- coding: utf-8 --
import urllib2
import re
import fileinput
#https://www.google.pl/search?q=isbn+%22Aferzy%C5%9Bci+i+inne+opowiadania%22
for title in fileinput.input():
print title,
qtitle=urllib2.quote(title)
url="https://www.google.pl/search?q=isbn+%22"+qtitle+"%22"
# print url
# ISBN formats
# 8321603564
# 83-216-0356-4
#
reISBN=re.compile("ISBN[^0-9]*([\d\-]{10,17})")
req = urllib2.Request(url, headers={ 'User-Agent': 'Mozilla/5.0' })
response = urllib2.urlopen(req)
html = response.read()
print re.findall(reISBN,html)