Skrypt do pobierania ISBN

Posted on Fri 22 April 2016 in Hacks (wannabe)

Pojawiła się potrzeba pociągnięcia z Internetów numerów ISBN na podstawie tytułów książek. Rudolf postanowił przerzucić swoją wirtualną szafkę z Biblionetki, która ponoć upada, do Goodreads. No i brak mu tych ISBN-ów.

Emsi podrzucił skrypt, a ja go ciut przerobiłem:

# -- coding: utf-8 --
import urllib2
import re
import fileinput

#https://www.google.pl/search?q=isbn+%22Aferzy%C5%9Bci+i+inne+opowiadania%22

for title in fileinput.input():
    print title,
    qtitle=urllib2.quote(title)
    url="https://www.google.pl/search?q=isbn+%22"+qtitle+"%22"
#    print url

# ISBN formats
# 8321603564
# 83-216-0356-4
#

    reISBN=re.compile("ISBN[^0-9]*([\d\-]{10,17})")
    req = urllib2.Request(url, headers={ 'User-Agent': 'Mozilla/5.0' })
    response = urllib2.urlopen(req)
    html = response.read()
    print re.findall(reISBN,html)