Update url with format and url_base
This commit is contained in:
parent
c681de5c61
commit
c47a45839e
@ -9,8 +9,7 @@ import bs4
|
|||||||
import requests
|
import requests
|
||||||
|
|
||||||
# Variables
|
# Variables
|
||||||
raiz = 'http://books.toscrape.com/catalogue/page-'
|
url_base = 'http://books.toscrape.com/catalogue/page-{}.html'
|
||||||
extension = '.html'
|
|
||||||
fin_url = True
|
fin_url = True
|
||||||
page = 0
|
page = 0
|
||||||
lista_titulos = []
|
lista_titulos = []
|
||||||
@ -21,7 +20,7 @@ while fin_url:
|
|||||||
page += 1
|
page += 1
|
||||||
page = str(page)
|
page = str(page)
|
||||||
|
|
||||||
enlace = raiz + page + extension
|
enlace = url_base.format(page)
|
||||||
|
|
||||||
resultado = requests.get(enlace)
|
resultado = requests.get(enlace)
|
||||||
sopa = bs4.BeautifulSoup(resultado.text, 'lxml')
|
sopa = bs4.BeautifulSoup(resultado.text, 'lxml')
|
||||||
@ -31,9 +30,12 @@ while fin_url:
|
|||||||
|
|
||||||
# Todos los títulos
|
# Todos los títulos
|
||||||
titulos = sopa.select('.product_pod a')
|
titulos = sopa.select('.product_pod a')
|
||||||
|
|
||||||
for title in titulos:
|
for title in titulos:
|
||||||
if title.get('title') != None:
|
if title.get('title') != None:
|
||||||
lista_titulos.append(title.get('title'))
|
lista_titulos.append(title.get('title'))
|
||||||
|
|
||||||
else:
|
else:
|
||||||
fin_url = False
|
fin_url = False
|
||||||
|
|
||||||
|
print(lista_titulos)
|
||||||
|
Loading…
Reference in New Issue
Block a user