Restructure content and add notes from HolaMundo

Signed-off-by: Manuel Vergara <manuel@vergaracarmona.es>
2023-05-20 09:36:26 +02:00
parent 64ed03f811
commit f4e9797c4b
430 changed files with 889 additions and 24 deletions
--- a/python-total/dia_11/02_web_scraping_02.py
+++ b/python-total/dia_11/02_web_scraping_02.py
@@ -0,0 +1,37 @@
+"""
+Web scraping 
+Descargar imágenes
+
+"""
+import bs4
+import requests
+
+
+resultado = requests.get(
+    'https://www.escueladirecta.com/courses')
+
+
+# Para poder extraer datos necesitamos
+# un parser (analizador sintáctico)
+# como beautiful soup
+# Necesitaremos el texto y el tipo de motor de parsing
+sopa = bs4.BeautifulSoup(resultado.text, 'lxml')
+
+# Aislamos la url de la primera imagen
+# que queremos descargar
+imagen = sopa.select('.course-box-image')[0]['src']
+print(imagen)
+
+# Ahora cogemos el contenido del enlace
+# (Tendrá un Response 200)
+binario_imagen = requests.get(imagen)
+# y mostramos el binario
+
+# print(binario_imagen.content)
+
+# Ahora preparamos un fichero para escribir
+# wb significa "escribir binario"
+# Abrimos el fichero, escribimos dentro y cerramos
+f = open('mi_imagen.jpg', 'wb')
+f.write(binario_imagen.content)
+f.close()