Curso-lenguaje-python/30-days-of-python/22_Web_scraping/README.md

# Web scraping

Documento original en inglés: [Web Scraping](https://github.com/Asabeneh/30-Days-Of-Python/blob/master/22_Day_Web_scraping/22_web_scraping.md)

## Ejercicios

1. Realiza un raspado web del siguiente sitio web y guarda los datos en un archivo JSON (URL = 'http://www.bu.edu/president/boston-university-facts-stats/').

2. Extrae la tabla de esta URL (https://archive.ics.uci.edu/ml/datasets.php) y conviértela en un archivo JSON.

3. Realiza un raspado web de la tabla de presidentes y guarda los datos como JSON (https://en.wikipedia.org/wiki/List_of_presidents_of_the_United_States). La tabla no está muy estructurada y el proceso de raspado puede llevar mucho tiempo.

[Solución](01_web_scraping.py)

[<< Day 21](../21_Clases_y_objetos/README.md) | [Day 23 >>](../23_Entorno_virtual/README.md)
Add exercise of new course 30-days-of-python Signed-off-by: Manuel Vergara <manuel@vergaracarmona.es> 2023-09-18 01:00:26 +02:00			`# Web scraping`

			`Documento original en inglés: [Web Scraping](https://github.com/Asabeneh/30-Days-Of-Python/blob/master/22_Day_Web_scraping/22_web_scraping.md)`

			`## Ejercicios`

Update structure Signed-off-by: Manuel Vergara <manuel@vergaracarmona.es> 2023-09-27 01:21:16 +02:00			`1. Realiza un raspado web del siguiente sitio web y guarda los datos en un archivo JSON (URL = 'http://www.bu.edu/president/boston-university-facts-stats/').`

			`2. Extrae la tabla de esta URL (https://archive.ics.uci.edu/ml/datasets.php) y conviértela en un archivo JSON.`

			`3. Realiza un raspado web de la tabla de presidentes y guarda los datos como JSON (https://en.wikipedia.org/wiki/List_of_presidents_of_the_United_States). La tabla no está muy estructurada y el proceso de raspado puede llevar mucho tiempo.`

Add exercises 21 - Not solved Signed-off-by: Manuel Vergara <manuel@vergaracarmona.es> 2023-10-03 23:50:51 +02:00			`[Solución](01_web_scraping.py)`

Update structure Signed-off-by: Manuel Vergara <manuel@vergaracarmona.es> 2023-09-27 01:21:16 +02:00			`[<< Day 21](../21_Clases_y_objetos/README.md) \| [Day 23 >>](../23_Entorno_virtual/README.md)`