Curso-lenguaje-python/30-days-of-python/22_Web_scraping
Manuel Vergara 94c89522d1 Add exercises 21 - Solved 3
Signed-off-by: Manuel Vergara <manuel@vergaracarmona.es>
2023-10-05 02:04:06 +02:00
..
01_web_scraping.py Add exercises 21 - Solved 1 2023-10-04 23:17:38 +02:00
02_web_scraping.py Add exercises 21 - Solved 2 2023-10-05 00:01:26 +02:00
03_web_scraping.py Add exercises 21 - Solved 3 2023-10-05 02:04:06 +02:00
bu_stats.json Add exercises 21 - Solved 1 2023-10-04 23:17:38 +02:00
README.md Add exercises 21 - Solved 1 2023-10-04 23:17:38 +02:00
uci_datasets.json Add exercises 21 - Solved 2 2023-10-05 00:01:26 +02:00
us_presidents.json Add exercises 21 - Solved 3 2023-10-05 02:04:06 +02:00

Web scraping

Documento original en inglés: Web Scraping

Ejercicios

  1. Realiza un raspado web del siguiente sitio web y guarda los datos en un archivo JSON (URL = 'http://www.bu.edu/president/boston-university-facts-stats/').

Solución

  1. Extrae la tabla de esta URL (https://archive.ics.uci.edu/ml/datasets.php) y conviértela en un archivo JSON.

Solución

  1. Realiza un raspado web de la tabla de presidentes y guarda los datos como JSON (https://en.wikipedia.org/wiki/List_of_presidents_of_the_United_States). La tabla no está muy estructurada y el proceso de raspado puede llevar mucho tiempo.

Solución

<< Day 21 | Day 23 >>