|
||
---|---|---|
.. | ||
01_web_scraping.py | ||
02_web_scraping.py | ||
03_web_scraping.py | ||
bu_stats.json | ||
README.md | ||
uci_datasets.json | ||
us_presidents.json |
Web scraping
Documento original en inglés: Web Scraping
Ejercicios
- Realiza un raspado web del siguiente sitio web y guarda los datos en un archivo JSON (URL = 'http://www.bu.edu/president/boston-university-facts-stats/').
- Extrae la tabla de esta URL (https://archive.ics.uci.edu/ml/datasets.php) y conviértela en un archivo JSON.
- Realiza un raspado web de la tabla de presidentes y guarda los datos como JSON (https://en.wikipedia.org/wiki/List_of_presidents_of_the_United_States). La tabla no está muy estructurada y el proceso de raspado puede llevar mucho tiempo.