Add exercises 20

Signed-off-by: Manuel Vergara <manuel@vergaracarmona.es>
2023-10-01 23:50:57 +02:00
parent daabecd4a1
commit 8bb0639340
2 changed files with 139 additions and 0 deletions
--- a/30-days-of-python/20_Gestor_de_paquetes_de_Python/01_gestor_paquetes.py
+++ b/30-days-of-python/20_Gestor_de_paquetes_de_Python/01_gestor_paquetes.py
@@ -0,0 +1,137 @@
 """
 01_gestor_paquetes.py
 """
 import requests
 from collections import Counter
 import statistics
 import pandas as pd
 from bs4 import BeautifulSoup
 # 1. Lee esta URL y encuentra las 10 palabras más frecuentes.
 # Romeo y Julieta: 'http://www.gutenberg.org/files/1112/1112.txt'
 url_romeo_julieta = 'http://www.gutenberg.org/files/1112/1112.txt'
 response_romeo_julieta = requests.get(url_romeo_julieta)
 words = response_romeo_julieta.text.split()
 word_counts = Counter(words)
 top_10_words = word_counts.most_common(10)
 print("10 palabras más frecuentes:")
 for word, count in top_10_words:
    print(word, "-", count)
 print()
 # 2. Lee la API de gatos y la URL:
 # 'https://api.thecatapi.com/v1/breeds'
 # y encuentra:
 url_gatos = 'https://api.thecatapi.com/v1/breeds'
 response_gatos = requests.get(url_gatos)
 data_gatos = response_gatos.json()
 # - El mínimo, máximo, promedio,
 # mediana y desviación estándar
 # del peso de los gatos en unidades métricas.
 weights = [cat['weight']['metric'] for cat in data_gatos]
 weights = [float(w.split()[0]) for w in weights]
 min_weight = min(weights)
 max_weight = max(weights)
 avg_weight = statistics.mean(weights)
 med_weight = statistics.median(weights)
 std_weight = statistics.stdev(weights)
 print("Peso de los gatos en unidades métricas:")
 print("Mínimo:", min_weight)
 print("Máximo:", max_weight)
 print("Promedio:", avg_weight)
 print("Mediana:", med_weight)
 print("Desviación estándar:", std_weight)
 print()
 # - El mínimo, máximo, promedio,
 # mediana y desviación estándar
 # de la esperanza de vida
 # de los gatos en años.
 lifespans = [cat['life_span'] for cat in data_gatos]
 lifespans = [int(l.split()[0]) for l in lifespans if l != '']
 min_lifespan = min(lifespans)
 max_lifespan = max(lifespans)
 avg_lifespan = statistics.mean(lifespans)
 med_lifespan = statistics.median(lifespans)
 std_lifespan = statistics.stdev(lifespans)
 print("Esperanza de vida de los gatos en años:")
 print("Mínimo:", min_lifespan)
 print("Máximo:", max_lifespan)
 print("Promedio:", avg_lifespan)
 print("Mediana:", med_lifespan)
 print("Desviación estándar:", std_lifespan)
 print()
 # - Crea una tabla de frecuencias
 # de países y razas de gatos.
 country_counts = Counter([cat['origin']
                         for cat in data_gatos if cat['origin'] != ''])
 breed_counts = Counter([cat['name'] for cat in data_gatos])
 print("Tabla de frecuencias de países:")
 print(pd.DataFrame.from_dict(country_counts, orient='index'))
 print()
 print("Tabla de frecuencias de razas:")
 print(pd.DataFrame.from_dict(breed_counts, orient='index'))
 print()
 # 3. Lee la [API de países](https://restcountries.eu/rest/v2/all)
 # y encuentra:
 # El enlace está caído, uso otra versión
 url_countries = 'https://restcountries.com/v3.1/all'
 response_countries = requests.get(url_countries)
 data_countries = response_countries.json()
 # - Los 10 países más grandes.
 df = pd.DataFrame(data_countries)
 df['area'] = pd.to_numeric(df['area'])
 largest_countries = df.nlargest(10, 'area')
 print("Los 10 países más grandes:")
 for country in largest_countries['name']:
    print(country['common'])
 print()
 # - Los 10 idiomas más hablados.
 most_spoken_languages = df.explode('languages').groupby(
    'languages').size().nlargest(10)
 print("Los 10 idiomas más hablados:")
 print(most_spoken_languages)
 print()
 # - El número total de idiomas en la API de países.
 total_languages = len(df.explode('languages')['languages'].unique())
 print("Número total de idiomas en la API de países:", total_languages)
 print()
 # 4. La Universidad de California en Irvine (UCI)
 # es uno de los lugares más comunes para obtener
 # conjuntos de datos para ciencia de datos
 # y aprendizaje automático.
 # Lee el contenido de UCI
 # (https://archive.ics.uci.edu/ml/datasets.php).
 # Sin bibliotecas adicionales, puede ser difícil,
 # por lo que puedes intentarlo con BeautifulSoup4.
 url = 'https://archive.ics.uci.edu/ml/datasets.php'
 response = requests.get(url)
 soup = BeautifulSoup(response.content, 'html.parser')
 links = [a['href'] for a in soup.find_all('a') if a.has_attr('href')]
--- a/30-days-of-python/20_Gestor_de_paquetes_de_Python/README.md
+++ b/30-days-of-python/20_Gestor_de_paquetes_de_Python/README.md
@@ -20,4 +20,6 @@ Documento original en inglés: [python package manager](https://github.com/Asabe
 4. La Universidad de California en Irvine (UCI) es uno de los lugares más comunes para obtener conjuntos de datos para ciencia de datos y aprendizaje automático. Lee el contenido de UCI (https://archive.ics.uci.edu/ml/datasets.php). Sin bibliotecas adicionales, puede ser difícil, por lo que puedes intentarlo con BeautifulSoup4.
 [Solución](01_gestor_paquetes.py)
 [<< Day 19](../19_Manipulación_de_archivos/README.md) | [Day 21 >>](../21_Clases_y_objetos/README.md)