Análise de datos de cantantes

Duración:: 50 min
Agrupamento:: 2

Copilot. *Cantantes e cartos* (CC BY-SA)

Ides crear un DataFrame con cantantes e algúns datos curiosos, podes buscar na web actualizacións ou novos datos para incluir:

data = {
'Cantante': ['Taylor Swift', 'Paul McCartney', 'Bruce Springsteen', 'Adele', 'Kim Kardashian'],
'Gañancias (millóns de $)': [1043, 1300, 650, 1000, 2000],
'Posesións': ["Chicle de Céline Dion", "Subasta de $25,000 de Janet Jackson", None, None, None],
'Parellas': [None, None, None, 'Simon Konecki', 'Kanye West (ex)']
}

Tarefas:

Crear e imprimir o DataFrame
Seleccionar as columnas Cantante e Gañancias e imprimilas
Filtrar e imprimir as gañancias maiores de 700 millóns
Agregar unha columna que mostre a porcentaxe de gañancias de cada cantante con respecto ó total

Lembra:A IA está para axudarche, pregúntalle!

Exemplo de resultado esperado

DataFrame inicial

Cantante	Gañancias (millóns de $)	Posesións	Parellas
Taylor Swift	1043	Chicle de Céline Dion	None
Paul McCartney	1300	Subasta de $25,000 de Janet Jackson	None
Bruce Springsteen	650	None	None
Adele	1000	None	Simon Konecki
Kim Kardashian	2000	None	Kanye West (ex)

Gañancias dos cantantes

Cantante	Gañancias (millóns de $)
Taylor Swift	1043
Paul McCartney	1300
Bruce Springsteen	650
Adele	1000
Kim Kardashian	2000

Cantantes con gañancias superiores a 700 millóns de dólares

Cantante	Gañancias (millóns de $)	Posesións	Parellas
Taylor Swift	1043	Chicle de Céline Dion	None
Paul McCartney	1300	Subasta de $25,000 de Janet Jackson	None
Adele	1000	None	Simon Konecki
Kim Kardashian	2000	None	Kanye West (ex)

DataFrame con porcentaxe de gañancias

Cantante	Gañancias (millóns de $)	Posesións	Parellas	Porcentaxe de Gañancias
Taylor Swift	1043	Chicle de Céline Dion	None	17.40%
Paul McCartney	1300	Subasta de $25,000 de Janet Jackson	None	21.69%
Bruce Springsteen	650	None	None	10.84%
Adele	1000	None	Simon Konecki	16.69%
Kim Kardashian	2000	None	Kanye West (ex)	33.38%

Código Python: Análise de datos de cantantes

# Importamos a libraría pandas, que nos permite traballar con datos de maneira eficiente
import pandas as pd  

# ---- ACTIVIDADE 1: CREACIÓN DO DATAFRAME ----  
# Creamos un dicionario chamado 'data' que contén información sobre varios cantantes
data = {
    'Cantante': ['Taylor Swift', 'Paul McCartney', 'Bruce Springsteen', 'Adele', 'Kim Kardashian'],
    'Gañancias (millóns de $)': [1043, 1300, 650, 1000, 2000],  
    'Posesións': ["Chicle de Céline Dion", "Subasta de $25,000 de Janet Jackson", None, None, None],  # Algúns valores están como None (faltan datos)
    'Parellas': [None, None, None, 'Simon Konecki', 'Kanye West (ex)']  
}

# Convertimos o dicionario nun DataFrame de pandas, que é unha estrutura de datos tabular
df = pd.DataFrame(data)  

# Mostramos o DataFrame por pantalla para visualizar os datos nun formato tabular
print("DataFrame inicial:")
print(df)  

# ---- ACTIVIDADE 2: SELECCIÓN DE DATOS ----  
# Seleccionamos as columnas 'Cantante' e 'Gañancias (millóns de $)' para traballar só con esa información
ganancias = df[['Cantante', 'Gañancias (millóns de $)']]  

# Mostramos as gañancias por cantante
print("\nGañancias dos cantantes:")
print(ganancias)  

# ---- ACTIVIDADE 3: FILTRADO DE DATOS ----  
# Filtramos só  cantantes que teñen gañancias superiores a 700 millóns de dólares
filtro_ganancias = df[df['Gañancias (millóns de $)'] > 700]  

# Mostramos o resultado do filtro
print("\nCantantes con gañancias superiores a 700 millóns de dólares:")
print(filtro_ganancias)  

# ---- ACTIVIDADE 4: AGREGACIÓN DE COLUMNAS ----  
# Calculamos a suma total das gañancias 
total_ganancias = df['Gañancias (millóns de $)'].sum()  

# Agregamos unha nova columna ca porcentaxe de gañancias de cada cantante respecto ao total
df['Porcentaxe de Gañancias'] = (df['Gañancias (millóns de $)'] / total_ganancias) * 100  

# Mostramos o DataFrame actualizado, agora coa columna de porcentaxe de gañancias incluída
print("\nDataFrame con porcentaxe de gañancias:")
print(df)

Rúbrica de avaliación

**Rúbrica Reto 2: Quen gaña máis?**
Criterio	Excelente (9-10)	Bo (7-8)	Aceptable (5-6)	Insuficiente (3-4)	Deficiente (0-2)
Creación do DataFrame	DataFrame xerado correctamente con todas as columnas e datos.	DataFrame creado con pequenas imprecisións nos datos.	DataFrame creado pero con erros que afectan a estrutura.	DataFrame incompleto ou con valores erróneos importantes.	Non crea o DataFrame correctamente ou non completa esta parte.
Selección de columnas	Extracción correcta das columnas "Cantante" e "Gañancias".	Extracción correcta pero con pequenos problemas de formato.	Selección con erros, afectando a correcta visualización.	Non selecciona as columnas adecuadas.	Non realiza esta tarefa.
Filtrado de gañancias	Filtrado correcto para seleccionar só cantantes con máis de 700 millóns.	Filtrado ben feito pero con imprecisións nos valores mostrados.	Filtrado realizado pero con erros que afectan a saída.	Non aplica filtrado correctamente ou mostra resultados incorrectos.	Non realiza a selección de cantantes por gañancias.
Agregación de columna	Creación correcta da columna de porcentaxe de gañancias.	Columna agregada pero con pequenos erros nos cálculos.	Agregación con cálculos incorrectos.	Erro ao calcular os porcentaxes correctamente.	Non agrega a nova columna.
Actitude ante os problemas	Actitude proactiva, busca solucións e optimización do código.	Resolve os problemas con esforzo e consulta a documentación.	Resolve con dificultades pero sen explorar melloras posibles.	Resígnase ante os erros e non busca alternativas.	Non intenta resolver os problemas ou abandona o traballo.
Traballo colaborativo	Comunicación eficaz e traballo equilibrado en parella.	Traballo en equipo con pequenas dificultades na colaboración.	Interacción mínima, traballo case independente.	Pouca colaboración, realízase gran parte do traballo de forma individual.	Non colabora coa parella nin contribúe ao traballo conxunto.