Saltar navegación

O big-data

Datos, datos e máis datos

O anterior, detectar patróns e predecir o seguinte dato, tamén o pode facer un humano. Donde reside entón, o verdadeiro potencial da intelixencia artificial?

Big Data
Copilot. Big Data (CC BY-SA)



Na cantidade de datos que pode almacenar e procesar. Niso, as máquinas son moi superiores ós humanos!

Na década dos 80, comezou a sociedade dos datos e, a sociedade da información na década dos 90. Neste século, debido á xeneralización do uso de internet, redes sociais e dispositivos móbiles, a cantidade de datos explosionou:

  • Michael Lesk publicou en 1997 un artigo titulado "How Much Information Is There in the World?" onde proporcionou unha estimación temperá sobre a cantidade de información existente e o seu crecemento futuro. Lesk examinou diferentes tipos de información, como textos, imaxes, audio e vídeo, e analizou tanto a súa produción como o seu almacenamento:
    • No momento da publicación estimou que a cantidade total de información no mundo era de aproximadamente 12 exabytes (12 mil millóns de gigabytes). Isto incluía libros, xornais, revistas, gravacións de audio e vídeo, e datos de almacenamento electrónico.
    • Predixo que a cantidade de información duplicaríase aproximadamente cada tres anos, debido ao rápido crecemento da capacidade de almacenamento e a produción de datos dixitais.
  • Desde a publicación do artigo, a cantidade de información no mundo creceu de maneira exponencial. Algunhas estimacións máis recentes indican que en 2025 había aproximadamente 175 zettabytes (175 mil millóns de terabytes) de datos, e espérase que este número continúe crecendo rapidamente, impulsado polo aumento na produción de datos dixitais a través de internet, dispositivos móbiles, redes sociais, e o Internet das Cousas (IoT).
Gráfica crecemento Big Data
Creación Propia. Gráfica crecemento Big Data (CC BY-SA)


Definición

O termo Big Data refírese a conxuntos de datos extremadamente grandes e complexos que non poden ser xestionados e analizados mediante métodos e ferramentas tradicionais.


O Big Data caracterízase polas chamadas "tres uves": volume, velocidade e variedade.

O volume refírese á enorme cantidade de datos xerados, a velocidade relaciónase coa rapidez coa que se crean e procesan estes datos, e a variedade implica a diversidade dos datos que inclúen desde texto e números ata imaxes e vídeos.

O crecemento exponencial do volume de información deu lugar á necesidade de tecnoloxías avanzadas para o seu manexo e análise; todas elas, en conxunto, son chamadas Big Data.

Neste contexto, a intelixencia artificial (IA) xoga un papel crucial dado que a IA e, especialmente, a aprendizaxe automática e profunda, son capaces de procesar e analizar grandes volumes de datos a unha velocidade e precisión inigualables polos métodos tradicionais , grazas ás tecnoloxías que nos proporciona o Big Data. Isto permítenos non só almacenar e xestionar os datos de maneira eficiente, senón tamén extraer patróns, facer predicións e tomar decisións en tempo real.

Benvidos á sociedade do coñecemento.

Actualiza a gráfica de Big Data

Duración:
20 min
  • Este é un programa en Python que podes executar en Google Colaboratory para graficar os datos de crecemento de datos de 1997 a 2025.
  • O programa inclue explicacións detalladas nos comentarios para que comprendas cada paso.
  • Executandoo  en Colab, podes probar  a cambiar os datos actualizándoos. Realiza unha búsqueda na web, e engade os datos actualizados ata o ano actual.
  • Non te preocupes por comprender o programa totalmente, só de entender o que fai.
  • Podes xogar coas  instrucións:
    • plt.figure(figsize=(10, 6)) para cambiar o tamaño das imaxes e ver a gráfica máis claramente.
    • plt.plot(anos, volumen, marker='o', color='orange') para cambiar a cor e os puntos da gáfica
    • plt.title("Crecemento de datos creados anualmente (1997-2025)", fontsize=14) para actualizar ata o ano actual
  • Rexistra no teu portafolio as respostas e conclusións

Código Python: GRÁFICA CRECEMENTO BIG DATA

# Importa a biblioteca Matplotlib para a creación de gráficas
import matplotlib.pyplot as plt

# Datos: Listas que representan os anos e o volume de datos creados anualmente (en exabytes)
anos = [1997, 2005, 2010, 2020, 2025]  # Lista cos anos que queremos representar na gráfica
volumen = [0.001, 130, 1000, 64000, 463000]  # Lista co volume de datos creados anualmente  para cada ano

# Configuración do tamaño da gráfica
plt.figure(figsize=(10, 6))  # Especifica as dimensións da gráfica en polgadas

# Creación da liña da gráfica cos datos proporcionados
plt.plot(anos, volumen, marker='o', color='orange')  # Engade unha liña con puntos marcados para cada dato, usando a cor azul

# Engadir un título á gráfica
plt.title("Crecemento de datos creados anualmente  (1997-2025)", fontsize=14)  # Define o título e o tamaño da fonte

# Etiqueta para o eixo horizontal (anos)
plt.xlabel("Ano", fontsize=12)  # Engade unha descrición para o eixo X con un tamaño de fonte definido

# Etiqueta para o eixo vertical (volume en exabytes)
plt.ylabel("Volumen (en exabytes)", fontsize=12)  # Engade unha descrición para o eixo Y con un tamaño de fonte definido

# Engadir unha cuadrícula para facilitar a lectura dos datos
plt.grid(True)  # Activa a cuadrícula na gráfica

# Mostrar a gráfica creada
plt.show()  # Visualiza a gráfica no dispositivo de saída
    

Reflexión

Lista de Cotexo

O Big Data

Esta lista axúdache a organizar e verificar o progreso no teu portafolio.