Big Data Analysis with Python

Practice and refine your big data analytical skills with Python to distill complicated data into digestible and meaningful insights.

(BIG-DATA-PYTHON.AJ1) / ISBN : 978-1-64459-315-8
Lessons
Lab
TestPrep
AI Tutor (Añadir)
237 Revisar
Obtenga una prueba gratuita

Acerca de este curso

This big data analysis with Python course online is your go-to training guide for mastering the art of handling and analyzing massive piles of data. You’ll experiment with Python libraries like Pandas, Seaborn, and Spark. Also, our course modules will help you visualize data, manage missing values, and perform in-depth statistical analysis, giving you hands-on experience. By the end, you’ll have the technical skills to tackle real-world challenges and make data-driven decisions.

Habilidades que obtendrás

  • Use Pandas and Spark for effective data handling 
  • Create insightful statistical visualizations using Seaborn and Matplotlib to communicate findings clearly 
  • Work with frameworks like Hadoop and Spark to manage large datasets 
  • Handle missing values and prepare data for analysis and accuracy 
  • Translate business problems into a measurable metric and actionable insight 
  • Maintain data analysis reproducibility with best practices using Jupyter Notebooks 
  • Dive deep into Spark DataFrames for advanced data manipulation and analysis 
  • Compile full analysis reports to present data findings professionally 
  • Execute SQL operations on Spark DataFrames for efficient data querying

1

Prefacio

  • Acerca de
2

La pila de ciencia de datos de Python

  • Introducción
  • Bibliotecas y paquetes de Python
  • usando pandas
  • Conversión de tipos de datos
  • Agregación y Agrupación
  • Exportación de datos de Pandas
  • Visualización con Pandas
  • Resumen
3

Visualizaciones estadísticas

  • Introducción
  • Tipos de gráficos y cuándo usarlos
  • Componentes de un gráfico
  • nacido en el mar
  • ¿Qué herramienta se debe utilizar?
  • Tipos de gráficos
  • Pandas DataFrames y datos agrupados
  • Cambiar el diseño del gráfico: modificar los componentes del gráfico
  • Exportación de gráficos
  • Resumen
4

Trabajar con marcos de Big Data

  • Introducción
  • Hadoop
  • Chispa - chispear
  • Escribir archivos de parquet
  • Manejo de datos no estructurados
  • Resumen
5

Buceando más profundo con Spark

  • Introducción
  • Introducción a los marcos de datos de Spark
  • Escritura de salida desde Spark DataFrames
  • Exploración de marcos de datos de Spark
  • Manipulación de datos con Spark DataFrames
  • Gráficos en Spark
  • Resumen
6

Manejo de valores faltantes y análisis de correlación

  • Introducción
  • Configuración del cuaderno Jupyter
  • Valores faltantes
  • Manejo de valores faltantes en Spark DataFrames
  • Correlación
  • Resumen
7

Análisis exploratorio de datos

  • Introducción
  • Definición de un problema empresarial
  • Traducir un problema comercial en métricas medibles y análisis de datos exploratorios (EDA)
  • Enfoque estructurado para el ciclo de vida del proyecto de ciencia de datos
  • Resumen
8

Reproducibilidad en análisis de Big Data

  • Introducción
  • Reproducibilidad con Jupyter Notebooks
  • Recopilación de datos de forma reproducible
  • Normas y prácticas de códigos
  • Evitando la repetición
  • Resumen
9

Creación de un informe de análisis completo

  • Introducción
  • Lectura de datos en Spark de diferentes fuentes de datos
  • Operaciones SQL en un Spark DataFrame
  • Generación de medidas estadísticas
  • Resumen

1

La pila de ciencia de datos de Python

  • Interactuando con Python Shell
  • Calculando el cuadrado
  • Agrupación de un marco de datos
  • Aplicar una función a una columna
  • Creación de subconjuntos de un marco de datos
  • Rebanar y subdividir
  • Lectura de datos de un archivo CSV
  • Visualización de la desviación estándar
  • Cálculo del valor de la mediana
  • Cálculo del valor medio
2

Visualizaciones estadísticas

  • Trazar un gráfico analítico
  • Crear un gráfico
  • Crear un gráfico para una función matemática
  • Crear un gráfico de líneas usando Seaborn
  • Crear un gráfico de líneas usando pandas
  • Crear un gráfico de líneas usando matplotlib
  • Detección de valores atípicos
  • Visualización de histogramas
  • Usar un diagrama de caja
  • Construcción de un diagrama de dispersión
  • Trazar un gráfico de líneas con estilos y colores
  • Configuración de un título y etiquetas para objetos Axis
  • Diseñar una parcela completa
  • Exportación de un gráfico a un archivo en un disco
3

Trabajar con marcos de Big Data

  • Realización de operaciones de marco de datos en Spark
  • Acceso a datos con Spark
  • Análisis de texto en Spark
4

Buceando más profundo con Spark

  • Creación de un marco de datos utilizando un archivo CSV
  • Creación de un DataFrame a partir de un RDD existente
  • Especificación del esquema de un marco de datos
  • Eliminación de una columna de un marco de datos
  • Cambiar el nombre de una columna en un marco de datos
  • Agregar una columna a un marco de datos
  • Creación de un gráfico de KDE
  • Creación de una gráfica de modelo lineal
  • Crear un gráfico de barras
5

Manejo de valores faltantes y análisis de correlación

  • Filtrado de datos
  • Contando valores faltantes
  • Manejo de valores NaN
  • Uso de los métodos de llenado hacia atrás y hacia adelante
  • Cálculo del coeficiente de correlación
6

Análisis exploratorio de datos

  • Generación de la importancia de la característica de la variable de destino
  • Identificación de la variable objetivo
  • Trazar un mapa de calor
  • Generación de un gráfico de distribución normal
7

Reproducibilidad en análisis de Big Data

  • Realización de reproducibilidad de datos
  • Preprocesamiento de valores perdidos con alta reproducibilidad
  • Normalización de los datos

¿Alguna pregunta? Consulta las preguntas frecuentes

Get quick answers to common questions about the Big Data Analytics in Python course.

Contáctanos ahora

Big data consists of massive amounts of datasets that are analyzed to identify and reveal patterns, trends, and relationships. Big data analysis helps organizations to make decisions, improve their operations, and discover new opportunities to penetrate the market.

Python programming language is famous in the data science field due to its simplicity, improved readability, user-friendly libraries, and strong developer community support.

Polish your data visualization skills to present raw data in graphical formats and identify patterns and trends to make data-driven decisions. Eventually, it provides you with a competitive advantage in the market.

Yes, having basic knowledge of Python programming is beneficial to take this data analysis with Python course.

This course is ideal for data scientists, analysts, and anyone interested in improving their analytical skills using Python.

Yes, a basic understanding of Python programming languages is recommended to get the most out of this course.

The course covers tools and libraries like Pandas, Seaborn, Matplotlib, and Spark for data manipulation and visualization. 

No, prior knowledge of machine learning is not required to enroll in this course. 

The average salary of a big data analyst varies, but typically ranges from $80,000 to $120,000 per year, depending on experience, location, and industry.

By learning Python big data analysis and visualization, you’ll be able to handle large datasets, perform advanced analysis, and make smart, profitable decisions. In addition, you’ll be in a position to pursue high-paying jobs, promotions, and other career opportunities.

Command Big Data Analysis Using Python

  Gain the skills to transform vast amounts of raw data into clear visuals for improved decision-making in your career.

$279.99

Comprar ahora

Cursos relacionados

Todo el curso
scroll to top