Noticias Programación

Almacenamiento, transmisión y análisis por lotes de Azure

Autor: Richard Nuckolls
Editorial: Manning
Páginas: 448
ISBN: 978-1617296307
Imprimir: 1617296309
Kindle: B09781TWFJ
Audiencia: ingenieros de datos
Calificación: 4.5
Crítico: Kay Ewbank

Este libro está destinado a desarrolladores e ingenieros de sistemas que necesitan recopilar y procesar datos correctamente en Azure, especialmente mediante la arquitectura Azure Lambda.

El propósito del libro es mostrarle cómo combinar los servicios de Azure para crear un sistema que funcione. El autor comienza con una descripción general de lo que entiende por ingeniería de datos, luego pasa a analizar los conceptos básicos de Azure, qué servicios están disponibles y cómo se pueden combinar para crear un sistema de procesamiento de datos basado en Lambda. Este capítulo proporciona una buena descripción general de los servicios que necesitará, cómo interactúan y qué ofrece Lambda.

Bandera

Publicidad:

Los siguientes capítulos analizan cada uno de los servicios en orden, comenzando con las cuentas de almacenamiento de Azure. Comienza con la creación de una cuenta de almacenamiento, luego muestra los servicios de la cuenta de almacenamiento: almacenamiento de blobs, colas, etc. Azure Data Lake Storage es el siguiente servicio que se analizará en detalle y, al igual que los demás capítulos, comienza con la creación, en este caso, cómo crear un almacenamiento de Azure Data Lake. Luego, Nuckolls examina el acceso al archivo de Data Lake, la estructura de carpetas y la deriva de datos, y concluye con una mirada a las herramientas de copia para los archivos de Data Lake.

El Capítulo 5 es un capítulo sustancial sobre la administración de mensajes con Event Hubs. como sugiere el nombre, estos se utilizan para capturar y servir mensajes de eventos, conjuntos de datos de eventos basados ​​en el tiempo de las aplicaciones. Nuckolls detalla cómo funcionan los centros de eventos, como la creación de un espacio de nombres y un centro de eventos, la creación de particiones, la configuración de la captura y la protección del acceso a los centros de eventos.

El siguiente tema son las consultas en tiempo real con Azure Stream Analytics. El análisis de flujo se utiliza para leer fuentes de datos, realizar operaciones de datos y enviar resultados a la sincronización de datos. El capítulo le muestra cómo crear un servicio, luego crear y ejecutar procesos en el servicio mediante Azure Portal y con PowerShell. Las consultas se basan en SQL y Nuckolls examina la creación de una consulta de trabajo, la escritura de consultas de trabajo y la gestión de su rendimiento.

Las consultas por lotes con Azure Data Lake Analytics se tratan en capítulos posteriores. Esto comienza con una mirada a U-SQL y cómo es una combinación de SQL y C #. La función de los extractores para leer archivos y los generadores de salida para escribir conjuntos de filas en Data Lake Storage está bien explicada, al igual que las expresiones para transformar conjuntos de filas. El capítulo también cubre la extracción y agregación de esquemas antes de retroceder un nivel para describir cómo crear un servicio de Data Lake Analytics. Creo que necesitaría leer material más detallado si aún no está familiarizado con SQL y C #; las descripciones están bien como descripción general e introducción, pero esencialmente tiene dos idiomas y cómo se usan en combinación y ese es un gran tema.

El Capítulo 8 profundiza en U-SQL con más detalle sobre cómo usarlo para análisis complejos, con buenas secciones sobre funciones de Windows y funciones locales de C#. A continuación se muestra cómo integrarse con Data Lake Analytics, específicamente mediante el procesamiento de datos no estructurados, la conexión a fuentes remotas y el trabajo con diferentes tipos de archivos.

Azure Data Factory, que administra la ejecución de tareas, es el tema del próximo capítulo, que incluye cómo crear el servicio, autenticar de forma segura y copiar archivos con ADF.

Los últimos dos capítulos vuelven a SQL, comenzando con SQL administrado con Azure SQL Database. Este capítulo cubre la creación de una base de datos, su protección y la garantía de disponibilidad y recuperación, así como la optimización de costos. El siguiente capítulo analiza la integración de Data Factory con Azure SQL Database, principalmente cómo importar datos en él.

El libro concluye con un capítulo sobre dónde ir a continuación, analizando el catálogo de datos, el control de versiones y las copias de seguridad.

Este es un libro útil, con descripciones claras sobre cómo configurar y usar los muchos servicios que ofrece Azure. Proporciona suficiente información para que pueda comenzar, de modo que sus servicios funcionen y se comuniquen entre sí. No será un experto en U-SQL o Azure Analytics una vez que lea el libro, pero tendrá un sistema en funcionamiento que luego podrá ajustar.

Para obtener recomendaciones sobre otros libros de Azure, consulte Libros de computación en la nube – Elección de cubierta en nuestra sección Biblioteca del programador.

Para estar informado sobre nuevos artículos sobre TecnoPasion, suscríbase a nuestro boletín semanal, suscríbase a la fuente RSS y síganos Gorjeo, Facebook o Linkedin.

Bandera


Publicidad:

También puede gustarte...