240 发简信
IP属地:山西
  • Resize,w 360,h 240
    Kafka权威指南第2版学习笔记--Kafka生产者:写消息到Kafka

    第2章 安装kafka 本章介绍Apache Kafka broker的入门知识,包括如何搭建Apache ZooKeeper集群, Kafka...

  • kubernetes--解耦Pod和底层存储技术

    理想情况下,在Kubernetes上部署应用程序的开发人员不需要知道集群提供了什么存储技术,就像他们不需要知道用于运行pod的物理服务器的特征一...

  • Resize,w 360,h 240
    《Designing Cloud Data Platforms》中文版--前言

    译者有话说 这是一本非常适合数据架构师或准数据架构师阅读的书!当前IT行业,越来越多的数据仓库基于云环境创建,越来越多的数据仓库要求实时性,越来...

  • Resize,w 360,h 240
    Streamsets官方文档--Pipeline的概念和设计

    管道概念与设计 什么是管道? 管道描述了从源头系统到目标系统的数据流,并定义了在此过程中如何转换数据。 可以使用单个origin(初始)阶段表示...

  • Resize,w 360,h 240
    Spark权威指南(中文版)----第15章 Spark如何在集群环境运行

    Spark The Definitive Guide(Spark权威指南) 中文版。本书详细介绍了Spark2.x版本的各个模块,目前市面上最好...

  • Spark权威指南(中文版)--第23章 生产环境中的结构化流

    Spark The Definitive Guide(Spark权威指南) 中文版。本书详细介绍了Spark2.x版本的各个模块,目前市面上最好...

  • Spark实战第二版(涵盖Spark3.0)-第15章. 聚合数据

    15.3 使用UDAFs构建自定义聚合 在前面的小节中,您快速回顾了聚合数据,在简单数据集上执行了聚合操作,并最终处理了真实的数据。在这些操作中...

  • Resize,w 360,h 240
    流批一体大数据实时同步工具--Streamsets

    Streamsets简介及概述 StreamSets Data Collector是一个功能强大的企业级流处理平台,可以使用该平台来接入数据,处...

  • Resize,w 360,h 240
    Spark实战第二版(涵盖Spark3.0)-第16章. 缓存和检查点:增强Spark的性能

    关注公众号:登峰大数据,阅读Spark实战第二版(完整中文版),系统学习Spark3.0大数据框架! 如果您觉得作者翻译的内容有帮助,请分享给更...