登峰大数据 - 简书

IP属地：山西

Kafka权威指南第2版学习笔记--Kafka生产者:写消息到Kafka
第2章安装kafka 本章介绍Apache Kafka broker的入门知识，包括如何搭建Apache ZooKeeper集群, Kafka...

1721 0 1
kubernetes--解耦Pod和底层存储技术
理想情况下，在Kubernetes上部署应用程序的开发人员不需要知道集群提供了什么存储技术，就像他们不需要知道用于运行pod的物理服务器的特征一...

388 0 0

《Designing Cloud Data Platforms》中文版--前言
译者有话说这是一本非常适合数据架构师或准数据架构师阅读的书！当前IT行业，越来越多的数据仓库基于云环境创建，越来越多的数据仓库要求实时性，越来...

351 0 0
Streamsets官方文档--Pipeline的概念和设计
管道概念与设计什么是管道? 管道描述了从源头系统到目标系统的数据流，并定义了在此过程中如何转换数据。可以使用单个origin(初始)阶段表示...

1639 0 0
Spark权威指南(中文版)----第15章 Spark如何在集群环境运行
Spark The Definitive Guide(Spark权威指南) 中文版。本书详细介绍了Spark2.x版本的各个模块，目前市面上最好...

754 0 0
Spark权威指南(中文版)--第23章生产环境中的结构化流
Spark The Definitive Guide(Spark权威指南) 中文版。本书详细介绍了Spark2.x版本的各个模块，目前市面上最好...

408 0 0
Spark实战第二版(涵盖Spark3.0)-第15章. 聚合数据
15.3 使用UDAFs构建自定义聚合在前面的小节中，您快速回顾了聚合数据，在简单数据集上执行了聚合操作，并最终处理了真实的数据。在这些操作中...

552 0 0

流批一体大数据实时同步工具--Streamsets
Streamsets简介及概述 StreamSets Data Collector是一个功能强大的企业级流处理平台，可以使用该平台来接入数据，处...

3254 0 0
Spark实战第二版(涵盖Spark3.0)-第16章. 缓存和检查点:增强Spark的性能
关注公众号:登峰大数据，阅读Spark实战第二版(完整中文版)，系统学习Spark3.0大数据框架！如果您觉得作者翻译的内容有帮助，请分享给更...

639 0 0