Kafka
Apache Kafka 是一个开源的分布式事件流平台,允许您发布和订阅记录流。它旨在处理高吞吐量、容错和实时数据流。Kafka 实现了各种应用程序之间的无缝通信,是构建数据管道和流数据处理应用程序的理想选择。
Databend 提供了以下插件和工具,用于从 Kafka 主题中摄取数据:
databend-kafka-connect
databend-kafka-connect 是一个专为 Databend 设计的 Kafka Connect 接收器连接器插件。该插件能够将 Kafka 主题中的数据无缝传输到 Databend 表中,实现实时数据摄取,配置简单。databend-kafka-connect 的主要特点包括:
- 根据数据模式自动在 Databend 中创建表。
- 支持 仅追加 和 更新插入 写入模式。
- 随着传入数据结构的变化,自动调整 Databend 表的模式。
要下载 databend-kafka-connect 并了解更多关于该插件的信息,请访问 GitHub 仓库,并参考 README 获取详细说明。
bend-ingest-kafka
bend-ingest-kafka 是一个高性能的数据摄取工具,专为高效地将数据从 Kafka 主题加载到 Databend 表中而设计。它支持两种主要操作模式:JSON 转换模式和原始模式,以满足不同的数据摄取需求。bend-ingest-kafka 的主要特点包括:
- 支持两种模式:JSON 转换模式,根据数据模式直接将 Kafka JSON 数据映射到 Databend 表中;原始模式,摄取原始 Kafka 数据并捕获完整的 Kafka 记录元数据。
- 提供可配置的批处理设置,包括大小和间隔,确保高效且可扩展的数据摄取。
要下载 bend-ingest-kafka 并了解更多关于该工具的信息,请访问 GitHub 仓库,并参考 README 获取详细说明。