跳到主要内容

Kafka

Apache Kafka 是一个开源的分布式事件流平台,允许您发布和订阅记录流。它旨在处理高吞吐量、容错和实时数据流。Kafka 实现了各种应用程序之间的无缝通信,是构建数据管道和流数据处理应用程序的理想选择。

Databend 提供了以下插件和工具,用于从 Kafka 主题中摄取数据:

databend-kafka-connect

databend-kafka-connect 是一个专为 Databend 设计的 Kafka Connect 接收器连接器插件。该插件能够将 Kafka 主题中的数据无缝传输到 Databend 表中,实现实时数据摄取,配置简单。databend-kafka-connect 的主要特点包括:

  • 根据数据模式自动在 Databend 中创建表。
  • 支持 仅追加更新插入 写入模式。
  • 随着传入数据结构的变化,自动调整 Databend 表的模式。

要下载 databend-kafka-connect 并了解更多关于该插件的信息,请访问 GitHub 仓库,并参考 README 获取详细说明。

bend-ingest-kafka

bend-ingest-kafka 是一个高性能的数据摄取工具,专为高效地将数据从 Kafka 主题加载到 Databend 表中而设计。它支持两种主要操作模式:JSON 转换模式和原始模式,以满足不同的数据摄取需求。bend-ingest-kafka 的主要特点包括:

  • 支持两种模式:JSON 转换模式,根据数据模式直接将 Kafka JSON 数据映射到 Databend 表中;原始模式,摄取原始 Kafka 数据并捕获完整的 Kafka 记录元数据。
  • 提供可配置的批处理设置,包括大小和间隔,确保高效且可扩展的数据摄取。

要下载 bend-ingest-kafka 并了解更多关于该工具的信息,请访问 GitHub 仓库,并参考 README 获取详细说明。

教程

开始使用 Databend Cloud
低成本
快速分析
多种数据源
弹性扩展
注册