Python生成不同的Kafka分区

class Producer(StreamListener): def __init__(self, producer): self.producer = producer def on_data(self, data): self.producer.send(topic_name, value=data) return True def on_error(self, error): print(error) twitter_stream = Stream(auth, Producer(producer)) twitter_stream.filter(track=["Google"])

consumer = KafkaConsumer( topic_name, bootstrap_servers=['localhost:9092'], auto_offset_reset='latest', enable_auto_commit=True, auto_commit_interval_ms = 5000, max_poll_records = 100, value_deserializer=lambda x: json.loads(x.decode('utf-8')))

2条回答

网友

1楼 · 编辑于 2024-05-15 08:03:27

经过一些研究，我能够解决这个问题：

在生产者端，指定分区：

self.producer.send(topic_name, value=data,partition=0)

在消费者方面,

consumer = KafkaConsumer(
       bootstrap_servers=['localhost:9092'],
     auto_offset_reset='latest',
     enable_auto_commit=True,
     auto_commit_interval_ms =  5000,
     max_poll_records = 100,
     value_deserializer=lambda x: json.loads(x.decode('utf-8')))
consumer.assign([TopicPartition('trial', 0)])

网友

2楼 · 编辑于 2024-05-15 08:03:27

Kafka在消息的键上对数据进行分区。在给定的代码中，您只将value传递给生产者消息，因此密钥将为null，因此将在所有分区之间进行循环

请参阅卡夫卡库的文档，了解如何为每条消息提供密钥

相关问题更多 >

编程相关推荐

热门问题

热门文章