擅长:python、mysql、java
<p>在您的案例中,使用<code>collect_list</code>函数的<code>Groupby</code>顺序和带有{<cd3>}的唯一id应该可以工作</p>
<pre><code>from pyspark.sql import functions as F
df.groupBy("order").agg(F.collect_list("items"))
.withColumn("id", F.row_number().over(Window.orderBy("order")))
</code></pre>
<p>希望这有帮助!在</p>