咖喱UDF Pysp

def matching(match_string_1): def matching_inner(match_string_2): return difflib.SequenceMatcher(None, match_string_1, match_string_2).ratio() return matching hc.udf.register("matching", matching) matching_udf = F.udf(matching, StringType()) df_matched = df.withColumn("matching_score", matching_udf(lit("match_string"))(df.column))

1条回答

网友

1楼 · 发布于 2024-05-16 09:40:35

应该是这样的：

def matching(match_string_1):
    def matching_inner(match_string_2):
        return difflib.SequenceMatcher(
            a=match_string_1, b=match_string_2).ratio()

    # Here create udf.
    return F.udf(matching_inner, StringType())

df.withColumn("matching_score", matching("match_string")(df.column))

如果要支持match_string_1的Column参数，则必须将其重写如下：

^{pr2}$

当前代码不工作，matching_udf是，UDF和matching_udf(lit("match_string"))创建一个Column表达式，而不是调用内部函数。在

编程相关推荐

java通过Spring MVC web应用程序向客户端发送文本文件
java是否可以在运行时动态实例化DAO类？
调用VB。来自Java的net函数
java在Android中通过单击打开特定文件夹
java如何使用maven pom。xml标识非标准项目结构中的testng测试用例？
java为什么FOP在大文件上崩溃？
Architecture python+flask和spring boot+java
java Kafka工具根本没有启动Ubuntu 19.10
如何使用Eclipse运行Java USB API for Windows
java如何在Eclipse中查看J2EE预览服务器/容器的日志/控制台？

相关问题更多 >

编程相关推荐

热门问题

热门文章

咖喱UDF Pysp

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >