静态类型的元编程?
我一直在想,把一些Python代码移植到像F#或Scala这样的静态类型语言时,我会错过什么。虽然库可以替换,代码简洁性也差不多,但我有很多Python代码,像这样:
@specialclass
class Thing(object):
@specialFunc
def method1(arg1, arg2):
...
@specialFunc
def method2(arg3, arg4, arg5):
...
在这些代码中,装饰器做了很多事情:把方法替换成有状态的可调用对象,给类增加额外的数据和属性等等。虽然Python允许在任何地方、任何时间、任何人进行动态的“猴子补丁”元编程,但我发现我所有的元编程基本上都是在程序的一个“阶段”中完成的,也就是说:
load/compile .py files
transform using decorators
// maybe transform a few more times using decorators
execute code // no more transformations!
这些阶段基本上是完全独立的;我在装饰器中不运行任何应用层代码,也不在主应用代码中进行任何“忍者式”的类替换或函数替换。虽然语言的“动态性”让我可以在任何地方这样做,但我从来不在主应用代码中替换函数或重新定义类,因为这样会很快变得混乱。
实际上,我是在运行代码之前对代码进行了一次重新编译。
我知道在静态类型语言中唯一类似的元编程是反射:也就是从字符串中获取函数/类,使用参数数组调用方法等等。然而,这基本上把静态类型语言变成了动态类型语言,失去了所有的类型安全(如果我错了请纠正我)。理想情况下,我想要的东西像这样:
load/parse application files
load/compile transformer
transform application files using transformer
compile
execute code
基本上,你会在编译过程中添加任意代码,这些代码使用正常的编译器编译,并对主应用代码进行转换。关键是,它基本上模拟了“加载、转换、执行”的工作流程,同时严格保持类型安全。
如果应用代码有问题,编译器会报错;如果转换代码有问题,编译器也会报错;如果转换代码编译通过但没有正确执行,要么会崩溃,要么后面的编译步骤会报错,说明最终的类型不匹配。无论如何,你永远不会因为使用反射进行动态调度而遇到运行时类型错误:每一步都会进行静态检查。
所以我的问题是,这可能吗?有没有我不知道的语言或框架已经实现了这个?理论上不可能吗?我对编译器或形式语言理论不太熟悉,我知道这会让编译步骤变得图灵完备,并且没有终止的保证,但在我看来,这正是我需要的,以匹配动态语言中方便的代码转换,同时保持静态类型检查。
编辑:一个例子用例是一个完全通用的缓存装饰器。在Python中,它会是:
cacheDict = {}
def cache(func):
@functools.wraps(func)
def wrapped(*args, **kwargs):
cachekey = hash((args, kwargs))
if cachekey not in cacheDict.keys():
cacheDict[cachekey] = func(*args, **kwargs)
return cacheDict[cachekey]
return wrapped
@cache
def expensivepurefunction(arg1, arg2):
# do stuff
return result
虽然高阶函数可以做到一些这方面的事情,或者带有函数的对象也能做到一些,但据我所知,它们不能被泛化到适用于任何接受任意参数集并返回任意类型的函数,同时保持类型安全。我可以做一些事情,比如:
public Thingy wrap(Object O){ //this probably won't compile, but you get the idea
return (params Object[] args) => {
//check cache
return InvokeWithReflection(O, args)
}
}
但所有的类型转换完全破坏了类型安全。
编辑:这是一个简单的例子,函数签名没有变化。理想情况下,我想要的东西可以修改函数签名,改变输入参数或输出类型(类似于函数组合),同时仍然保持类型检查。
5 个回答
所以我的问题是,这可能吗?
在静态类型的编程语言中,有很多方法可以实现相同的效果。
你实际上描述的是在执行程序之前对程序进行一些术语重写的过程。这种功能在Lisp宏中最为人所知,但一些静态类型语言也有宏系统,最著名的就是OCaml的camlp4宏系统,它可以用来扩展语言。
更一般来说,你描述的是一种语言可扩展性。不同的语言提供了不同的技术和替代方案。想了解更多信息,可以看看我写的博客文章功能编程中的可扩展性。需要注意的是,很多这些语言都是研究项目,所以它们的目标是添加新颖的特性,而不一定是好的特性,因此它们很少会引入其他地方已经发明的好特性。
ML(元语言)家族的语言,包括标准ML、OCaml和F#,是专门为元编程设计的。因此,它们在词法分析、语法分析、重写、解释和编译方面通常有很好的支持。不过,F#是这个家族中最不相关的成员,缺乏像OCaml那样成熟的工具(例如camlp4、ocamllex、dypgen、menhir等)。F#确实有部分实现的fslex、fsyacc,以及一个受Haskell启发的解析组合库,叫做FParsec。
你可能会发现,你面临的问题(你还没有描述)用更传统的元编程形式来解决会更好,特别是使用DSL或EDSL。
这个问题很有意思。
关于Scala中的元编程,有几点可以分享:
在Scala 2.10版本中,会有一些关于Scala反射的进展。
有一些工作在进行源代码到源代码的转换(宏),这正是你所寻找的内容:scalamacros.org。
Java有一种叫做反射的功能(通过反射API),但不允许自我修改。不过,你可以使用一些工具来支持这个功能(比如javassist)。理论上,你可以在Scala中使用这些工具来实现比单纯的反射更多的功能。
根据我对你开发过程的理解,你把领域代码和装饰器(或者说是跨切关注点)分开,这样可以实现模块化和代码简单化。这是面向切面编程的一个好用法,它正是为了这个目的而设计的。对于Java,有一个库叫做aspectJ,不过我对它能否在Scala中运行持怀疑态度。