Teradata中的R用户如何在Teradata Vantage上执行R代码?

2024-05-08 20:06:51 发布

您现在位置:Python中文网/ 问答频道 /正文

Teradata为在Vantage平台上执行R代码提供了什么? 有教程吗?你知道吗


Tags: 代码教程平台teradatavantage
1条回答
网友
1楼 · 发布于 2024-05-08 20:06:51

结合Vantage使用R和Python |第1部分:概述:https://www.youtube.com/watch?v=VjgFWBc2kTM

A:客户端选项

“tdplyr”R附加程序库(可在下载.teradata.com建立在“DPLYR”基础上,专门用于与VANTAGE服务器的交互。除了“dplyr”提供的功能外,它还为Vantage systems新引入的机器学习引擎(MLE)组件中的大约100多个分析功能和Vantage systems的高级SQL引擎(ASQLE;以前的Teradata数据库)组件中的9个分析功能提供R包装。Teradata R客户机软件包“tdplyr”因此支持数据争用和直接从数据库中获取数据的无缝数据库分析,从而使客户无需将任何数据从数据库移动到客户机并来回移动。你知道吗

“tdplyr”文件可在以下网址找到: https://docs.teradata.com/reader/EZAbQ2BX~vKBrWDQ3v7fPQ/qPSuQaTN2CYD~KUvLxY7mg。你知道吗

“tdplyr”的分析在“R和Python with Vantage”TechBytes系列的第2部分演示,网址为: https://www.youtube.com/watch?v=_DCbTpWSLJI

B:在节点选项中

Teradata还通过SCRIPT Table操作符(STO;since Teradata Database v.15.00)和exec Table操作符(exec;since Teradata Database v.15.10)为R用户提供节点内解决方案。这两种方法都使用户能够在每个ASQLE节点上运行的R解释器实例的数据库中自带R脚本并执行它们。由于数据库体系结构的性质,这种方法最适合于:

a)模型评分任务,其中R脚本只需要一行数据作为输入,就可以使用给定的模型对其进行评分;因此,评分任务在所有节点上进行得非常有效,这就是所谓的“令人尴尬的并行”任务。你知道吗

b)通过将一个数据表按某个特征分区来拟合多个模型;在这种情况下,每个AMP(ASQLE数据库处理单元)处理单个分区的所有数据,从而以并行方式同时拟合所有模型。你知道吗

更复杂的情况是,当用户希望用整个数据库中的数据来拟合模型时;通常,这些任务包含两个步骤的操作,第一步是执行从每个AMP(“映射”阶段)接收部分结果的脚本,第二步是第二个脚本需要使用这些部分结果答案产生最终结果(“减少”阶段)。这种方法将编程的责任放在用户身上(不像MLE分析函数在从客户机拟合模型时无缝地执行这一系列步骤)。 exec的内存处理限制为每安培3.5 GB。你知道吗

B.1:执行者

用户可以将自己的R脚本直接带到exec中,但是脚本与数据库交互的数据输入和输出部分需要使用exec中所谓的FNC函数进行适当的修改。这些是Teradata构建的R函数,用于执行这些数据和元数据传输任务。有关详细的exec文档,请访问:

https://docs.teradata.com/reader/T5QsmcznbJo1bHmZT2KnFw/EabyaGA8DZhLIXy~uhzvsA

B.2:脚本

脚本表运算符(STO):在这种方法中,脚本通过脚本的标准输入从单个表接收数据,需要正确解释R的输入数据类型,并通过脚本的标准输出将结果发送到数据库(或SQL接口)。因此,在这种方法中,在将脚本上传到数据库并通过STO执行之前,需要相应地组合R脚本数据输入和输出段。除此之外,脚本的一个实例在每个数据库的R解释器上运行,就像它在客户机上运行一样。你知道吗

相关问题 更多 >