火花火花

2024-03-29 08:00:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个简单的pyspark代码,但我不能运行它。我尝试在Ubuntu系统上运行它,并使用PyCharm IDE。我想连接到OracleXE数据库并打印我的测试表。在

下面是我的spark python代码:

from pyspark import SparkContext
from pyspark.sql import SQLContext

sc = SparkContext()

sqlContext = SQLContext(sc)

demoDf = sqlContext.read.format("jdbc").options(
    url="jdbc:oracle:thin:@10.10.10.10:1521:XE",
    driver="oracle.jdbc.driver.OracleDriver",
    table="tst_table",
    user="xxx",
    password="xxx").load()

demoDf.show()

这是我的线索:

^{pr2}$

有人能帮我吗?在


Tags: 代码fromimportubuntudrivertablepysparkxxx
2条回答

试试这样的方法:

def testQuery(query):
        df = sqlContext.read.format("jdbc").options(
             url="jdbc:oracle:thin:@10.10.10.10:1521:XE",
             driver="oracle.jdbc.driver.OracleDriver",
             dbtable="( " + query + " ) as temp",
             user="xxx",
             password="xxx").load()
        return df

table改为dbtable,如下所示

demoDf = sqlContext.read.format("jdbc").options(
    url="jdbc:oracle:thin:@10.10.10.10:1521:XE",
    driver="oracle.jdbc.driver.OracleDriver",
    dbtable="tst_table",
    user="xxx",
    password="xxx").load()

相关问题 更多 >