DanielSnipes · March 13, 2018 13:22 · Aug 11, 2016 · Aug 10, 2016 · Aug 10, 2016 · Aug 9, 2016
diff --git a/spark_pandas_dataframes.py b/spark_pandas_dataframes.py
@@ -1,4 +1,6 @@
 import pandas as pd
+from pyspark.sql.types import *
+
 #Create Pandas DataFrame
 pd_person = pd.DataFrame({'PERSONID':'0','LASTNAME':'Doe','FIRSTNAME':'John','ADDRESS':'Museumplein','CITY':'Amsterdam'}, index=[0])
 

diff --git a/spark_pandas_dataframes.py b/spark_pandas_dataframes.py
@@ -7,6 +7,8 @@
 
 #Create Spark DataFrame from Pandas
 df_person = sqlContext.createDataFrame(pd_person, p_schema)
+#Important to order columns in the same order as the target database
+df_person  = df_person.select("PERSONID", "LASTNAME", "FIRSTNAME", "CITY", "ADDRESS")
 
 #Writing Spark DataFrame to local Oracle Expression Edition 11.2.0.2
 #This uses the relatively older Spark jdbc DataFrameWriter api

diff --git a/spark_pandas_dataframes.py b/spark_pandas_dataframes.py
@@ -2,8 +2,11 @@
 #Create Pandas DataFrame
 pd_person = pd.DataFrame({'PERSONID':'0','LASTNAME':'Doe','FIRSTNAME':'John','ADDRESS':'Museumplein','CITY':'Amsterdam'}, index=[0])
 
+#Create PySpark DataFrame Schema
+p_schema = StructType([StructField('ADDRESS',StringType(),True),StructField('CITY',StringType(),True),StructField('FIRSTNAME',StringType(),True),StructField('LASTNAME',StringType(),True),StructField('PERSONID',DecimalType(),True)])
+
 #Create Spark DataFrame from Pandas
-df_person = sqlContext.createDataFrame(pd_person)
+df_person = sqlContext.createDataFrame(pd_person, p_schema)
 
 #Writing Spark DataFrame to local Oracle Expression Edition 11.2.0.2
 #This uses the relatively older Spark jdbc DataFrameWriter api

diff --git a/spark_pandas_dataframes.py b/spark_pandas_dataframes.py
@@ -0,0 +1,10 @@
+import pandas as pd
+#Create Pandas DataFrame
+pd_person = pd.DataFrame({'PERSONID':'0','LASTNAME':'Doe','FIRSTNAME':'John','ADDRESS':'Museumplein','CITY':'Amsterdam'}, index=[0])
+
+#Create Spark DataFrame from Pandas
+df_person = sqlContext.createDataFrame(pd_person)
+
+#Writing Spark DataFrame to local Oracle Expression Edition 11.2.0.2
+#This uses the relatively older Spark jdbc DataFrameWriter api
+df_person.write.jdbc(url='jdbc:oracle:thin:@127.0.0.1:1521:XE', table='HR.PERSONS', mode='append', properties={'driver':'oracle.jdbc.driver.OracleDriver', 'user' : 'SYSTEM', 'password' : 'password'})
No results found