yashwanth2804 · March 21, 2019 00:55 · Mar 21, 2019 · Mar 21, 2019
diff --git a/udf.java b/udf.java
@@ -1,3 +1,8 @@
+
+import static org.apache.spark.sql.functions.*;
+import org.apache.spark.sql.expressions.UserDefinedFunction;
+
+
 StructField [] sf1 = new StructField[] {
 				 DataTypes.createStructField("uid",DataTypes.IntegerType, true),
 				 DataTypes.createStructField("mid",DataTypes.IntegerType,true),

diff --git a/udf.java b/udf.java
@@ -0,0 +1,28 @@
+StructField [] sf1 = new StructField[] {
+				 DataTypes.createStructField("uid",DataTypes.IntegerType, true),
+				 DataTypes.createStructField("mid",DataTypes.IntegerType,true),
+				 DataTypes.createStructField("rating",DataTypes.IntegerType, true),
+				 DataTypes.createStructField("time",DataTypes.IntegerType, true),
+		 };
+
+		 StructType st1 = DataTypes.createStructType(sf1);
+
+
+		Dataset<Row> mv =  spark
+				.read()
+				 .schema(st1)
+				.format("com.databricks.spark.csv")
+				.option("delimiter", "\t")
+
+				.csv("/home/hasura/Desktop/SparkData/u.data");
+
+
+
+	UserDefinedFunction increaserating = udf(
+		 		(Integer s) -> s+1,DataTypes.IntegerType
+				);
+
+		mv.
+		 	withColumn("rating",increaserating.apply(mv.col("rating")))
+		.show();
+