airframe-sql/parquet: Scala 3 support (#2208)

xerial · web-flow · commit 90931d9ecffd · 2022-05-30T00:17:08.000-07:00
diff --git a/airframe-parquet/src/main/scala-2/wvlet/airframe/parquet/ParquetCompat.scala b/airframe-parquet/src/main/scala-2/wvlet/airframe/parquet/ParquetCompat.scala
@@ -0,0 +1,50 @@
+/*
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *    http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+package wvlet.airframe.parquet
+
+import org.apache.hadoop.conf.Configuration
+import org.apache.parquet.hadoop.{ParquetReader, ParquetWriter}
+import wvlet.airframe.surface.Surface
+
+import scala.reflect.runtime.{universe => ru}
+
+trait ParquetCompat {
+  def newWriter[A: ru.TypeTag](
+      path: String,
+      // Hadoop filesystem specific configuration, e.g., fs.s3a.access.key
+      hadoopConf: Configuration = new Configuration(),
+      config: ParquetWriterAdapter.Builder[A] => ParquetWriterAdapter.Builder[A] =
+        identity[ParquetWriterAdapter.Builder[A]](_)
+  ): ParquetWriter[A] = {
+    Parquet.newObjectWriter[A](Surface.of[A], path, hadoopConf, config)
+  }
+
+  def newReader[A: ru.TypeTag](
+      path: String,
+      // Hadoop filesystem specific configuration, e.g., fs.s3a.access.key
+      hadoopConf: Configuration = new Configuration(),
+      config: ParquetReader.Builder[A] => ParquetReader.Builder[A] = identity[ParquetReader.Builder[A]](_)
+  ): ParquetReader[A] = {
+    Parquet.newObjectReader[A](Surface.of[A], path, hadoopConf, config)
+  }
+
+  def query[A: ru.TypeTag](
+      path: String,
+      sql: String,
+      hadoopConf: Configuration = new Configuration(),
+      config: ParquetReader.Builder[A] => ParquetReader.Builder[A] = identity[ParquetReader.Builder[A]](_)
+  ): ParquetReader[A] = {
+    Parquet.queryObject[A](Surface.of[A], path, sql, hadoopConf, config)
+  }
+}
diff --git a/airframe-parquet/src/main/scala-3/wvlet/airframe/parquet/ParquetCompat.scala b/airframe-parquet/src/main/scala-3/wvlet/airframe/parquet/ParquetCompat.scala
@@ -0,0 +1,37 @@
+package wvlet.airframe.parquet
+
+import org.apache.hadoop.conf.Configuration
+import org.apache.parquet.hadoop.{ParquetReader, ParquetWriter}
+import wvlet.airframe.surface.Surface
+
+trait ParquetCompat {
+
+  inline def newWriter[A](
+      path: String,
+      // Hadoop filesystem specific configuration, e.g., fs.s3a.access.key
+      hadoopConf: Configuration = new Configuration(),
+      config: ParquetWriterAdapter.Builder[A] => ParquetWriterAdapter.Builder[A] =
+        identity[ParquetWriterAdapter.Builder[A]](_)
+  ): ParquetWriter[A] = {
+    Parquet.newObjectWriter[A](Surface.of[A], path, hadoopConf, config)
+  }
+
+  inline def newReader[A](
+      path: String,
+      // Hadoop filesystem specific configuration, e.g., fs.s3a.access.key
+      hadoopConf: Configuration = new Configuration(),
+      config: ParquetReader.Builder[A] => ParquetReader.Builder[A] = identity[ParquetReader.Builder[A]](_)
+  ): ParquetReader[A] = {
+    Parquet.newObjectReader[A](Surface.of[A], path, hadoopConf, config)
+  }
+
+  inline def query[A](
+      path: String,
+      sql: String,
+      hadoopConf: Configuration = new Configuration(),
+      config: ParquetReader.Builder[A] => ParquetReader.Builder[A] = identity[ParquetReader.Builder[A]](_)
+  ): ParquetReader[A] = {
+    Parquet.queryObject[A](Surface.of[A], path, sql, hadoopConf, config)
+  }
+
+}
diff --git a/airframe-parquet/src/main/scala/wvlet/airframe/parquet/Parquet.scala b/airframe-parquet/src/main/scala/wvlet/airframe/parquet/Parquet.scala
@@ -10,9 +10,7 @@ import wvlet.airframe.control.Control.withResource
 import wvlet.airframe.surface.Surface
 import wvlet.log.LogSupport
 
-import scala.reflect.runtime.{universe => ru}
-
-object Parquet extends LogSupport {
+object Parquet extends ParquetCompat with LogSupport {
 
   /**
     * Create a Parquet writer that accepts records represented in Map, Array, JSON, MsgPack, etc.
@@ -34,41 +32,42 @@ object Parquet extends LogSupport {
     builder.build()
   }
 
-  def newWriter[A: ru.TypeTag](
+  def newObjectWriter[A](
+      objectSurface: Surface,
       path: String,
       // Hadoop filesystem specific configuration, e.g., fs.s3a.access.key
       hadoopConf: Configuration = new Configuration(),
       config: ParquetWriterAdapter.Builder[A] => ParquetWriterAdapter.Builder[A] =
         identity[ParquetWriterAdapter.Builder[A]](_)
   ): ParquetWriter[A] = {
-    val s       = Surface.of[A]
-    val b       = ParquetWriterAdapter.builder[A](s, path, hadoopConf)
+    val b       = ParquetWriterAdapter.builder[A](objectSurface, path, hadoopConf)
     val builder = config(b)
     builder.build()
   }
 
-  def newReader[A: ru.TypeTag](
+  def newObjectReader[A](
+      objectSurface: Surface,
       path: String,
       // Hadoop filesystem specific configuration, e.g., fs.s3a.access.key
       hadoopConf: Configuration = new Configuration(),
       config: ParquetReader.Builder[A] => ParquetReader.Builder[A] = identity[ParquetReader.Builder[A]](_)
   ): ParquetReader[A] = {
-    val s                           = Surface.of[A]
-    val b: ParquetReader.Builder[A] = ParquetReaderAdapter.builder[A](s, path, hadoopConf)
+    val b: ParquetReader.Builder[A] = ParquetReaderAdapter.builder[A](objectSurface, path, hadoopConf)
     config(b).build()
   }
 
-  def query[A: ru.TypeTag](
+  def queryObject[A](
+      objectSurface: Surface,
       path: String,
       sql: String,
       hadoopConf: Configuration = new Configuration(),
       config: ParquetReader.Builder[A] => ParquetReader.Builder[A] = identity[ParquetReader.Builder[A]](_)
   ): ParquetReader[A] = {
-    val s = Surface.of[A]
     // Read Parquet schema for resolving column types
-    val schema                      = readSchema(path)
-    val plan                        = ParquetQueryPlanner.parse(sql, schema)
-    val b: ParquetReader.Builder[A] = ParquetReaderAdapter.builder[A](s, path, conf = hadoopConf, plan = Some(plan))
+    val schema = readSchema(path)
+    val plan   = ParquetQueryPlanner.parse(sql, schema)
+    val b: ParquetReader.Builder[A] =
+      ParquetReaderAdapter.builder[A](objectSurface, path, conf = hadoopConf, plan = Some(plan))
 
     val newConf = plan.predicate match {
       case Some(pred) =>
diff --git a/airframe-parquet/src/test/scala/wvlet/airframe/parquet/ParquetQueryTest.scala b/airframe-parquet/src/test/scala/wvlet/airframe/parquet/ParquetQueryTest.scala
@@ -52,7 +52,7 @@ object ParquetQueryTest extends AirSpec {
 
   case class RecordProjection(id: Int, b: Boolean)
 
-  test("SQL over Parquet") { file: Resource[File] =>
+  test("SQL over Parquet") { (file: Resource[File]) =>
     val path = file.get.getPath
     test("read all columns") {
       val reader = Parquet.query[Record](path, "select * from _")
diff --git a/airframe-parquet/src/test/scala/wvlet/airframe/parquet/ParquetTest.scala b/airframe-parquet/src/test/scala/wvlet/airframe/parquet/ParquetTest.scala
@@ -42,7 +42,7 @@ object ParquetTest extends AirSpec {
   test(
     "write Parquet",
     design = newDesign.bind[Resource[File]].toInstance(Resource.newTempFile("target/tmp", ".parquet"))
-  ) { parquetFile: Resource[File] =>
+  ) { (parquetFile: Resource[File]) =>
     val file = parquetFile.get
     debug(s"Writing to ${file}")
     withResource(
diff --git a/airframe-sql/src/main/scala/wvlet/airframe/sql/model/Expression.scala b/airframe-sql/src/main/scala/wvlet/airframe/sql/model/Expression.scala
@@ -44,7 +44,7 @@ sealed trait Expression extends TreeNode[Expression] with Product {
 
     // Apply the rule to itself
     rule
-      .applyOrElse(newExpr, { x: Expression => x }).asInstanceOf[this.type]
+      .applyOrElse(newExpr, { (x: Expression) => x }).asInstanceOf[this.type]
   }
 
   def collectSubExpressions: List[Expression] = {
diff --git a/airframe-sql/src/main/scala/wvlet/airframe/sql/parser/SQLInterpreter.scala b/airframe-sql/src/main/scala/wvlet/airframe/sql/parser/SQLInterpreter.scala
@@ -668,10 +668,10 @@ class SQLInterpreter extends SqlBaseBaseVisitor[Any] with LogSupport {
 
   override def visitFunctionCall(ctx: FunctionCallContext): FunctionCall = {
     val name = ctx.qualifiedName().getText
-    val filter: Option[Expression] = Option(ctx.filter()).map { f: FilterContext =>
+    val filter: Option[Expression] = Option(ctx.filter()).map { (f: FilterContext) =>
       expression(f.booleanExpression())
     }
-    val over: Option[Window] = Option(ctx.over()).map { o: OverContext =>
+    val over: Option[Window] = Option(ctx.over()).map { (o: OverContext) =>
       visitOver(o)
     }
 
diff --git a/build.sbt b/build.sbt
@@ -276,7 +276,7 @@ lazy val projectDotty =
       rxJVM,
       // rx-html uses Scala Macros
       rxHtmlJVM,
-      // sql,
+      sql,
       ulidJVM
     )
 

Original file line number	Diff line number	Diff line change
`@@ -44,7 +44,7 @@ sealed trait Expression extends TreeNode[Expression] with Product {`
`44`	`44`
`45`	`45`	`// Apply the rule to itself`
`46`	`46`	`rule`
`47`		`- .applyOrElse(newExpr, { x: Expression => x }).asInstanceOf[this.type]`
	`47`	`+ .applyOrElse(newExpr, { (x: Expression) => x }).asInstanceOf[this.type]`
`48`	`48`	`}`
`49`	`49`
`50`	`50`	`def collectSubExpressions: List[Expression] = {`
Original file line number	Diff line number	Diff line change
`@@ -668,10 +668,10 @@ class SQLInterpreter extends SqlBaseBaseVisitor[Any] with LogSupport {`
`668`	`668`
`669`	`669`	`override def visitFunctionCall(ctx: FunctionCallContext): FunctionCall = {`
`670`	`670`	`val name = ctx.qualifiedName().getText`
`671`		`- val filter: Option[Expression] = Option(ctx.filter()).map { f: FilterContext =>`
	`671`	`+ val filter: Option[Expression] = Option(ctx.filter()).map { (f: FilterContext) =>`
`672`	`672`	`expression(f.booleanExpression())`
`673`	`673`	`}`
`674`		`- val over: Option[Window] = Option(ctx.over()).map { o: OverContext =>`
	`674`	`+ val over: Option[Window] = Option(ctx.over()).map { (o: OverContext) =>`
`675`	`675`	`visitOver(o)`
`676`	`676`	`}`
`677`	`677`
Original file line number	Diff line number	Diff line change
`@@ -276,7 +276,7 @@ lazy val projectDotty =`
`276`	`276`	`rxJVM,`
`277`	`277`	`// rx-html uses Scala Macros`
`278`	`278`	`rxHtmlJVM,`
`279`		`- // sql,`
	`279`	`+ sql,`
`280`	`280`	`ulidJVM`
`281`	`281`	`)`
`282`	`282`