Spark SQL Kudu Example

Template to run SQL on Kudu tables and save to Hive

This example provides a YAML template & code base to run SQL on Kudu tables with Spark. The YAML file is read from HDFS but can be configured to be read from the edge node.

How to use

Edit the queries.yml to include any queries you want to run. List the Kudu tables. Hive tables can be included in the query as well.
Edit database location and Run the job with run-spark-sql-kudu.sh.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
config		config
scripts		scripts
src/main/scala/example		src/main/scala/example
.gitignore		.gitignore
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Spark SQL Kudu Example

How to use

About

Releases

Packages

Languages

CattMarlin/spark-sql-kudu

Folders and files

Latest commit

History

Repository files navigation

Spark SQL Kudu Example

How to use

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages