Azure-DataLake-DataBricks

The idea is to connect to ADL storage (Azure Data Lake) from Databricks cluster and perform some Scala script on the ADL data. Let's imagine we have a Products.csv file in a ADL container. In this example, the Databricks connect to ADL storage using Azure AppId and mount ADL data (Products.csv). The mounted data should be saved in another file (Products-mount.csv) on the same ADL container. Make sure to register an App in Azure Active Directory (AD) and generate a password for the App (Certificates & Secrets). Also make sure to allow the App proper access to ADL storage using RBAC (use Storag-Blob-Data-Contributor Role).

Find the Scala script and fill in the necessary information.

val appID = ""
val password = ""
val tenantID = ""
val containerName = "";
var storageAccountName = "";

Conceptual model Azure Data Lake (ADL)

Conceptual model Data Bricks

Blob storage vs ADL Gen2 Storage

	Blob Storage	ADL Gen2 Storage
Access tiers	yes	yes
Top level	Container	Container
Lower level	Virtual directory	Directory
Container	Blob	File

	Blob Storage	ADL Gen2 Storage
Soft delete	Yes	No
Snapshots	Yes	No
Immutable storage	Yes	No
Blobfuse	Yes	No

	Blob Storage	ADL Gen2 Storage
Access keys	Yes	Yes
Shared Access Signature (SAS)	Yes	Yes
RBAC	Yes	Yes
Access Control Lists (ACL)	No	Yes

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
README.md		README.md
adl-databricks.scala		adl-databricks.scala
databricks.drawio		databricks.drawio
databricks.jpg		databricks.jpg
multi-protocol-access.drawio		multi-protocol-access.drawio
multi-protocol-access.jpg		multi-protocol-access.jpg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Azure-DataLake-DataBricks

Conceptual model Azure Data Lake (ADL)

Conceptual model Data Bricks

Blob storage vs ADL Gen2 Storage

About

Releases

Packages

Languages

mail4hafij/Azure-DataLake-DataBricks

Folders and files

Latest commit

History

Repository files navigation

Azure-DataLake-DataBricks

Conceptual model Azure Data Lake (ADL)

Conceptual model Data Bricks

Blob storage vs ADL Gen2 Storage

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages