SlideShare une entreprise Scribd logo
#JSS2015
Les journées
SQL Server 2015
Un événement organisé par GUSS
Azure SQL Data Warehouse & Data Lake
@GUSS_FRANCE
Franck Mercier
Microsoft DX
Data Platform
Romain Casteres
Microsoft PFE
SQL Server, BI, Big Data
#JSS2015
Merci à nos sponsors
#JSS2015
• Introduction
• SQL Data Warehouse
– Introduction
– Performance DWU
– Polybase
• Azure Data Lake
– Le Store
– Analytics
– U-SQL
• Comparaison
Agenda
SQL
#JSS2015
Data Warehouse traditionnel
#JSS2015
Data Warehouse moderne
#JSS2015
Les 3 challenges du Big data
#JSS2015
La vision de Microsoft
On-Premises
Data Warehouse Big Data
Cloud
#JSS2015
SQL Data Warehouse Service
Un service de base de données, géré par Microsoft
Data Warehouse s’appuyant sur les fonctionnalités de SQL Server
Supporte tous les besoins en terme de taille se stockage
Saas
Azure
Public
Cloud
Office 365Office 365
AzureAzure
#JSS2015
Mise à l’échelle
Mise à l’echelle en quelques secondes
Facturation à l’usage
Séparation entre le moteur de calcul et le stockage
Office 365
#JSS2015
Pause
Les données restent en place. Pas de rechargement ni de restauration
En pause, le coût de stockage est réduit au minimum
Pilotable via PowerShell/REST API
$$$$
#JSS2015
Data Warehouse Unit (DWU)
Scan 1 B rows
100 DWU = 297 sec
400 DWU = 74 sec
800 DWU = 37 sec
1600 DWU = 19 sec
Azure SQL Data Warehouse
Control
Compute
Azure Storage Blob(s)
Compute
Compute
Compute
Compute
Compute D52D51 D53 D54 D55 D56 D58D57 D59 D60
D12D11 D13 D14 D15 D16 D18D17 D19 D20
D22D21 D23 D24 D25 D26 D28D27 D29 D30
D32D31 D33 D34 D35 D36 D38D37 D39 D40
D42D41 D43 D44 D45 D46 D48D47 D49 D50
D2D1 D3 D4 D5 D6 D8D7 D9 D10
Azure SQL Data Warehouse
Control Compute
Azure Storage Blob(s)
D12D11 D13 D14 D15 D16 D18D17 D19 D20
D22D21 D23 D24 D25 D26 D28D27 D29 D30
D32D31 D33 D34 D35 D36 D38D37 D39 D40
D42D41 D43 D44 D45 D46 D48D47 D49 D50
D52D51 D53 D54 D55 D56 D58D57 D59 D60
D2D1 D3 D4 D5 D6 D8D7 D9 D10
#JSS2015
• Requêtes sur des distributions Hadoop (HDP &
Cloudera) ou des fichiers Hadoop dans un stockage
Azure
• Permet de conserver les compétences SQL et BI
• Supporte de nombreux formats de fichiers
• Réduit le « Time to Insights »
• ETL simplifié
Polybase permet l’exécution de requêtes aussi bien sur
des données structurées que sur des données non
structurées (Hadoop)
SQL DW Instance
Scale out compute
Hadoop VMs /
Azure StoragePolyBase
Traitement de données non structurées avec
Polybase/T-SQL
#JSS2015
Polybase
Adresser des données relationnelle et non relationnelle dans la même requete T-SQL
T-SQL query
SQL Server Hadoop
Quote:
************************
**********************
*********************
**********************
***********************
$658.39
Jim Gray
Name
11/13/58
DOB
WA
State
Ann Smith 04/29/76 ME
#JSS2015
SQL Data Warehouse
Event Hub Stream Analytics
Data Factory
HDInsight Storage
Power BI
Machine Learning
SQL DW dans l’écosystem Azure
#JSS2015
Azure Data Warehouse 1. Creation
2. Resizing
3. Pause
4. Polybase
5. Power BI
Demo
#JSS2015
Azure Data Lake
YARN
HDFS
Clickstream
Sensors
Video
Social
Web
Devices
Relational
Applications
HDInsightAnalytics
Service
Partners
U-SQL
AnalyticsStore
#JSS2015
Les briques de Cortana Analytics Suite
Business
apps
Custom
apps
Sensors
and devices
INTELLIGENCE
People
Automated
Systems
ACTION
#JSS2015
Azure Data Lake Store
LOB Applications
SocialDevices
Clickstream
Sensors
Video
Web
Relational
HDInsight
ADL Analytics
Machine Learning
Spark
R
ADL Store
#JSS2015
Azure Data Lake Store
Securisé (AAD) Native format
Faible latence
Multiple analytic
frameworks
Details
Haut débit
Fiable
Scalable All sources
Type de Jobs : Batch, Streaming, Machine Learning, Real Time
#JSS2015
ADLS : Alimentation
Server logs
Azure Event Hub
Apache
Flume
Azure Storage Blobs
Custom programs
.NET SDK
JavaScript CLI
Azure Portal
Azure PowerShell
Azure Data Factory
Apache Sqoop
Azure SQL DB
Azure SQL DW
Azure tables
Table Storage
On-premises databases
SQL
ADL Store
Built-in
copy service
#JSS2015
ADLS : Export
Azure SQL DB
SQL
Azure SQL DW
Azure Tables
Table Storage
On-premises databases
Azure Data Factory
Apache Sqoop
Azure Storage Blobs
Custom programs
.NET SDK
JavaScript CLI
Azure Portal
Azure PowerShell
Built-in
copy service
ADL Store
#JSS2015
Azure Data Lake Store 1. Creation
2. Azure File Preview
3. Azure Active Directory
4. HDInsight
Demo
#JSS2015
Azure Data Lake Analytics
Azure Data Lake
Analytics
Azure SQL DW Azure SQL DB
Azure
Storage Blobs
Azure
Data Lake Store
SQL DB in an
Azure VM
#JSS2015
• Déployer votre projet Big Data rapidement
(Minutes)
• Aucun matériel à installer, ajuster,
configurer ou déployer
• Aucune infrastructure ou un logiciel a
gérer
• Elasticité du nombre de machines
ADLA : Infrastructure
#JSS2015
• Intégration complète à Visual Studio
• Facile de prise en main
• Création de scripts U-SQL, Hive et
Storm
• Optimisation facilité par la visualisation
des performances
ADLA : Visual Studio
#JSS2015
ADLA : U-SQL language
• Unifie la nature déclarative de SQL avec la puissance
expressive de C#
• Facilement extensible
• Fonctionne sur des données structurées et non
structurées
– Schema on read over files
– Relational metadata objects (e.g. database,
table)
• Parallélisassions et élasticité pour les commande :
– EXTRACTOR
– OUTPUTTER
– PROCESSOR
– REDUCER
– COMBINERS
– APPLIER
REFERENCE MyDB.MyAssembly;
CREATE TABLE T( cid int, first_order DateTime
, last_order DateTime, order_count int
, order_amount float );
@o = EXTRACT oid int, cid int, odate DateTime, amount float
FROM "/input/orders.txt“
USING Extractors.Csv();
@c = EXTRACT cid int, name string, city string
FROM "/input/customers.txt“
USING Extractors.Csv();
@j = SELECT c.cid, MIN(o.odate) AS firstorder
, MAX(o.date) AS lastorder, COUNT(o.oid) AS ordercnt
, SUM(c.amount) AS totalamount
FROM @c AS c LEFT OUTER JOIN @o AS o ON c.cid == o.cid
WHERE c.city.StartsWith("New")
&& MyNamespace.MyFunction(o.odate) > 10
GROUP BY c.cid;
OUTPUT @j TO "/output/result.txt"
USING new MyData.Write();
INSERT INTO T SELECT * FROM @j;
#JSS2015
Azure Data Lake 1. Visual Studio
2. U-SQL
3. Power BI
Demo
Bonus *
Job Automatisation via
Azure Data Factor
Azure Data Lake Tools : https://aka.ms/ADLTools
#JSS2015
Comparaisons
HDInsight SQL DWH
Azure Data Lake
Analytic
Service Managed IaaS PaaS Job Service
Pour les
développeurs
Open Source : Java,
Eclipse, Hive, etc.
T-SQL, Polybase*
U-SQL, C#, SQL et
PowerShell
Management
Customisation et
flexibilité
Azure, Visual Studio
Job Service prêt à
l’emploi et Scalable,
Visual Studio, Azure
#JSS2015#JSS2015
Les évaluations des sessions,
c’est important !!
http://GUSS.Pro/jss
#JSS2015
Merci à nos volontaires…
#JSS2015
Azure Data Lake
Demo
Bonus *
Job Automatisation via
Azure Data Factor “La suite”
Azure Data Lake Tools : https://aka.ms/ADLTools
#JSS2015#JSS2015

Contenu connexe

PDF
SQL Saturday Paris 2015 - Polybase
Romain Casteres
 
PPTX
Jss 2015 - Microsoft Stream analytics
Georges Damien
 
PPTX
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)
Jean-Pierre Riehl
 
PPTX
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Jean-Pierre Riehl
 
PPTX
Cortana Analytics, de nouveaux patterns pour vos plateformes de données
Jean-Pierre Riehl
 
PPTX
DataStax Enterprise BBL
Victor Coustenoble
 
PPTX
Présentation JSS2015 - Le Query Store de SQL Server 2016
Guillaume Nocent
 
PPTX
GUSS - CRITEO Meetup Scale SQL for the Web
GUSS
 
SQL Saturday Paris 2015 - Polybase
Romain Casteres
 
Jss 2015 - Microsoft Stream analytics
Georges Damien
 
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)
Jean-Pierre Riehl
 
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Jean-Pierre Riehl
 
Cortana Analytics, de nouveaux patterns pour vos plateformes de données
Jean-Pierre Riehl
 
DataStax Enterprise BBL
Victor Coustenoble
 
Présentation JSS2015 - Le Query Store de SQL Server 2016
Guillaume Nocent
 
GUSS - CRITEO Meetup Scale SQL for the Web
GUSS
 

Tendances (19)

PPTX
[JSS2015] Power BI Dev
GUSS
 
PPTX
DataStax et Apache Cassandra pour la gestion des flux IoT
Victor Coustenoble
 
PDF
GAB 2017 PARIS - Azure Data Lake La Big Data 2.0 par Jean-Pierre Riehl et Fab...
AZUG FR
 
PDF
Datalake de l'idée à la plateforme
Novencia Groupe
 
PPTX
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
Jean-Pierre Riehl
 
PPTX
Premiers pas avec Microsoft Azure Search
MCKLMT
 
PDF
Comment M6 personnalise l’expérience utilisateur du service 6Play avec DataSt...
DataStax
 
PPTX
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
Isabelle Van Campenhoudt
 
PPTX
Cloud et BI, quelle architecture pour 2014 ?
Jean-Pierre Riehl
 
PPTX
Azure Camp 9 Décembre 2014 - slides Keynote
Microsoft
 
PPTX
DataStax Enterprise - La plateforme de base de données pour le Cloud
Victor Coustenoble
 
PDF
Aws vs azure
Manfred Dardenne
 
PPTX
[JSS2015] Power BI: Nouveautés archi et hybrides
GUSS
 
PPTX
J1 T1 1 - Azure Data Platform, quelle solution pour quel usage - Charles-Hen...
MS Cloud Summit
 
PPTX
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
Jean-Pierre Riehl
 
PPTX
Azure Camp 9 Décembre - slides session développeurs webmedia
Microsoft
 
PDF
Paris Tug - Session d'octobre
Geoffrey Felix
 
PDF
Delta lake - des data lake fiables a grande échelle
françois de Buttet
 
PPTX
[JSS2015] Nouveautés SSIS SSRS 2016
GUSS
 
[JSS2015] Power BI Dev
GUSS
 
DataStax et Apache Cassandra pour la gestion des flux IoT
Victor Coustenoble
 
GAB 2017 PARIS - Azure Data Lake La Big Data 2.0 par Jean-Pierre Riehl et Fab...
AZUG FR
 
Datalake de l'idée à la plateforme
Novencia Groupe
 
24HOP French 2017 - Azure Data Lake, le Big Data 2.0
Jean-Pierre Riehl
 
Premiers pas avec Microsoft Azure Search
MCKLMT
 
Comment M6 personnalise l’expérience utilisateur du service 6Play avec DataSt...
DataStax
 
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
Isabelle Van Campenhoudt
 
Cloud et BI, quelle architecture pour 2014 ?
Jean-Pierre Riehl
 
Azure Camp 9 Décembre 2014 - slides Keynote
Microsoft
 
DataStax Enterprise - La plateforme de base de données pour le Cloud
Victor Coustenoble
 
Aws vs azure
Manfred Dardenne
 
[JSS2015] Power BI: Nouveautés archi et hybrides
GUSS
 
J1 T1 1 - Azure Data Platform, quelle solution pour quel usage - Charles-Hen...
MS Cloud Summit
 
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
Jean-Pierre Riehl
 
Azure Camp 9 Décembre - slides session développeurs webmedia
Microsoft
 
Paris Tug - Session d'octobre
Geoffrey Felix
 
Delta lake - des data lake fiables a grande échelle
françois de Buttet
 
[JSS2015] Nouveautés SSIS SSRS 2016
GUSS
 
Publicité

En vedette (20)

PPTX
Microsoft Azure Data Warehouse Overview
Justin Munsters
 
PPTX
Introducing Azure SQL Data Warehouse
James Serra
 
PPTX
Microsoft Azure Batch
Khalid Salama
 
PPTX
20060416 Azure Boot Camp 2016- Azure Data Lake Storage and Analytics
Łukasz Grala
 
PPTX
Azure SQL DWH
Shy Engelberg
 
PPTX
SQL Saturday #313 Rheinland - MapReduce in der Praxis
Sascha Dittmann
 
PDF
AnalyticsConf : Azure SQL Data Warehouse
Wlodek Bielski
 
PDF
How to deploy SQL Server on an Microsoft Azure virtual machines
SolarWinds
 
PDF
Datawarehouse como servicio en azure (sqldw)
Enrique Catala Bañuls
 
PPTX
Enterprise Cloud Data Platforms - with Microsoft Azure
Khalid Salama
 
PDF
SQL Azure Data Warehouse - Silviu Niculita
ITCamp
 
PDF
Microsoft for BI and DW: Using the Right Tool for the Job
Senturus
 
PPTX
Machine learning with Spark
Khalid Salama
 
PPTX
Introduction to MSBI
Edureka!
 
PPTX
Introducing Azure SQL Database
James Serra
 
PPTX
Intorducing Big Data and Microsoft Azure
Khalid Salama
 
PDF
Microsoft Data Warehouse Business Intelligence Lifecycle - The Kimball Approach
Mark Ginnebaugh
 
PDF
Cortana Analytics Workshop: Azure Data Lake
MSAdvAnalytics
 
PPTX
Analyzing StackExchange data with Azure Data Lake
BizTalk360
 
PPTX
Building the Data Lake with Azure Data Factory and Data Lake Analytics
Khalid Salama
 
Microsoft Azure Data Warehouse Overview
Justin Munsters
 
Introducing Azure SQL Data Warehouse
James Serra
 
Microsoft Azure Batch
Khalid Salama
 
20060416 Azure Boot Camp 2016- Azure Data Lake Storage and Analytics
Łukasz Grala
 
Azure SQL DWH
Shy Engelberg
 
SQL Saturday #313 Rheinland - MapReduce in der Praxis
Sascha Dittmann
 
AnalyticsConf : Azure SQL Data Warehouse
Wlodek Bielski
 
How to deploy SQL Server on an Microsoft Azure virtual machines
SolarWinds
 
Datawarehouse como servicio en azure (sqldw)
Enrique Catala Bañuls
 
Enterprise Cloud Data Platforms - with Microsoft Azure
Khalid Salama
 
SQL Azure Data Warehouse - Silviu Niculita
ITCamp
 
Microsoft for BI and DW: Using the Right Tool for the Job
Senturus
 
Machine learning with Spark
Khalid Salama
 
Introduction to MSBI
Edureka!
 
Introducing Azure SQL Database
James Serra
 
Intorducing Big Data and Microsoft Azure
Khalid Salama
 
Microsoft Data Warehouse Business Intelligence Lifecycle - The Kimball Approach
Mark Ginnebaugh
 
Cortana Analytics Workshop: Azure Data Lake
MSAdvAnalytics
 
Analyzing StackExchange data with Azure Data Lake
BizTalk360
 
Building the Data Lake with Azure Data Factory and Data Lake Analytics
Khalid Salama
 
Publicité

Similaire à [JSS2015] Azure SQL Data Warehouse - Azure Data Lake (20)

PPTX
JSS2015 - Keynote jour 1
GUSS
 
PPTX
Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...
AZUG FR
 
PPTX
Développez des applications de base de données de façon plus efficace avec SQ...
Microsoft
 
PPTX
Cloud et BI, quelle architecture pour 2014 ?
Jean-Pierre Riehl
 
PPTX
JSS2014 – Cloud et BI, quelle architecture pour 2014 ?
GUSS
 
PPTX
[JSS2015] - Document db et nosql
GUSS
 
PDF
Big Data & BI : Retour d'expérience
Romain Casteres
 
PPTX
Journées SQL Server 2014 - Keynote Jour 1
GUSS
 
PPTX
SQL Server et les développeurs
Microsoft
 
PDF
Panorama des offres NoSQL disponibles dans Azure
Microsoft Technet France
 
PDF
Panorama des offres NoSQL disponibles dans Azure
Microsoft Décideurs IT
 
PPTX
Les données on-premise et dans le cloud. Quelles options ?
Microsoft
 
PPT
2009-03-13 SQL Server une plateforme crédible
Patrick Guimonet
 
PPTX
JSS2014 – Hive ou la convergence entre datawarehouse et Big Data
GUSS
 
PPTX
[JSS2015] Query Store
GUSS
 
PDF
Jss 2015 Stream Analytics
Michel HUBERT
 
PPTX
[JSS2015] Architectures Lambda avec Azure Stream Analytics
GUSS
 
PPTX
SQL Saturday 510 Paris 2016 - Query Store session - final
Philippe Geiger
 
PPT
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
Patrick Guimonet
 
PPTX
JSS2014 - StreamInsight
GUSS
 
JSS2015 - Keynote jour 1
GUSS
 
Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...
AZUG FR
 
Développez des applications de base de données de façon plus efficace avec SQ...
Microsoft
 
Cloud et BI, quelle architecture pour 2014 ?
Jean-Pierre Riehl
 
JSS2014 – Cloud et BI, quelle architecture pour 2014 ?
GUSS
 
[JSS2015] - Document db et nosql
GUSS
 
Big Data & BI : Retour d'expérience
Romain Casteres
 
Journées SQL Server 2014 - Keynote Jour 1
GUSS
 
SQL Server et les développeurs
Microsoft
 
Panorama des offres NoSQL disponibles dans Azure
Microsoft Technet France
 
Panorama des offres NoSQL disponibles dans Azure
Microsoft Décideurs IT
 
Les données on-premise et dans le cloud. Quelles options ?
Microsoft
 
2009-03-13 SQL Server une plateforme crédible
Patrick Guimonet
 
JSS2014 – Hive ou la convergence entre datawarehouse et Big Data
GUSS
 
[JSS2015] Query Store
GUSS
 
Jss 2015 Stream Analytics
Michel HUBERT
 
[JSS2015] Architectures Lambda avec Azure Stream Analytics
GUSS
 
SQL Saturday 510 Paris 2016 - Query Store session - final
Philippe Geiger
 
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
Patrick Guimonet
 
JSS2014 - StreamInsight
GUSS
 

Plus de GUSS (19)

PPTX
GUSS - Les IO dans SQL Server (en partenariat avec DataCore)
GUSS
 
PPTX
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
GUSS
 
PPTX
JSS2015 - Machine Learning like a boss
GUSS
 
PPTX
JSS2015 - Keynote jour 2
GUSS
 
PPTX
[JSS2015] Nouveautés SQL Server 2016:Sécurité,Temporal & Stretch Tables
GUSS
 
PPTX
[JSS2015] 3 DMV's pour evaluer les indexs
GUSS
 
PPTX
[JSS2015] Infra bi#4 - le scale out
GUSS
 
PPTX
[JSS2015] In memory and operational analytics
GUSS
 
PPTX
[JSS2015] Eradiction des deadlocks
GUSS
 
PPTX
[JSS2015] - Azure automation
GUSS
 
PPTX
[JSS2015] AlwaysOn 2016
GUSS
 
PDF
[JSS2015] x events
GUSS
 
PPTX
JSS2014 – Infrastructure et Always-On
GUSS
 
PPTX
JSS2014 – Comment réaliser et administrer un portail BI avec SharePoint, SQL ...
GUSS
 
PPTX
JSS2014 – Le grand tour de Power BI
GUSS
 
PPTX
JSS2014 – Azure SQL Database : 1 an après
GUSS
 
PPTX
JSS2014 – Haute disponibilité dans Azure
GUSS
 
PPTX
JSS2014 – Point sur les options de stockage dans Azure
GUSS
 
PPTX
Journées SQL Server 2014 - Keynote Jour 2
GUSS
 
GUSS - Les IO dans SQL Server (en partenariat avec DataCore)
GUSS
 
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
GUSS
 
JSS2015 - Machine Learning like a boss
GUSS
 
JSS2015 - Keynote jour 2
GUSS
 
[JSS2015] Nouveautés SQL Server 2016:Sécurité,Temporal & Stretch Tables
GUSS
 
[JSS2015] 3 DMV's pour evaluer les indexs
GUSS
 
[JSS2015] Infra bi#4 - le scale out
GUSS
 
[JSS2015] In memory and operational analytics
GUSS
 
[JSS2015] Eradiction des deadlocks
GUSS
 
[JSS2015] - Azure automation
GUSS
 
[JSS2015] AlwaysOn 2016
GUSS
 
[JSS2015] x events
GUSS
 
JSS2014 – Infrastructure et Always-On
GUSS
 
JSS2014 – Comment réaliser et administrer un portail BI avec SharePoint, SQL ...
GUSS
 
JSS2014 – Le grand tour de Power BI
GUSS
 
JSS2014 – Azure SQL Database : 1 an après
GUSS
 
JSS2014 – Haute disponibilité dans Azure
GUSS
 
JSS2014 – Point sur les options de stockage dans Azure
GUSS
 
Journées SQL Server 2014 - Keynote Jour 2
GUSS
 

[JSS2015] Azure SQL Data Warehouse - Azure Data Lake

  • 1. #JSS2015 Les journées SQL Server 2015 Un événement organisé par GUSS Azure SQL Data Warehouse & Data Lake @GUSS_FRANCE Franck Mercier Microsoft DX Data Platform Romain Casteres Microsoft PFE SQL Server, BI, Big Data
  • 3. #JSS2015 • Introduction • SQL Data Warehouse – Introduction – Performance DWU – Polybase • Azure Data Lake – Le Store – Analytics – U-SQL • Comparaison Agenda SQL
  • 7. #JSS2015 La vision de Microsoft On-Premises Data Warehouse Big Data Cloud
  • 8. #JSS2015 SQL Data Warehouse Service Un service de base de données, géré par Microsoft Data Warehouse s’appuyant sur les fonctionnalités de SQL Server Supporte tous les besoins en terme de taille se stockage Saas Azure Public Cloud Office 365Office 365 AzureAzure
  • 9. #JSS2015 Mise à l’échelle Mise à l’echelle en quelques secondes Facturation à l’usage Séparation entre le moteur de calcul et le stockage Office 365
  • 10. #JSS2015 Pause Les données restent en place. Pas de rechargement ni de restauration En pause, le coût de stockage est réduit au minimum Pilotable via PowerShell/REST API $$$$
  • 11. #JSS2015 Data Warehouse Unit (DWU) Scan 1 B rows 100 DWU = 297 sec 400 DWU = 74 sec 800 DWU = 37 sec 1600 DWU = 19 sec Azure SQL Data Warehouse Control Compute Azure Storage Blob(s) Compute Compute Compute Compute Compute D52D51 D53 D54 D55 D56 D58D57 D59 D60 D12D11 D13 D14 D15 D16 D18D17 D19 D20 D22D21 D23 D24 D25 D26 D28D27 D29 D30 D32D31 D33 D34 D35 D36 D38D37 D39 D40 D42D41 D43 D44 D45 D46 D48D47 D49 D50 D2D1 D3 D4 D5 D6 D8D7 D9 D10 Azure SQL Data Warehouse Control Compute Azure Storage Blob(s) D12D11 D13 D14 D15 D16 D18D17 D19 D20 D22D21 D23 D24 D25 D26 D28D27 D29 D30 D32D31 D33 D34 D35 D36 D38D37 D39 D40 D42D41 D43 D44 D45 D46 D48D47 D49 D50 D52D51 D53 D54 D55 D56 D58D57 D59 D60 D2D1 D3 D4 D5 D6 D8D7 D9 D10
  • 12. #JSS2015 • Requêtes sur des distributions Hadoop (HDP & Cloudera) ou des fichiers Hadoop dans un stockage Azure • Permet de conserver les compétences SQL et BI • Supporte de nombreux formats de fichiers • Réduit le « Time to Insights » • ETL simplifié Polybase permet l’exécution de requêtes aussi bien sur des données structurées que sur des données non structurées (Hadoop) SQL DW Instance Scale out compute Hadoop VMs / Azure StoragePolyBase Traitement de données non structurées avec Polybase/T-SQL
  • 13. #JSS2015 Polybase Adresser des données relationnelle et non relationnelle dans la même requete T-SQL T-SQL query SQL Server Hadoop Quote: ************************ ********************** ********************* ********************** *********************** $658.39 Jim Gray Name 11/13/58 DOB WA State Ann Smith 04/29/76 ME
  • 14. #JSS2015 SQL Data Warehouse Event Hub Stream Analytics Data Factory HDInsight Storage Power BI Machine Learning SQL DW dans l’écosystem Azure
  • 15. #JSS2015 Azure Data Warehouse 1. Creation 2. Resizing 3. Pause 4. Polybase 5. Power BI Demo
  • 17. #JSS2015 Les briques de Cortana Analytics Suite Business apps Custom apps Sensors and devices INTELLIGENCE People Automated Systems ACTION
  • 18. #JSS2015 Azure Data Lake Store LOB Applications SocialDevices Clickstream Sensors Video Web Relational HDInsight ADL Analytics Machine Learning Spark R ADL Store
  • 19. #JSS2015 Azure Data Lake Store Securisé (AAD) Native format Faible latence Multiple analytic frameworks Details Haut débit Fiable Scalable All sources Type de Jobs : Batch, Streaming, Machine Learning, Real Time
  • 20. #JSS2015 ADLS : Alimentation Server logs Azure Event Hub Apache Flume Azure Storage Blobs Custom programs .NET SDK JavaScript CLI Azure Portal Azure PowerShell Azure Data Factory Apache Sqoop Azure SQL DB Azure SQL DW Azure tables Table Storage On-premises databases SQL ADL Store Built-in copy service
  • 21. #JSS2015 ADLS : Export Azure SQL DB SQL Azure SQL DW Azure Tables Table Storage On-premises databases Azure Data Factory Apache Sqoop Azure Storage Blobs Custom programs .NET SDK JavaScript CLI Azure Portal Azure PowerShell Built-in copy service ADL Store
  • 22. #JSS2015 Azure Data Lake Store 1. Creation 2. Azure File Preview 3. Azure Active Directory 4. HDInsight Demo
  • 23. #JSS2015 Azure Data Lake Analytics Azure Data Lake Analytics Azure SQL DW Azure SQL DB Azure Storage Blobs Azure Data Lake Store SQL DB in an Azure VM
  • 24. #JSS2015 • Déployer votre projet Big Data rapidement (Minutes) • Aucun matériel à installer, ajuster, configurer ou déployer • Aucune infrastructure ou un logiciel a gérer • Elasticité du nombre de machines ADLA : Infrastructure
  • 25. #JSS2015 • Intégration complète à Visual Studio • Facile de prise en main • Création de scripts U-SQL, Hive et Storm • Optimisation facilité par la visualisation des performances ADLA : Visual Studio
  • 26. #JSS2015 ADLA : U-SQL language • Unifie la nature déclarative de SQL avec la puissance expressive de C# • Facilement extensible • Fonctionne sur des données structurées et non structurées – Schema on read over files – Relational metadata objects (e.g. database, table) • Parallélisassions et élasticité pour les commande : – EXTRACTOR – OUTPUTTER – PROCESSOR – REDUCER – COMBINERS – APPLIER REFERENCE MyDB.MyAssembly; CREATE TABLE T( cid int, first_order DateTime , last_order DateTime, order_count int , order_amount float ); @o = EXTRACT oid int, cid int, odate DateTime, amount float FROM "/input/orders.txt“ USING Extractors.Csv(); @c = EXTRACT cid int, name string, city string FROM "/input/customers.txt“ USING Extractors.Csv(); @j = SELECT c.cid, MIN(o.odate) AS firstorder , MAX(o.date) AS lastorder, COUNT(o.oid) AS ordercnt , SUM(c.amount) AS totalamount FROM @c AS c LEFT OUTER JOIN @o AS o ON c.cid == o.cid WHERE c.city.StartsWith("New") && MyNamespace.MyFunction(o.odate) > 10 GROUP BY c.cid; OUTPUT @j TO "/output/result.txt" USING new MyData.Write(); INSERT INTO T SELECT * FROM @j;
  • 27. #JSS2015 Azure Data Lake 1. Visual Studio 2. U-SQL 3. Power BI Demo Bonus * Job Automatisation via Azure Data Factor Azure Data Lake Tools : https://aka.ms/ADLTools
  • 28. #JSS2015 Comparaisons HDInsight SQL DWH Azure Data Lake Analytic Service Managed IaaS PaaS Job Service Pour les développeurs Open Source : Java, Eclipse, Hive, etc. T-SQL, Polybase* U-SQL, C#, SQL et PowerShell Management Customisation et flexibilité Azure, Visual Studio Job Service prêt à l’emploi et Scalable, Visual Studio, Azure
  • 29. #JSS2015#JSS2015 Les évaluations des sessions, c’est important !! http://GUSS.Pro/jss
  • 30. #JSS2015 Merci à nos volontaires…
  • 31. #JSS2015 Azure Data Lake Demo Bonus * Job Automatisation via Azure Data Factor “La suite” Azure Data Lake Tools : https://aka.ms/ADLTools