SlideShare a Scribd company logo
vRealize Operations Manager 6
Considerazioni su Architettura e Design
VMUGIT Meeting, Roma, 26 Settembre 2016
Pietro PIUTTI – VMUG Italia Leader, Systems Engineer, VMware vEXPERT, PernixPro, Tech Field Day Delegate
@stingray92 – http://blog.vgeek.it
2
vROps: avevamo bisogno di un altro tool di monitoring?
 vCenter vs vROps: è tutta un’altra storia…
• vCenter: Performance Graphs e Alarms
• vROps: metriche, metriche, metriche!! Bagdes, Alerts, Widgets, Reports…
• Presentazione vs Analisi / Perdita di dettaglio vs Granularità e Persistenza
 vROps non è solo un tool di monitoring!
• Policy-based Health, Risk and Efficiency analysis
• Troubleshooting, Capacity Planning, Correlazione
vs
3
Ma vROps è solo un rebranding di vCOps?
 Stessi obiettivi, stessa filosofia, nuovo prodotto, focus sulla
semplificazione (deployment e operations semplificate):
• vCOps: UI VM + Analytics VM
• vROps: una sola VM può integrare tutti i ruoli
• vCOps: vSphere UI + Custom UI
• vROps: una sola UI
 Componente fondamentale della vRealize Suite
• Integrazione “Out of the Box” con Log Insight per troubleshooting avanzato
• NSX ready (con adapter aggiuntivo)
• Integra funzionalità di Hyperic (dalla 6.2) per il monitoring a livello OS e
Applicativo (EPOps)
4
Quale tipo di VM scegliere per il nostro Cluster?
 Windows
 Linux (RedHat)
 OVA Appliance
 Omogeneità: tutte le VM del Cluster vROps devono essere
identiche. Si, ma non è proprio vero…
 Pro/Contro
• OS Based: vanno gestite secondo gli standard aziendali (patching, backup,
antivirus, agents etc.)
• OVA: “black box” (nessuna modifica permessa, nessuna manutenzione,
aggiornamenti incrementali di OS e applicazione)
• Non esiste una risposta univoca: la scelta dipende dalle logiche
dell’organizzazione
5
Analytics Cluster vROps: ruoli e scalabilità (1/3)
 Un Cluster vROps è un Sistema Distribuito che “uses VMware
vFabric® GemFire® to connect nodes into a shared memory cluster and
map the work across the nodes”
 vROps è concepito per scalare: si parte sempre dal Master Node e
si espande con l’aggiunta di altri nodi:
• Data Node
• Master Replica (a partire da un Data Node)
• Collector
 Internals:
• UI
• Collector
• Controller
• Analytics
• Persistence
6
Analytics Cluster vROps: ruoli e scalabilità (2/3)
 La “Persistence” e i 4 DB:
• Global xDB: Contains user configuration data, such as
alert and symptom definitions, dashboard
configurations, and super metric formulas. The global
xDB is found on the master node and master replica
nodes only
• Alerts/symptoms vPostgres: Contains alerts and
symptoms information
• Historical inventory service xDB: Contains a
historical view of all object properties and relationships
• FSDB: Contains all the statistical, time series data.
This raw metric data is used to provide live status
displays in the user interface
7
Analytics Cluster vROps: ruoli e scalabilità (3/3)
 Espandere la capacità analitica del Cluster: Data Node
• Stesso OS, stessa taglia, stessa location (no across multiple DCs deployment!)
• DB Sharding
 Espandere il raggio d’azione del Cluster: Remote Collector Node
• Nessuna limitazione in termini di OS/taglia, nessuna capacità analitica, non
ospita DB
8
HA: vantaggi e svantaggi
 In un Cluster di N nodi analytics, quanti ne possono fallire senza
perdere il Cluster? Risposta: solo 1!
• Se crasha un Data Node? No problem: il carico viene distribuito sui nodi
superstiti finché il Data Node non viene sostituito. Ma facciamo presto!
• E se crasha il Master? Il Master Node è un Single Point of Failure
 Soluzione: convertire un Data Node in Master Replica
• Vantaggi:
• No Single Point of Failure
• Failover del Master role e Recovery automatico e veloce del Cluster
• Svantaggi:
• Downsize della capacità analitica del cluster (abbiamo rinunciato ad un Data Node)
• Allocazione di ulteriori risorse infrastrutturali
9
Proteggere un Cluster vROps
 Mantenere i nodi analytics su host diversi (DRS anti-affinity rule)
 Backup: attenti alla consistenza dei dati
• Il backup (a livello VM, con tool VADP) va fatto non per singolo nodo ma per
tutti i nodi analytics allo stesso tempo
• Il tool di backup va configurato disabilitando la quiescienza del file system
delle VM. Se il tool non lo permette, va disabilitata a livello di singola VM –
Vedi doc ufficiale di prodotto https://goo.gl/0xAFsK
• In caso di restore di un nodo crashato, va fatto il restore di tutti i nodi
(ricordate… consistenza!)
• Schedulare i backup quando non sta girando il task di calcolo dei Dynamic
Thresholds
 Abilitare l’HA (Master Replica Node)…. YMMV!
10
Sizing: le dimensioni contano (1/2)
 OK, ma quanti nodi? Quanto grandi? Dobbiamo fare due conti:
• Numero di oggetti e relative metriche da “misurare”
• Tempo di retention (default: 6 mesi)
• Numero e tipo di Adapter configurati etc…
 I nodi analytics hanno diversi tagli:
 Una volta scelto, non si cambia il Node Size (Scale out vs Scale up)
11
Sizing: le dimensioni contano (2/2)
 Il dimensionamento può essere un problema ma… per fortuna ci
aiuta VMware!
 vROps Sizing Calculator - https://kb.vmware.com/kb/2130551
12
Quali adapter abilitare?
 Prima di completare il sizing: quali e quante istanze abilitare tra gli
adapters installati di default?
• vCenter Adapter
• vCenter Python Adapter
• EndPoint Operations (EPOps)
 Influenza il numero di oggetti osservare e metriche da ingerire
 Installeremo anche adapter di terze parti?
13
Loadbalancing e certificati
 La GUI è accessibile da tutti i nodi:
• Meglio accedere tramite URL del servizio
• Consigliabile metterere i nodi dietro un LoadBalancer
• Non è un vero loadbalancing, ma più un “redirect”
 Certificati SSL:
• Raramente si sostituisce il Self Signed, ma sarebbe “buona pratica” (non solo
riguardo vROPs)
• Creare un Certificato PEM col nome del servizio e un SAN per ogni nodo.
Suggerimento: riservare FQDN e indirizzi IP anche per possibili nuovi nodi
future ed inserirli come SAN nel certificato (si evita di dover sostituire il
certificato ad ogni aggiunta di un nuovo nodo)
• Il certificato caricato sul Master Node viene automaticamente propagato ad
ogni altro nodo (inclusi nodi aggiunti in seguito)
 Guida ai LB: https://goo.gl/IxOshU
 SSL Certs HowTo: https://goo.gl/C8DIy5
14
Estendibilità: non solo Virtual Machines
 vROps può essere esteso per
collezionare e analizzare metriche da
altre tipologie di oggetti grazie ai
Management Packs
• Sviluppati da VMware o da terze parti
• Gratuiti o a pagamento
• Forniscono:
• Integrazione con altre soluzioni Vmware (vRA,
vCO, NSX etc.)
• Visibilità end-to-end verso altre componenti
infrastrutturali (Server, Storage, Network etc.)
• Integrazione con applicativi (SAP, MSSQL, Active
Directory, Postgres, Sharepoint, IBM DB2, Oracle
WebLogic etc.)
https://solutionexchange.vmware.com
15
Day 2 (vR)Ops
 Occorrono almeno 4 settimane per avere dati attendibili (learning)
 Le policy di default vanno tarate a “misura di organizzazione”
 Le dashboard di default non coprono tutti gli scenari
 La curva di apprendimento è ripida (prodotto potente ma
complesso)
 Si tende (sbagliando!!!) a tornare al vCenter per fare
troubleshooting veloce
 Vale la pena investire tempo nello studio e nella customizzazione di
vROps
16
Risorse utili
 Il mio blog (The vGeek): http://blog.vgeek.it/
 Simon Eady (Definit IT): http://www.definit.co.uk/
 Sunny Dua (vXpress): http://vxpresss.blogspot.com
 Simon’s & Sunny’s webinar series:
http://vxpresss.blogspot.com/2016/03/vrops-webinar-series-2016-
webinar.html
 Documentazione ufficiale:
https://www.vmware.com/support/pubs/vrealize-operations-
manager-pubs.html
17
Q & A
Domande?

More Related Content

PDF
VMware SRM - Una visione architetturale
VMUG IT
 
PDF
GUIDA VMWARE
PRAGMA PROGETTI
 
PDF
Nutanix - Inail User Case
VMUG IT
 
PDF
Veeam - Always-on Enterprise: chimera o realtà?
VMUG IT
 
PDF
Site Recovery Manager - Una visione architetturale
gguglie
 
PDF
#vBrownBag.IT - Session 1
Andrea Mauro
 
PDF
#vBrownBag.IT - Session 2
Andrea Mauro
 
PDF
SDS,la pietra d’angolo dell SDDC
VMUG IT
 
VMware SRM - Una visione architetturale
VMUG IT
 
GUIDA VMWARE
PRAGMA PROGETTI
 
Nutanix - Inail User Case
VMUG IT
 
Veeam - Always-on Enterprise: chimera o realtà?
VMUG IT
 
Site Recovery Manager - Una visione architetturale
gguglie
 
#vBrownBag.IT - Session 1
Andrea Mauro
 
#vBrownBag.IT - Session 2
Andrea Mauro
 
SDS,la pietra d’angolo dell SDDC
VMUG IT
 

What's hot (19)

PDF
Novità di VMware vShere 6.0 @ VMUG.IT 20150304
VMUG IT
 
PDF
VMUGIT UC 2013 - 09b VMUGIT SMB
VMUG IT
 
PPS
Safe check up - cos'è? - 22feb2012
M.Ela International Srl
 
PDF
SPBM VSAN VVOL @ VMUG.IT 20150529
VMUG IT
 
PDF
VMUGIT Meeting Pisa 2015 - SDS secondo VMware: VSAN e VVOL
gguglie
 
PPTX
CCI2018 - Iperconvergenza con Windows Server
walk2talk srl
 
PDF
Presentazione al VMUGIT UC 2014 - Virtualizzare con i piedi per terra
Andrea Mauro
 
PPTX
100526 Sa 1.1 Platespin Forge Webinar (2)
antonio_tonani
 
PDF
Software Defined Storage
VMUG IT
 
PPTX
Le novità di VMware vSphere 5.1
PRAGMA PROGETTI
 
PDF
Proxmox VE
Dario Tion
 
PDF
LUG - Logical volumes management
Alessandro Manfredi
 
PDF
Virtualizzazione
Paolo Campegiani
 
PDF
SQL Server Failover Cluster Instances con Azure Managed Disks
Gianluca Hotz
 
PDF
SQL Server Failover Cluster Instances con Amazon FSx in AWS
Gianluca Hotz
 
PDF
Oracle Application Server 10g
Paolo Campegiani
 
PDF
SQL Server Workload Profiling
Gianluca Hotz
 
PDF
festival ICT 2013: Windows Server 2012 R2: Ottimizzare l’infrastruttura con H...
festival ICT 2016
 
PDF
SQL Server Back to Basics: Sicurezza
Gianluca Hotz
 
Novità di VMware vShere 6.0 @ VMUG.IT 20150304
VMUG IT
 
VMUGIT UC 2013 - 09b VMUGIT SMB
VMUG IT
 
Safe check up - cos'è? - 22feb2012
M.Ela International Srl
 
SPBM VSAN VVOL @ VMUG.IT 20150529
VMUG IT
 
VMUGIT Meeting Pisa 2015 - SDS secondo VMware: VSAN e VVOL
gguglie
 
CCI2018 - Iperconvergenza con Windows Server
walk2talk srl
 
Presentazione al VMUGIT UC 2014 - Virtualizzare con i piedi per terra
Andrea Mauro
 
100526 Sa 1.1 Platespin Forge Webinar (2)
antonio_tonani
 
Software Defined Storage
VMUG IT
 
Le novità di VMware vSphere 5.1
PRAGMA PROGETTI
 
Proxmox VE
Dario Tion
 
LUG - Logical volumes management
Alessandro Manfredi
 
Virtualizzazione
Paolo Campegiani
 
SQL Server Failover Cluster Instances con Azure Managed Disks
Gianluca Hotz
 
SQL Server Failover Cluster Instances con Amazon FSx in AWS
Gianluca Hotz
 
Oracle Application Server 10g
Paolo Campegiani
 
SQL Server Workload Profiling
Gianluca Hotz
 
festival ICT 2013: Windows Server 2012 R2: Ottimizzare l’infrastruttura con H...
festival ICT 2016
 
SQL Server Back to Basics: Sicurezza
Gianluca Hotz
 
Ad

Viewers also liked (10)

PPT
VMware & Riverbed
vmug
 
PPTX
Metro Cluster High Availability or SRM Disaster Recovery?
David Pasek
 
PPT
3PAR and VMWare
vmug
 
PPTX
vmware_site_recovery_manager_and_net_app_fas_v-series_se_technical_presentati...
Vinh Nguyen
 
PDF
Data Center Virtualization @ Cisco
vmug
 
PPTX
VMworld 2015: Site Recovery Manager and Policy Based DR Deep Dive with Engine...
VMworld
 
PPSX
Vmware srm 6.1
faz4eva_27
 
PPTX
Falconstor - How It Supports P2V Machine Recovery & Integrates with VMware SRM
1CloudRoad.com
 
PPTX
VMware Site Recovery Manager - Architecting a DR Solution - Best Practices
thephuck
 
PDF
Business Continuity and Disaster Recovery for Oracle11g Enabled by EMC Symmet...
EMC
 
VMware & Riverbed
vmug
 
Metro Cluster High Availability or SRM Disaster Recovery?
David Pasek
 
3PAR and VMWare
vmug
 
vmware_site_recovery_manager_and_net_app_fas_v-series_se_technical_presentati...
Vinh Nguyen
 
Data Center Virtualization @ Cisco
vmug
 
VMworld 2015: Site Recovery Manager and Policy Based DR Deep Dive with Engine...
VMworld
 
Vmware srm 6.1
faz4eva_27
 
Falconstor - How It Supports P2V Machine Recovery & Integrates with VMware SRM
1CloudRoad.com
 
VMware Site Recovery Manager - Architecting a DR Solution - Best Practices
thephuck
 
Business Continuity and Disaster Recovery for Oracle11g Enabled by EMC Symmet...
EMC
 
Ad

Similar to VMUGIT Roma 2016 - vROps Design - Pietro Piutti (20)

PDF
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Steve Maraspin
 
PDF
JBoss Clouds - JBug Roma october 2009
Sanne Grinovero
 
PDF
October 2009 - JBoss Cloud
JBug Italy
 
PDF
MySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQL
Par-Tec S.p.A.
 
PPTX
Azure dayroma java, il lato oscuro del cloud
Riccardo Zamana
 
PDF
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
Par-Tec S.p.A.
 
PDF
Infinispan codemotion - Codemotion Rome 2015
Codemotion
 
PDF
JBoss Data Grid Tech Lab
Ugo Landini
 
PDF
Big data - stack tecnologico
Consulthinkspa
 
PDF
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB
 
PPTX
Azure for Game Developers
Marco Parenzan
 
PPTX
Big data stack tecnologico
Massimo Romano
 
PDF
OCP Paas_ultima
opencityplatform
 
PPTX
OCP-Architettura e caratteristiche della PaaS
opencityplatform
 
PDF
Data grid
Ugo Landini
 
PPTX
Kubernetes as HA time series server, a proposal
Giuliano Latini
 
PDF
WSO2 Oxygenate Italy 2022 Raiffeisen Information Service. Roberto Palmarin
Profesia Srl, Lynx Group
 
PPTX
SQL Server Benchmarking, Baselining and Workload Analysis
Gianluca Sartori
 
PDF
Open Source Day 2015 - DBaaS con Docker: un caso di studio
Par-Tec S.p.A.
 
PPTX
DbUp - A real case of database migration
Andrea Cirioni
 
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Steve Maraspin
 
JBoss Clouds - JBug Roma october 2009
Sanne Grinovero
 
October 2009 - JBoss Cloud
JBug Italy
 
MySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQL
Par-Tec S.p.A.
 
Azure dayroma java, il lato oscuro del cloud
Riccardo Zamana
 
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
Par-Tec S.p.A.
 
Infinispan codemotion - Codemotion Rome 2015
Codemotion
 
JBoss Data Grid Tech Lab
Ugo Landini
 
Big data - stack tecnologico
Consulthinkspa
 
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB
 
Azure for Game Developers
Marco Parenzan
 
Big data stack tecnologico
Massimo Romano
 
OCP Paas_ultima
opencityplatform
 
OCP-Architettura e caratteristiche della PaaS
opencityplatform
 
Data grid
Ugo Landini
 
Kubernetes as HA time series server, a proposal
Giuliano Latini
 
WSO2 Oxygenate Italy 2022 Raiffeisen Information Service. Roberto Palmarin
Profesia Srl, Lynx Group
 
SQL Server Benchmarking, Baselining and Workload Analysis
Gianluca Sartori
 
Open Source Day 2015 - DBaaS con Docker: un caso di studio
Par-Tec S.p.A.
 
DbUp - A real case of database migration
Andrea Cirioni
 

More from VMUG IT (20)

PDF
04 vmugit aprile_2018_raff_poltronieri
VMUG IT
 
PDF
03 vmugit aprile_2018_veeam
VMUG IT
 
PDF
02 vmugit aprile_2018_il_restodelcarlino
VMUG IT
 
PDF
01 vmugit aprile_2018_bologna_benvenuto
VMUG IT
 
PDF
07 vmugit aprile_2018_massimiliano_moschini
VMUG IT
 
PDF
06 vmugit aprile_2018_alessandro_tinivelli
VMUG IT
 
PDF
05 vmugit aprile_2018_7_layers
VMUG IT
 
PDF
07 - VMUGIT - Lecce 2018 - Antonio Gentile, Fortinet
VMUG IT
 
PDF
06 - VMUGIT - Lecce 2018 - Rodolfo Rotondo, VMware
VMUG IT
 
PDF
05 - VMUGIT - Lecce 2018 - Raff Poltronieri, CloudItalia
VMUG IT
 
PDF
04 - VMUGIT - Lecce 2018 - Giampiero Petrosi, Rubrik
VMUG IT
 
PPTX
03 - VMUGIT - Lecce 2018 - Massimiliano Mortillaro, Tech Unplugged
VMUG IT
 
PDF
02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO
VMUG IT
 
PPTX
01 - VMUGIT - Lecce 2018 - Fabio Rapposelli, VMware
VMUG IT
 
PPTX
00 - VMUGIT - Lecce 2018 - Intro
VMUG IT
 
PPTX
Luca dell'oca - italian vmug usercon 2017
VMUG IT
 
PPTX
Luc Dekens - Italian vmug usercon
VMUG IT
 
PPTX
Gianni Resti
VMUG IT
 
PDF
Frank Denneman keynote
VMUG IT
 
PPTX
Vmug 2017 Guido Frabotti
VMUG IT
 
04 vmugit aprile_2018_raff_poltronieri
VMUG IT
 
03 vmugit aprile_2018_veeam
VMUG IT
 
02 vmugit aprile_2018_il_restodelcarlino
VMUG IT
 
01 vmugit aprile_2018_bologna_benvenuto
VMUG IT
 
07 vmugit aprile_2018_massimiliano_moschini
VMUG IT
 
06 vmugit aprile_2018_alessandro_tinivelli
VMUG IT
 
05 vmugit aprile_2018_7_layers
VMUG IT
 
07 - VMUGIT - Lecce 2018 - Antonio Gentile, Fortinet
VMUG IT
 
06 - VMUGIT - Lecce 2018 - Rodolfo Rotondo, VMware
VMUG IT
 
05 - VMUGIT - Lecce 2018 - Raff Poltronieri, CloudItalia
VMUG IT
 
04 - VMUGIT - Lecce 2018 - Giampiero Petrosi, Rubrik
VMUG IT
 
03 - VMUGIT - Lecce 2018 - Massimiliano Mortillaro, Tech Unplugged
VMUG IT
 
02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO
VMUG IT
 
01 - VMUGIT - Lecce 2018 - Fabio Rapposelli, VMware
VMUG IT
 
00 - VMUGIT - Lecce 2018 - Intro
VMUG IT
 
Luca dell'oca - italian vmug usercon 2017
VMUG IT
 
Luc Dekens - Italian vmug usercon
VMUG IT
 
Gianni Resti
VMUG IT
 
Frank Denneman keynote
VMUG IT
 
Vmug 2017 Guido Frabotti
VMUG IT
 

VMUGIT Roma 2016 - vROps Design - Pietro Piutti

  • 1. vRealize Operations Manager 6 Considerazioni su Architettura e Design VMUGIT Meeting, Roma, 26 Settembre 2016 Pietro PIUTTI – VMUG Italia Leader, Systems Engineer, VMware vEXPERT, PernixPro, Tech Field Day Delegate @stingray92 – http://blog.vgeek.it
  • 2. 2 vROps: avevamo bisogno di un altro tool di monitoring?  vCenter vs vROps: è tutta un’altra storia… • vCenter: Performance Graphs e Alarms • vROps: metriche, metriche, metriche!! Bagdes, Alerts, Widgets, Reports… • Presentazione vs Analisi / Perdita di dettaglio vs Granularità e Persistenza  vROps non è solo un tool di monitoring! • Policy-based Health, Risk and Efficiency analysis • Troubleshooting, Capacity Planning, Correlazione vs
  • 3. 3 Ma vROps è solo un rebranding di vCOps?  Stessi obiettivi, stessa filosofia, nuovo prodotto, focus sulla semplificazione (deployment e operations semplificate): • vCOps: UI VM + Analytics VM • vROps: una sola VM può integrare tutti i ruoli • vCOps: vSphere UI + Custom UI • vROps: una sola UI  Componente fondamentale della vRealize Suite • Integrazione “Out of the Box” con Log Insight per troubleshooting avanzato • NSX ready (con adapter aggiuntivo) • Integra funzionalità di Hyperic (dalla 6.2) per il monitoring a livello OS e Applicativo (EPOps)
  • 4. 4 Quale tipo di VM scegliere per il nostro Cluster?  Windows  Linux (RedHat)  OVA Appliance  Omogeneità: tutte le VM del Cluster vROps devono essere identiche. Si, ma non è proprio vero…  Pro/Contro • OS Based: vanno gestite secondo gli standard aziendali (patching, backup, antivirus, agents etc.) • OVA: “black box” (nessuna modifica permessa, nessuna manutenzione, aggiornamenti incrementali di OS e applicazione) • Non esiste una risposta univoca: la scelta dipende dalle logiche dell’organizzazione
  • 5. 5 Analytics Cluster vROps: ruoli e scalabilità (1/3)  Un Cluster vROps è un Sistema Distribuito che “uses VMware vFabric® GemFire® to connect nodes into a shared memory cluster and map the work across the nodes”  vROps è concepito per scalare: si parte sempre dal Master Node e si espande con l’aggiunta di altri nodi: • Data Node • Master Replica (a partire da un Data Node) • Collector  Internals: • UI • Collector • Controller • Analytics • Persistence
  • 6. 6 Analytics Cluster vROps: ruoli e scalabilità (2/3)  La “Persistence” e i 4 DB: • Global xDB: Contains user configuration data, such as alert and symptom definitions, dashboard configurations, and super metric formulas. The global xDB is found on the master node and master replica nodes only • Alerts/symptoms vPostgres: Contains alerts and symptoms information • Historical inventory service xDB: Contains a historical view of all object properties and relationships • FSDB: Contains all the statistical, time series data. This raw metric data is used to provide live status displays in the user interface
  • 7. 7 Analytics Cluster vROps: ruoli e scalabilità (3/3)  Espandere la capacità analitica del Cluster: Data Node • Stesso OS, stessa taglia, stessa location (no across multiple DCs deployment!) • DB Sharding  Espandere il raggio d’azione del Cluster: Remote Collector Node • Nessuna limitazione in termini di OS/taglia, nessuna capacità analitica, non ospita DB
  • 8. 8 HA: vantaggi e svantaggi  In un Cluster di N nodi analytics, quanti ne possono fallire senza perdere il Cluster? Risposta: solo 1! • Se crasha un Data Node? No problem: il carico viene distribuito sui nodi superstiti finché il Data Node non viene sostituito. Ma facciamo presto! • E se crasha il Master? Il Master Node è un Single Point of Failure  Soluzione: convertire un Data Node in Master Replica • Vantaggi: • No Single Point of Failure • Failover del Master role e Recovery automatico e veloce del Cluster • Svantaggi: • Downsize della capacità analitica del cluster (abbiamo rinunciato ad un Data Node) • Allocazione di ulteriori risorse infrastrutturali
  • 9. 9 Proteggere un Cluster vROps  Mantenere i nodi analytics su host diversi (DRS anti-affinity rule)  Backup: attenti alla consistenza dei dati • Il backup (a livello VM, con tool VADP) va fatto non per singolo nodo ma per tutti i nodi analytics allo stesso tempo • Il tool di backup va configurato disabilitando la quiescienza del file system delle VM. Se il tool non lo permette, va disabilitata a livello di singola VM – Vedi doc ufficiale di prodotto https://goo.gl/0xAFsK • In caso di restore di un nodo crashato, va fatto il restore di tutti i nodi (ricordate… consistenza!) • Schedulare i backup quando non sta girando il task di calcolo dei Dynamic Thresholds  Abilitare l’HA (Master Replica Node)…. YMMV!
  • 10. 10 Sizing: le dimensioni contano (1/2)  OK, ma quanti nodi? Quanto grandi? Dobbiamo fare due conti: • Numero di oggetti e relative metriche da “misurare” • Tempo di retention (default: 6 mesi) • Numero e tipo di Adapter configurati etc…  I nodi analytics hanno diversi tagli:  Una volta scelto, non si cambia il Node Size (Scale out vs Scale up)
  • 11. 11 Sizing: le dimensioni contano (2/2)  Il dimensionamento può essere un problema ma… per fortuna ci aiuta VMware!  vROps Sizing Calculator - https://kb.vmware.com/kb/2130551
  • 12. 12 Quali adapter abilitare?  Prima di completare il sizing: quali e quante istanze abilitare tra gli adapters installati di default? • vCenter Adapter • vCenter Python Adapter • EndPoint Operations (EPOps)  Influenza il numero di oggetti osservare e metriche da ingerire  Installeremo anche adapter di terze parti?
  • 13. 13 Loadbalancing e certificati  La GUI è accessibile da tutti i nodi: • Meglio accedere tramite URL del servizio • Consigliabile metterere i nodi dietro un LoadBalancer • Non è un vero loadbalancing, ma più un “redirect”  Certificati SSL: • Raramente si sostituisce il Self Signed, ma sarebbe “buona pratica” (non solo riguardo vROPs) • Creare un Certificato PEM col nome del servizio e un SAN per ogni nodo. Suggerimento: riservare FQDN e indirizzi IP anche per possibili nuovi nodi future ed inserirli come SAN nel certificato (si evita di dover sostituire il certificato ad ogni aggiunta di un nuovo nodo) • Il certificato caricato sul Master Node viene automaticamente propagato ad ogni altro nodo (inclusi nodi aggiunti in seguito)  Guida ai LB: https://goo.gl/IxOshU  SSL Certs HowTo: https://goo.gl/C8DIy5
  • 14. 14 Estendibilità: non solo Virtual Machines  vROps può essere esteso per collezionare e analizzare metriche da altre tipologie di oggetti grazie ai Management Packs • Sviluppati da VMware o da terze parti • Gratuiti o a pagamento • Forniscono: • Integrazione con altre soluzioni Vmware (vRA, vCO, NSX etc.) • Visibilità end-to-end verso altre componenti infrastrutturali (Server, Storage, Network etc.) • Integrazione con applicativi (SAP, MSSQL, Active Directory, Postgres, Sharepoint, IBM DB2, Oracle WebLogic etc.) https://solutionexchange.vmware.com
  • 15. 15 Day 2 (vR)Ops  Occorrono almeno 4 settimane per avere dati attendibili (learning)  Le policy di default vanno tarate a “misura di organizzazione”  Le dashboard di default non coprono tutti gli scenari  La curva di apprendimento è ripida (prodotto potente ma complesso)  Si tende (sbagliando!!!) a tornare al vCenter per fare troubleshooting veloce  Vale la pena investire tempo nello studio e nella customizzazione di vROps
  • 16. 16 Risorse utili  Il mio blog (The vGeek): http://blog.vgeek.it/  Simon Eady (Definit IT): http://www.definit.co.uk/  Sunny Dua (vXpress): http://vxpresss.blogspot.com  Simon’s & Sunny’s webinar series: http://vxpresss.blogspot.com/2016/03/vrops-webinar-series-2016- webinar.html  Documentazione ufficiale: https://www.vmware.com/support/pubs/vrealize-operations- manager-pubs.html