1
Estadisticas, Monitoreo y Tendencias SNMP VMware

Solved 5 Respuestas 3 Views
Gente.

Tengo 16 ESXi hosts integrados con 2 vCenters (8 para uno, 8 al otro)
La pregunta es:

Que utilizan para traerse estadisticas de los hosts? (SNMP? o shellscript?)

y mas importante:
Que estadisticas miran? VMs encendidas? Uso de Memoria del host?
A nivel Guest OSs miran algo?

Mas que nada porque voy a tener que estar haciendo capacity planning y estoy medio ciego por ahora salvo las herramientas de monitoreo embebidas de VMware.

Tengo un Cacti que uso para monitorear todo, pero desconozco si es integrable al nivel de granularidad de boludeces que me muestra el vCenter.

Gracias!

5 Respuestas

2
Mejor respuesta
Hola! Cualquiera sea la herramienta que uses (Cacti, Nagios, Zabbix, hay mucho en el mercado... ) como bien decís lo importante es que monitorear y donde prestar mas atención.

A nivel de ESX  los chequeos de Hardware son MUY importantes: temperatura, sensores del chasis, energia, ventiladores, discos rigídos, interfaces de red, etc. Si el hardware de uno o varios esx fallan, fallan las vm's y colapsa todo el cluster como bola de nieve.

En segundo orden que el uso de memoria  y procesadores no supere los umbrales establecidos para cumplir las reglas de HA del  cluster en caso de contingencia o bien para un mantenimiento programado. Esto sobre hay que controlarlo de cerca cuando tenes DRS en modo manual o semi automático.

A nivel de Guest, es importante controlar: VMtools actualizadas y en ejecución, verificar que los discos no hayan quedado en Read Only  y que la hora esté bien sincronizada. También es importante controlar los snapshots de las máquinas, si los hacés. Tratar de consolidarlos dentro de lo posible para no malgastar espacio en disco y que el snapshot no quede obsoleto.

El control del storage es también un factor clave. Controlar consumo de IOPS, ancho de banda y Procesadores. Y sobre todo,  muy importante y que suele suceder pero todos los administradores descuidan, el espacio en disco de los vcenters y os recursos en general. Estos servers colectan muchisima info por segundo y suelen tener una demanda de storage inesperada por momentos y cuando se quedan sin lugar donde escribir, todo se detiene y no vuelve a levantar solo cuando se normaliza. Podes aprovechar que tenés dos y ponerlos en linked mode para mayor redundancia.

En general podes regular la mayoría de los problemas que podrían surgir desde la misma plataforma vSphere, haciendo restricciones y limitando el uso mediante la agrupación de vm's por pools, aplicando control de iops, balloning, etc. Se puede tener mucha previsión y no debería ser complicado hacer una buena planeación (Inclusive hay herramientas especificas de VMware).
respondido por rd (2,000 puntos) Sep 10, 2015
seleccionada por jstp Ene 13, 2016
2Comentarios
comentado por jstp (1,190 puntos) Sep 10, 2015
Hola!
Primero que nada, gracias por responder.

Ahora me pongo a leer al respecto, no sabia que podia tener los vCenters en "linked mode"
Me anoto para revisar todo esto.

Ahora, para obtener toda esta info polleas por snmp a la ip del esxi host?
comentado por rd (2,000 puntos) Sep 10, 2015
Claro! con linked mode vas a poder tener todo en una misma sesión de vSphere Client.

https://pubs.vmware.com/vsphere-60/index.jsp?topic=%2Fcom.vmware.vsphere.vcenterhost.doc%2FGUID-6ADB06EF-E342-457E-A17B-1EA31C0F6D4B.html

Uso Opsview Enterprise el cual trae agentes compatibles, plugins y templates específicos para VMware, incluido el autodiscovery. Lo bueno es que con el mismo agente también podés monitorear las vm's y los Datastores. Para los NAS (Nexenta) si es conveniente hacerlo por SNMP.

Con zabbix también podés hacerlo

https://www.zabbix.com/documentation/2.4/manual/vm_monitoring

Hay muchas herramientas y maneras de monitorear pero creo que SNMP para los ESX es bastante pobre y limitada la data que reporta, prefiero algún agente y plugins donde las posibilidades son infinitas.   

También te puede interesar pegarle una mirada a

https://pubs.vmware.com/vsphere-60/topic/com.vmware.vsphere.monitoring.doc/GUID-A8B06BE0-E5FC-435C-B12F-A31618B21E2C.html

Saludos!
0
Hola!

Yo estoy monitoreando varios ESXi standalone y vía Vcenter con Check_MK a través del plugin nativo. Solo tenes que crear un user de lectura con permisos sobre la rama CIM y ya funciona vía https.

Con eso podes ver, CPU, memoria, hardware sensors, multipathing, placas de red y utilización de los datastores. No es exactamente una herramienta de capacity planning pero sirve para el monitoreo continuo y alertas más importantes.

Si necesitás un monitoreo más fino tenes que ir a soluciones exclusivas tipo Veeam One
respondido por quequiel (950 puntos) Sep 11, 2015
0
Buenas, Paso a comentarte: para proyectos de capacity planning, monitoreo y reportes. VMware tiene una herramienta que se llama vRealize Operationes manager que cumple exactamente las funciones que estas pidiendo.
respondido por Monduza (1,920 puntos) Sep 14, 2015
0
Por el ambiente que describís, tenés todo legal, dependiendo de nivel de licencia que tengas de vmware, podés acceder al vCOPS que está muy bueno.

Una vez que lo ponés en marcha y configurás, lo dejás andando un mes y ahi vas a empezar a tener un nivel de estadísticas de utilización y proyecciones mas que interesante.

Una de las cosas que a mi mas me gusta, es la parte de "wasted resources".

sds

 

tequesta
respondido por tequesta (140 puntos) Oct 15, 2015
0
Yo estoy teniendo un problema parecido, para monitorear probe algunas cosas pero termine usando pysphere, una libreria de python para interactuar con la api de vcenter. Anda muy bien aunque me gustaria que me de algunos datos mas. Lo que hago es un userparam de zabbix que ejecuta un programa en python (hecho por mi) que toma los datos.  Yo lo uso solo para tomar datos pero con pysphere podes apagar, prender, hacer snapshots, etc...

Saludos
respondido por luigibalzani (9,450 puntos) Oct 15, 2015
...