¿Cuál es el mayor ahorro de tiempo que has implementado? [cerrado]


37

¿Qué cambios que implementó tuvieron el mayor impacto en el ahorro de tiempo en su carga de trabajo diaria de administrador de sistemas? ¿Cuáles son tus trucos para trabajar de manera más eficiente y hacer más cosas o trabajar menos para obtener los mismos resultados?

Estoy pensando en la automatización, cambios en el flujo de trabajo / procesos, nuevas herramientas, dejar de hacer algunas cosas por completo, tercerización, mejor delegación, cambio de software / hardware, reducción de la burocracia, etc.


Esta pregunta está fuera de tema bajo las reglas actuales de actualidad.
HopelessN00b

Respuestas:


30

monitoreo + alerta , que es una gran red de seguridad. así como los desarrolladores escriben pruebas unitarias para asegurarse de que las cosas no se estropeen cuando actualizan el código, confío en el monitoreo como red de seguridad adicional en caso de que arruine algo [es decir desconectar un servidor, negar el tráfico de producción en el firewall, etc.] . brinda tranquilidad: si las cosas se rompen, lo sabré antes de que llamen los clientes.


Además: tenemos un televisor enorme en la pared, que muestra diagramas rotativos de nuestra red (hecho con nagios y nagvis). Crea una gran visibilidad, y la última versión de nagvis es una maravilla. Le da a su jefe y a sus usuarios la sensación de que usted tiene el control (lo que es una vez que tiene esto).
wolfgangsz

26

Para mí, ha sido la autenticación centralizada.

Llegué al punto de que administraba aproximadamente 40 máquinas Slackware, y cada una tenía autenticación local MÁS autenticación Samba local. También tenía una solución VPN donde cada cuenta necesitaba ser configurada, más un servidor interno de jabber y un servidor interno de correo electrónico. Todo tenía su propia cuenta. MAC (movimientos, adiciones, cambios) estaban locos.

Así que cambié de Slackware a CentOS, creé una infraestructura de Active Directory y usé Likewise Open para autenticar todas mis máquinas Linux contra AD. Probablemente me ahorró 20 horas al mes sin bromear ni un poco.

Ahora, tengo todo lo autenticado a través de AD que puedo, y funciona tremendamente. No puedo recomendar la autenticación centralizada lo suficiente si todavía estás haciendo las cosas de la manera antigua.


¿Sabes si igualmente open resolverá el problema con los dominios de confianza que hace samba? Ver serverfault.com/questions/35492/…
chmeee

1
chmeee: No lo sé, ya que mi infraestructura no es tan complicada como la tuya. Te sugiero que lo pruebes en una caja de repuesto. Del mismo modo, Open es gratuito y no realiza ningún cambio de dominio, aparte de agregar la máquina a la unidad organizativa de las computadoras AD.
Matt Simmons el

¿Por qué AD y no OpenLDAP o Redhat / Netscape? ¿Es predominantemente una red de Windows?
David Gardner el

Porque estaba familiarizado con AD y no con OpenLDAP o Redhat Directory Server
Matt Simmons el

20

Estoy de acuerdo con las opciones obvias aquí; Automatización y autenticación central. Sin embargo, parece que tengo que ser el tipo para mencionar la documentación .

Al documentar tantos problemas, flujos de trabajo, instalaciones y guías como sea posible, las personas pudieron resolver algunos de sus problemas sin la necesidad de contar con nuestro departamento.

Otro gran ahorro de tiempo es el seguimiento de problemas .

Ser capaz de priorizar las tareas, asignarlas a los miembros del equipo y deshacerse de todo el desorden de las personas que envían solicitudes por correo electrónico, msn o simplemente llegan a la oficina. Esto también ayuda a nuestros buenos amigos, los gerentes, a ver cuán eficiente es usted (si lo desea).

Entonces, por supuesto, la guinda del pastel sería mi taza 'RTFM' (Lea el Manual Fino) que se cría mucho.


Monitoreo + Alertas en mi humilde opinión es mucho mejor que la documentación. Es documentación implícita (no es que no me gusten los documentos escritos). Acordado en el seguimiento de problemas, no podía prescindir
serverhorror

2
Monitonring + Alerting son el "qué". La documentación es el "por qué".
David Mackintosh

Puede tener todo el monitoreo y las alertas que desee, pero si no tiene ninguna documentación sobre qué hacer cuando se apaga el localizador o notas sobre cómo extender el monitoreo, entonces se quedará atrapado respondiendo todas las páginas y manteniendo todas el seguimiento a ti mismo. La documentación permite la transferencia de conocimiento para que pueda construir su equipo y dejar que otros intervengan para compartir el trabajo.
dannyman

17

La automatización de la infraestructura con una herramienta como Chef o Puppet es lo mejor que he implementado en los sistemas que administro. El monitoreo es excelente y todo, pero a menudo, hacer que los diversos bits funcionen bien con el resto de la infraestructura requiere mucho trabajo. Chef y Puppet son excelentes para automatizar toda la infraestructura, proporcionando una gran cantidad de pegamento que solía escribirse a mano. Particularmente juntando qué servidores proporcionan qué servicios.

Chef tiene, incorporada, la capacidad de consultar en el servidor los atributos y recetas aplicados en otros nodos, por lo que puede preguntar quiénes son los servidores web de producción o quién es el maestro de la base de datos, lo que facilita mucho la automatización. Puppet también puede hacer esto, pero requiere una herramienta de clasificación de nodos externa como iClassify .

Esto debería tener implicaciones obvias para las herramientas de monitoreo y tendencias como Nagios y Munin. También puede, por ejemplo, proporcionar una configuración automatizada de entornos de carga equilibrada, por lo que los LB pueden consultar todos los servidores web que necesitan ser cubiertos para una aplicación en particular.

El otro gran ahorro de tiempo que he implementado en una variedad de entornos son las compilaciones automatizadas, como kickstart (redhat / centos) y preseed (debian / ubuntu). Esto debería ser obvio para la mayoría de las personas, pero puede sorprender cuántos sitios todavía construyen sistemas a partir de CD. Es aún mejor si la compilación automatizada prepara el sistema para ejecutar Chef o Puppet para preparar todos los demás productos.


2
La gestión de la configuración (utilicé Puppet) más el servidor PXE (cobbler) me ahorró mucho tiempo. Pero el mayor ahorro de tiempo proviene de la "gestión del tiempo". Encontré que el libro de Tom Limoncelli "Gestión del tiempo para administradores de sistemas" es invaluable en esto. Ahora que mi día está más estructurado y planificado, paso menos tiempo "planeando" y postergando y más tiempo haciendo lo que es relevante.
aussielunix

Buenas herramientas de automatización, pero ¿conoces alguna herramienta similar a Chef o Puppet que no esté basada en Ruby?
Andrioid

@Android - cfEngine, pero Chef y Puppet son más agradables para trabajar, y también lo es Ruby: D.
jtimberman

Echa un vistazo a Bcfg2. Es similar en capacidad a Puppet pero escrito en Python.
Kamil Kisiel

16

Múltiples monitores, con una ventana abierta en la consola de cada servidor del que fui responsable.


66
Eso solo escalará hasta ahora.
Teddy el

Sí. Aunque podría seguir agregando máquinas adicionales con monitores adicionales, pero realmente solo puedes ir tan lejos.
Alan H

7

El monitoreo es excelente, por supuesto, pero no estoy seguro de que ahorre tiempo. Para mi dinero, fue el registro centralizado, con un sistema de visualización que filtraba lo mundano, resaltaba lo peligroso (falla del disco, encuentra el antivirus) y mostraba todo lo demás para su categorización.

syslog (y perl) por la victoria.

Básicamente me permitió leer los registros de eventos de todas las computadoras en la red mientras comía mi bagel; al menos un chequeo superficial para buscar algo aterrador. Enorme ahorro de tiempo.


Registro centralizado +1 e informes con guiones perl.
David Mackintosh

Estamos implementando logcheck en nuestros servidores. Está tomando un poco de tiempo agregar filtros para líneas que no nos interesan, pero es útil.
David Pashley el

1
Sé que es comercial, pero eche un vistazo a splunk, un sistema de centralización de registros con una maravillosa interfaz.
James

6

Se eliminaron los derechos de administrador local para todos los usuarios. (si puedo)

Esto ha tenido el efecto de que ahora no tengo que lidiar con ninguno de ellos, ¿cómo hago para instalar la aplicación X? y casi todo lo relacionado con eso.

Nunca me di cuenta de lo estable que era esto para las estaciones de trabajo hasta que me encontré con una estación de trabajo que se había perdido por completo en las auditorías, actualizaciones de Windows, etc. Estuvo funcionando durante aproximadamente 4 años sin una sola actualización. Creo que estaba en Windows SP1. Ese sitio nunca se quejó de ningún problema y cuando lo descubrí, lo encontré funcionando muy bien.


Este es realmente un buen consejo para una pequeña empresa que está haciendo la transición incómoda en una empresa mediana.
staticsan

1
Permítanme agregar que no funciona agrupar a todos los usuarios bajo una política como esta. Si hay usuarios legítimos (por ejemplo, desarrolladores), deben recibir un trato diferente. Si no, a) no pueden hacer su trabajo, yb) lo subvertirán de todos modos, causando otros problemas. Por lo tanto, la política debe ser consciente de muchos tipos de usuarios.
jplindstrom

No asumas que los desarrolladores necesitan acceso de administrador. Si no tienen acceso de administrador, tal vez desarrollen programas que funcionen correctamente como usuarios limitados (para variar). Hay usuarios que lo necesitan, por eso se les daría una segunda cuenta para instalar software, etc., por lo que su cuenta diaria sigue siendo un usuario limitado. Muy parecido a cómo funciona el mundo Linux. Si lo subvierten, es fácil, despide a la primera persona, el resto se pondrá en línea muy rápido. Si necesitan algo instalado para hacer su trabajo, solicite lo que necesitan, no acceso de administrador.
SpaceManSpiff

6

Virtualización (VMware)

Entre la implementación de servidores desde plantillas, la administración de servidores desde una única interfaz, el monitoreo detallado del hardware integrado en el cliente de infraestructura, realmente ha cambiado la forma en que administramos nuestra infraestructura.

Y el impacto que ha tenido sobre cómo pensamos en nuestro "hardware" realmente lo ha convertido en un cambio de juego. Los clústeres ya no son "demasiado caros" porque podemos implementarlos virtualmente. Necesita más servidores Citrix, clónelo. Siempre y cuando mantengamos nuestra granja de hardware físico proporcionando recursos adecuados (y esos servidores son realmente productos básicos ahora), todo es peachy.


4

cfengine para la gestión de la configuración en debian / linux.

openvpn para conectar las estaciones satelitales

tighvnc través de vpn para llegar a los 2300 clientes de Windows en las estaciones satelitales.

munin y nagios para monitorear y reportar

Smartmontools en los servidores para verificaciones automáticas de estado (y correos de estado, si algo sale mal)

raid1 (reflejo) en los servidores. Si un disco falla, el servidor aún se está ejecutando; esto es realmente importante para mi gestión del tiempo.

Meta

TeamWork : es inútil hacer todas las cosas por su cuenta. comparte el trabajo y juntos son más productivos.

El ambiente de trabajo respeta a tus compañeros, haz bromas y ríe, esto es enormemente útil para un ambiente positivo y creativo

¡Disfruta tu trabajo! hombre, me encanta mi trabajo! Esto me hace realmente bueno (creo;))


4

Para mí fue contratar a un muy buen administrador de sistemas.


3

Marioneta. La idea de cambiar un lugar y tener todos los sistemas afectados es fantástica.

Combine eso con las instalaciones estándar y es muy rápido poner en marcha un nuevo sistema. Arranca en red y ejecuta una instalación de stock, y luego Puppet se hace cargo y todo está configurado.

Finalmente, estandarizar. No, realmente no quieres 35 distribuciones de Linux diferentes y 4 versiones de Solaris diferentes. Trabaja para pasar a una instalación estándar. Cada sistema único que apaga le ahorra mucho tiempo.


2

Agregue otro voto para el monitoreo. El principio es bastante simple: quiero saber qué sucede antes de que los usuarios se vean afectados. La administración del sistema debería ser idealmente un papel transparente. Los usuarios no deben saber ni preocuparse por lo que está haciendo. Desde su perspectiva, simplemente debería funcionar. Los usuarios felices y satisfechos deben ser iguales a administradores felices y satisfechos.

Una cosa que a menudo se pasa por alto en TI es que las computadoras están ahí para trabajar para nosotros, no a la inversa. Sin embargo, conozco administradores que pasan una parte importante de su día revisando manualmente sus servidores y los registros. ¿Por qué? Las computadoras pueden monitorearse entre sí y con una pequeña secuencia de comandos puede recibir solo la parte interesante de los registros. Realmente, no necesita pasar por unos pocos millones de entradas informativas, como el trabajo de impresión de Fred o la transferencia de DNS fue exitosa. Solo dime cuando no lo son.


2

El mayor ahorro de tiempo que he implementado fue Disk Imaging de nuestras estaciones de trabajo de producción. Todos son iguales y nadie almacena nada localmente, así que si hay un problema, simplemente vuelvo a crear una imagen de la máquina y todo está listo para funcionar, como nuevo.


2

El tiempo ahorrado es más importante cuando los sistemas están inactivos.

Documenté toda la información del contrato de soporte en archivos de texto estandarizados en una estructura de directorios estandarizada. Tenía una central y guardaba más de una copia.

Cada bit de información (portal web, número de teléfono, punto de contacto, fecha de vencimiento, número de contrato, accesos directos al menú del teléfono, etc.) fue precedido por una etiqueta estándar en formato .ini antiguo (etiqueta: datos).

Encontrar un número de teléfono fue tan simple como ir al directorio de nivel superior y ejecutar:

grep Phone */*support.txt | more

Donde el primer comodín se expandió al proveedor y / o nombre del producto.

No utilicé Excel, Word, OpenOffice, una base de datos, etc., etc., simplemente porque cuando algo está inactivo, ese algo podría ser lo que contiene su información de soporte. Además, estos no son fácilmente visibles desde una pantalla de consola de modo de texto.

También documenté todos los procedimientos de la misma manera.


Votado por darse cuenta del valor comercial del tiempo.
jplindstrom

2

Implementé una Wiki del Departamento de TI (usando Mediawiki para los interesados) hace varios años. Cuando comenzamos a sentirnos cómodos usándolo, la respuesta a muchas preguntas que se hicieron en la oficina fue "¿Revisaste el wiki?" Nos tomó un poco de tiempo acostumbrarnos a revisar el Wiki para obtener información específica, pero una vez que lo hicimos nos dimos cuenta de que tenía un gran potencial. Tenemos toda la información que necesitamos al alcance de la mano: si hay algo que no está allí, tenemos la capacidad de agregar / cambiar una página rápidamente.



1

Tengo que estar de acuerdo con pQd sobre el monitoreo.

Aunque todavía no hemos visto todos los beneficios, la implementación de la administración de la configuración con Puppet promete ahorrarnos una cantidad considerable de tiempo y reducir enormemente los errores.


1

Encontré AutoIt y luego AutoHotkey y me enamoré.

El último trabajo que tuve fue para un fabricante de vehículos personalizados. Los ensambladores eran usuarios de computadoras mínimamente competentes y lograron bloquear el programa que tenían que usar para ingresar en el trabajo en el que estaban. Todos los días, varias veces al día, tenía que ir a más de 15 estaciones de trabajo en 3 edificios diferentes y matar el programa bloqueado, reiniciarlo y regresarlo a la pantalla de entrada de datos. Eventualmente instalé VNC para poder hacerlo de forma remota, lo que redujo el tiempo de viaje pero aún así me impidió recordar entrar y restablecer las máquinas de vez en cuando. Cuando encontré AutoIt, me di cuenta de que podía configurar el programa para mirar la computadora y, si no había habido ninguna entrada durante 5 minutos, podría restablecer el programa y escribir y hacer clic en todo lo necesario para volver a la pantalla de entrada.


1

++ para la autenticación central y la gestión de cuentas, incluida la creación de cuentas y el manejo de la finalización. Tenemos AD (dos bosques) y LDAP (y, hasta hace poco, NDS) con varios grupos que acceden a los recursos existentes en cualquier directorio. El tiempo que dedicamos a sincronizar los directorios y administrar todos los recursos en uno u otro de los directorios ha valido la pena.

La siguiente mayor victoria ha sido cualquier cantidad de automatización, ya sea limpieza de cuentas, centralización de configuración o lo que sea que tenga.

No estoy seguro de cuánto tiempo ahorra realmente el monitoreo, pero es esencial. No hace falta mucho para que un entorno sea lo suficientemente grande o complejo como para que la "verificación manual" sea imposible e ineficaz. Además, a veces es bueno dormir. ;)

Esto puede estar un poco fuera de la línea de pensamiento principal sobre esto, pero también obtuvimos una gran victoria cuando estandarizamos nuestra plataforma de hardware. Elegimos una plataforma de servidor que era viable para todos nuestros sistemas operativos internos y la hemos mantenido durante varios años. Aprendimos el hardware y aprendimos la administración remota del mismo y ahorra tiempo y energía de varias maneras:

  1. No más soporte de media docena o más tipos de servidores inestables, cada uno con sus propias peculiaridades.
  2. Soporte entre equipos: cuando se trata de hardware, la gente de Unix lo sabe, la gente de Windows lo sabe, incluso la gente de la red está lo suficientemente familiarizada como para lanzar en una mano según sea necesario ya que varios de sus dispositivos se ejecutan en el hardware.
  3. ¡piezas de repuesto!

Lo mismo ocurre con las compilaciones de SO estándar, documentadas y revisadas. Puede parecer básico, pero con frecuencia me encuentro con tiendas donde las compilaciones no son estándar y no hay fin de perder el tiempo para ver si esta herramienta o esa herramienta está presente o si un servidor en particular tiene la configuración correcta. Ese tipo de caos puede convertir incluso las tareas y problemas más básicos en ejercicios de fuego.


1

Aprender a delegar y confiar en mis colegas: una vez que sabes que puedes pasar pedazos de trabajo a otras personas, la vida se vuelve mucho más relajada. Y no porque soy flojo y que todos los demás hagan mi trabajo por mí; es la tranquilidad de saber que tiene una buena copia de seguridad. Y, por supuesto, configuraciones de SO estandarizadas y bien monitoreadas en hardware estándar. Ni que decir.

Mi objetivo para la automatización siempre ha sido que ahora nuevamente recibo un correo electrónico que dice "Tal y tal rompió en el servidor foo. Se ha solucionado". y luego, una vez que envié el error a los desarrolladores, puedo volver a leer el periódico y tomar café. Todavía no estamos allí, pero hemos recorrido un largo camino desde el caos reactivo que solíamos luchar todos los días.


1

Recientemente implementé AntHill Pro en el trabajo y ahora tengo todas nuestras compilaciones e implementaciones para varios proyectos completamente automatizados y rastreados. Esto incluyó la creación de una biblioteca Ant de implementación de Tomcat compartida que utilizan todos los proyectos, simplificando el mantenimiento de esos proyectos en AHP. El siguiente paso es crear una biblioteca similar para las implementaciones de CDA del sitio.

Si bien no me ahorra tiempo personalmente, ahorra el tiempo de nuestros desarrolladores y nuestro personal de operaciones. Disfruto siendo la lata de aceite para las ruedas de otras personas. :-)

Espero ver a Chef y Puppet a continuación para ayudar en el lado de la infraestructura de la automatización de las cosas.

Ah, y la documentación es ENORME ayuda. Ahorra mucho tiempo solo señalar a las personas un documento bien escrito en lugar de responder la misma pregunta 20 veces.


1

Mi mayor ahorro de tiempo fueron los scripts preestablecidos para la instalación de nuestras estaciones de trabajo Linux. Tenemos contratistas yendo y viniendo todo el tiempo, por lo que tenemos un grupo de estaciones de trabajo que se reutilizan regularmente. Cuando regresan a TI, introducimos el CD de instalación, agregamos el archivo preestablecido al comando de instalación y en 20 minutos (y ninguna otra pulsación de tecla de ninguno de nosotros) la caja vuelve a una instalación base nueva y funcional, con todos las herramientas y preconfiguradas para ejecutarse en nuestra red. Plug'n'play

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.