production SAL

1001-1050 of 10000 results (63ms)

2023-06-01 §
11:38	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Depooling db2124 (T336886)', diff saved to https://phabricator.wikimedia.org/P48686 and previous config saved to /var/cache/conftool/dbconfig/20230601-113843-ladsgroup.json	[production]
11:38	<ladsgroup@cumin1001>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 12:00:00 on db2124.codfw.wmnet with reason: Maintenance	[production]
11:38	<ladsgroup@cumin1001>	START - Cookbook sre.hosts.downtime for 12:00:00 on db2124.codfw.wmnet with reason: Maintenance	[production]
11:38	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Repooling after maintenance db2117 (T336886)', diff saved to https://phabricator.wikimedia.org/P48685 and previous config saved to /var/cache/conftool/dbconfig/20230601-113822-ladsgroup.json	[production]
11:28	<jayme@deploy1002>	helmfile [staging] DONE helmfile.d/services/miscweb: apply	[production]
11:28	<jayme@deploy1002>	helmfile [staging] START helmfile.d/services/miscweb: apply	[production]
11:26	<jayme@deploy1002>	helmfile [staging-codfw] DONE helmfile.d/admin 'apply'.	[production]
11:25	<jayme@deploy1002>	helmfile [staging-codfw] START helmfile.d/admin 'apply'.	[production]
11:23	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Repooling after maintenance db2117', diff saved to https://phabricator.wikimedia.org/P48684 and previous config saved to /var/cache/conftool/dbconfig/20230601-112316-ladsgroup.json	[production]
11:08	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Repooling after maintenance db2117', diff saved to https://phabricator.wikimedia.org/P48683 and previous config saved to /var/cache/conftool/dbconfig/20230601-110810-ladsgroup.json	[production]
11:04	<jayme>	disabling puppet on all kubernestes control planes for https://gerrit.wikimedia.org/r/c/operations/puppet/+/925707	[production]
10:53	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Repooling after maintenance db2117 (T336886)', diff saved to https://phabricator.wikimedia.org/P48682 and previous config saved to /var/cache/conftool/dbconfig/20230601-105303-ladsgroup.json	[production]
10:48	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Depooling db2117 (T336886)', diff saved to https://phabricator.wikimedia.org/P48681 and previous config saved to /var/cache/conftool/dbconfig/20230601-104803-ladsgroup.json	[production]
10:47	<ladsgroup@cumin1001>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 12:00:00 on db2117.codfw.wmnet with reason: Maintenance	[production]
10:47	<ladsgroup@cumin1001>	START - Cookbook sre.hosts.downtime for 12:00:00 on db2117.codfw.wmnet with reason: Maintenance	[production]
10:47	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Repooling after maintenance db2114 (T336886)', diff saved to https://phabricator.wikimedia.org/P48680 and previous config saved to /var/cache/conftool/dbconfig/20230601-104742-ladsgroup.json	[production]
10:45	<cmooney@cumin2002>	END (FAIL) - Cookbook sre.hosts.reimage (exit_code=99) for host cloudcontrol2004-dev.codfw.wmnet with OS bullseye	[production]
10:32	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Repooling after maintenance db2114', diff saved to https://phabricator.wikimedia.org/P48679 and previous config saved to /var/cache/conftool/dbconfig/20230601-103236-ladsgroup.json	[production]
10:17	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Repooling after maintenance db2114', diff saved to https://phabricator.wikimedia.org/P48678 and previous config saved to /var/cache/conftool/dbconfig/20230601-101730-ladsgroup.json	[production]
10:17	<aborrero@cumin2002>	END (PASS) - Cookbook sre.dns.netbox (exit_code=0)	[production]
10:17	<aborrero@cumin2002>	END (PASS) - Cookbook sre.puppet.sync-netbox-hiera (exit_code=0) generate netbox hiera data: "Triggered by cookbooks.sre.dns.netbox: cloudcontrol2004-dev.private.codfw.wikimedia.cloud - aborrero@cumin2002"	[production]
10:16	<aborrero@cumin2002>	START - Cookbook sre.puppet.sync-netbox-hiera generate netbox hiera data: "Triggered by cookbooks.sre.dns.netbox: cloudcontrol2004-dev.private.codfw.wikimedia.cloud - aborrero@cumin2002"	[production]
10:14	<aborrero@cumin2002>	START - Cookbook sre.dns.netbox	[production]
10:02	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Repooling after maintenance db2114 (T336886)', diff saved to https://phabricator.wikimedia.org/P48677 and previous config saved to /var/cache/conftool/dbconfig/20230601-100224-ladsgroup.json	[production]
10:00	<ladsgroup@cumin1001>	dbctl commit (dc=all): 'Depooling db2114 (T336886)', diff saved to https://phabricator.wikimedia.org/P48676 and previous config saved to /var/cache/conftool/dbconfig/20230601-100011-ladsgroup.json	[production]
10:00	<ladsgroup@cumin1001>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 12:00:00 on db2114.codfw.wmnet with reason: Maintenance	[production]
09:59	<ladsgroup@cumin1001>	START - Cookbook sre.hosts.downtime for 12:00:00 on db2114.codfw.wmnet with reason: Maintenance	[production]
09:56	<moritzm>	installing systemd security updates on bullseye	[production]
09:53	<Amir1>	ladsgroup@mwmaint1002:~$ foreachwikiindblist group2 extensions/AbuseFilter/maintenance/MigrateActorsAF.php (T336224)	[production]
09:52	<gehel>	cleaning apt archives on an-test-worker1002: `sudo apt-get clean`, recovering 14G	[production]
09:49	<cmooney@cumin2002>	START - Cookbook sre.hosts.reimage for host cloudcontrol2004-dev.codfw.wmnet with OS bullseye	[production]
09:43	<cmooney@cumin2002>	END (PASS) - Cookbook sre.hardware.upgrade-firmware (exit_code=0) upgrade firmware for hosts ['cloudcontrol2004-dev']	[production]
09:36	<cmooney@cumin2002>	START - Cookbook sre.hardware.upgrade-firmware upgrade firmware for hosts ['cloudcontrol2004-dev']	[production]
09:36	<cmooney@cumin2002>	END (FAIL) - Cookbook sre.hardware.upgrade-firmware (exit_code=99) upgrade firmware for hosts ['cloudcontrol2004-dev']	[production]
09:35	<cmooney@cumin2002>	START - Cookbook sre.hardware.upgrade-firmware upgrade firmware for hosts ['cloudcontrol2004-dev']	[production]
09:32	<volans>	installed spicerack v7.2.0 on cumin2002	[production]
09:30	<aborrero@cumin2002>	END (ERROR) - Cookbook sre.hosts.reimage (exit_code=97) for host cloudcontrol2004-dev.codfw.wmnet with OS bullseye	[production]
09:21	<elukey@cumin1001>	END (PASS) - Cookbook sre.ganeti.reboot-vm (exit_code=0) for VM kafka-test1010.eqiad.wmnet	[production]
09:18	<godog>	remove lv prometheus-global - T288196	[production]
09:17	<elukey@cumin1001>	START - Cookbook sre.ganeti.reboot-vm for VM kafka-test1010.eqiad.wmnet	[production]
09:17	<elukey@cumin1001>	END (PASS) - Cookbook sre.ganeti.reboot-vm (exit_code=0) for VM kafka-test1009.eqiad.wmnet	[production]
09:16	<volans@cumin1001>	END (PASS) - Cookbook sre.hosts.dhcp (exit_code=0) for host sretest1001.eqiad.wmnet	[production]
09:16	<volans@cumin1001>	START - Cookbook sre.hosts.dhcp for host sretest1001.eqiad.wmnet	[production]
09:13	<elukey@cumin1001>	START - Cookbook sre.ganeti.reboot-vm for VM kafka-test1009.eqiad.wmnet	[production]
09:12	<volans>	installed spicerack v7.2.0 on cumin1001	[production]
09:11	<elukey@cumin1001>	END (PASS) - Cookbook sre.ganeti.reboot-vm (exit_code=0) for VM kafka-test1008.eqiad.wmnet	[production]
09:07	<elukey@cumin1001>	START - Cookbook sre.ganeti.reboot-vm for VM kafka-test1008.eqiad.wmnet	[production]
09:06	<elukey@cumin1001>	END (PASS) - Cookbook sre.ganeti.reboot-vm (exit_code=0) for VM kafka-test1007.eqiad.wmnet	[production]
09:02	<elukey@cumin1001>	START - Cookbook sre.ganeti.reboot-vm for VM kafka-test1007.eqiad.wmnet	[production]
09:01	<elukey@cumin1001>	END (PASS) - Cookbook sre.ganeti.reboot-vm (exit_code=0) for VM kafka-test1006.eqiad.wmnet	[production]