production SAL

1951-2000 of 10000 results (55ms)

2022-05-03 §
13:25	<Lucas_WMDE>	UTC afternoon backport window done	[production]
13:25	<jynus@cumin1001>	START - Cookbook sre.hosts.downtime for 2:00:00 on backup1002.eqiad.wmnet with reason: host reimage	[production]
13:22	<mvernon@cumin1001>	START - Cookbook sre.hosts.reimage for host ms-be2043.codfw.wmnet with OS bullseye	[production]
13:21	<mwdebug-deploy@deploy1002>	helmfile [codfw] DONE helmfile.d/services/mwdebug: apply	[production]
13:20	<lucaswerkmeister-wmde@deploy1002>	Synchronized wmf-config/InitialiseSettings.php: Config: [[gerrit:788356\|Use "unexpectedUnconnectedPage" page prop everywhere]] (duration: 00m 51s)	[production]
13:20	<mwdebug-deploy@deploy1002>	helmfile [codfw] START helmfile.d/services/mwdebug: apply	[production]
13:20	<mwdebug-deploy@deploy1002>	helmfile [eqiad] DONE helmfile.d/services/mwdebug: apply	[production]
13:14	<lucaswerkmeister-wmde@deploy1002>	Synchronized wmf-config/InitialiseSettings.php: Config: [[gerrit:747196\|Remove unused maps event stream (T293366)]] (duration: 01m 04s)	[production]
13:13	<mwdebug-deploy@deploy1002>	helmfile [eqiad] START helmfile.d/services/mwdebug: apply	[production]
13:09	<jynus@cumin1001>	START - Cookbook sre.hosts.reimage for host backup1002.eqiad.wmnet with OS bullseye	[production]
13:08	<jynus@cumin1001>	END (ERROR) - Cookbook sre.hosts.reimage (exit_code=97) for host backup1002.eqiad.wmnet with OS bullseye	[production]
13:08	<jynus@cumin1001>	END (FAIL) - Cookbook sre.hosts.reimage (exit_code=99) for host backup1002.eqiad.wmnet with OS bullseye	[production]
13:08	<jynus@cumin1001>	START - Cookbook sre.hosts.reimage for host backup1002.eqiad.wmnet with OS bullseye	[production]
13:04	<herron@cumin1001>	END (PASS) - Cookbook sre.hosts.reboot-single (exit_code=0) for host logstash2026.codfw.wmnet	[production]
13:03	<herron@cumin1001>	END (PASS) - Cookbook sre.hosts.reboot-single (exit_code=0) for host logstash1026.eqiad.wmnet	[production]
12:58	<herron@cumin1001>	START - Cookbook sre.hosts.reboot-single for host logstash2026.codfw.wmnet	[production]
12:58	<herron@cumin1001>	START - Cookbook sre.hosts.reboot-single for host logstash1026.eqiad.wmnet	[production]
12:57	<vgutierrez>	rolling downgrade of HAProxy to version 2.4.15 on upload - T307444	[production]
10:58	<vgutierrez>	rolling downgrade of HAProxy to version 2.4.15 on text - T307444	[production]
10:57	<jbond>	restrict ports allowed via squid	[production]
10:46	<vgutierrez>	downgrade haproxy 2.4 package to version 2.4.15 on apt.wm.o (buster-wikimedia)	[production]
09:47	<dcaro@cumin1001>	END (PASS) - Cookbook sre.hosts.reboot-single (exit_code=0) for host clouddb2001-dev.codfw.wmnet	[production]
09:40	<dcaro@cumin1001>	START - Cookbook sre.hosts.reboot-single for host clouddb2001-dev.codfw.wmnet	[production]
09:38	<gehel>	resetting BMC on relforge1003 and relforge1004 - https://wikitech.wikimedia.org/wiki/Management_Interfaces#From_local_IPMI	[production]
09:32	<vgutierrez>	rolling upgrade of HAProxy in eqiad	[production]
09:14	<marostegui>	Disable puppet on clouddb1013 clouddb1016 clouddb1020 T305974	[production]
09:14	<marostegui>	Disable puppet on clouddb1013 clouddb1016 clouddb1020T305974	[production]
09:11	<mwdebug-deploy@deploy1002>	helmfile [codfw] DONE helmfile.d/services/mwdebug: apply	[production]
09:05	<mwdebug-deploy@deploy1002>	helmfile [codfw] START helmfile.d/services/mwdebug: apply	[production]
09:05	<mwdebug-deploy@deploy1002>	helmfile [eqiad] DONE helmfile.d/services/mwdebug: apply	[production]
08:58	<mwdebug-deploy@deploy1002>	helmfile [eqiad] START helmfile.d/services/mwdebug: apply	[production]
08:51	<hashar@deploy1002>	Finished scap: testwikis wikis to 1.39.0-wmf.10 refs T305216 (duration: 30m 44s)	[production]
08:47	<elukey@cumin1001>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host ores2001.codfw.wmnet with OS buster	[production]
08:44	<vgutierrez>	rolling upgrade of HAProxy in esams	[production]
08:29	<dcaro@cumin1001>	END (PASS) - Cookbook sre.hosts.reboot-single (exit_code=0) for host cloudmetrics1002.eqiad.wmnet	[production]
08:28	<mwdebug-deploy@deploy1002>	helmfile [codfw] DONE helmfile.d/services/mwdebug: apply	[production]
08:27	<mwdebug-deploy@deploy1002>	helmfile [codfw] START helmfile.d/services/mwdebug: apply	[production]
08:27	<mwdebug-deploy@deploy1002>	helmfile [eqiad] DONE helmfile.d/services/mwdebug: apply	[production]
08:26	<mwdebug-deploy@deploy1002>	helmfile [eqiad] START helmfile.d/services/mwdebug: apply	[production]
08:24	<dcaro@cumin1001>	START - Cookbook sre.hosts.reboot-single for host cloudmetrics1002.eqiad.wmnet	[production]
08:21	<hashar@deploy1002>	Started scap: testwikis wikis to 1.39.0-wmf.10 refs T305216	[production]
08:14	<hashar>	Starting MediaWiki train deployment using `scap stage-train 1.39.0-wmf.10` # T305216	[production]
08:04	<marostegui@cumin1001>	dbctl commit (dc=all): 'Repool db1132 T301879', diff saved to https://phabricator.wikimedia.org/P27350 and previous config saved to /var/cache/conftool/dbconfig/20220503-080421-marostegui.json	[production]
08:01	<elukey@cumin1001>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on ores2001.codfw.wmnet with reason: host reimage	[production]
07:57	<elukey@cumin1001>	START - Cookbook sre.hosts.downtime for 2:00:00 on ores2001.codfw.wmnet with reason: host reimage	[production]
07:33	<elukey@cumin1001>	START - Cookbook sre.hosts.reimage for host ores2001.codfw.wmnet with OS buster	[production]
07:21	<mwdebug-deploy@deploy1002>	helmfile [codfw] DONE helmfile.d/services/mwdebug: apply	[production]
07:20	<taavi>	UTC morning deploys done	[production]
07:20	<mwdebug-deploy@deploy1002>	helmfile [codfw] START helmfile.d/services/mwdebug: apply	[production]
07:20	<mwdebug-deploy@deploy1002>	helmfile [eqiad] DONE helmfile.d/services/mwdebug: apply	[production]