production SAL

2101-2150 of 10000 results (98ms)

2024-07-02 §
10:34	<btullis@cumin1002>	END (PASS) - Cookbook sre.hosts.reboot-single (exit_code=0) for host an-master1003.eqiad.wmnet	[production]
10:32	<brouberol@cumin1002>	END (PASS) - Cookbook sre.k8s.reboot-nodes (exit_code=0) rolling reboot on A:dse-k8s-worker	[production]
10:28	<fabfur>	upgrading A:cp-eqiad to haproxy 2.8.10 (T367756)	[production]
10:27	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on A:cp-text_eqiad	[production]
10:27	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on A:cp-upload_eqiad	[production]
10:25	<btullis@cumin1002>	START - Cookbook sre.hosts.reboot-single for host an-master1003.eqiad.wmnet	[production]
10:06	<jynus@cumin1002>	dbctl commit (dc=all): 'Repool es1025 at 100% weight T363812', diff saved to https://phabricator.wikimedia.org/P65645 and previous config saved to /var/cache/conftool/dbconfig/20240702-100636-jynus.json	[production]
10:02	<claime>	homer 'crcodfw' commit 'T351074'	[production]
09:53	<jiji@cumin1002>	conftool action : set/pooled=no; selector: name=kubemaster200[1-2].codfw.wmnet	[production]
09:52	<elukey>	volatile dir on puppetserver1001 with the new point release (12.6) for Bookworm	[production]
09:48	<jiji@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2 days, 0:00:00 on kubemaster[2001-2002].codfw.wmnet with reason: decom	[production]
09:47	<jiji@cumin1002>	START - Cookbook sre.hosts.downtime for 2 days, 0:00:00 on kubemaster[2001-2002].codfw.wmnet with reason: decom	[production]
09:20	<brouberol@cumin1002>	START - Cookbook sre.k8s.reboot-nodes rolling reboot on A:dse-k8s-worker	[production]
09:15	<jynus@cumin1002>	dbctl commit (dc=all): 'Repool es1025 at 50% weight T363812', diff saved to https://phabricator.wikimedia.org/P65644 and previous config saved to /var/cache/conftool/dbconfig/20240702-091508-jynus.json	[production]
08:57	<jynus@cumin1002>	dbctl commit (dc=all): 'Repool es1025 at 10% weight T363812', diff saved to https://phabricator.wikimedia.org/P65643 and previous config saved to /var/cache/conftool/dbconfig/20240702-085733-jynus.json	[production]
08:44	<marostegui@cumin1002>	dbctl commit (dc=all): 'Depooling db1197 (T367856)', diff saved to https://phabricator.wikimedia.org/P65642 and previous config saved to /var/cache/conftool/dbconfig/20240702-084447-marostegui.json	[production]
08:44	<marostegui@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 1 day, 0:00:00 on db1197.eqiad.wmnet with reason: Maintenance	[production]
08:44	<marostegui@cumin1002>	START - Cookbook sre.hosts.downtime for 1 day, 0:00:00 on db1197.eqiad.wmnet with reason: Maintenance	[production]
08:44	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1188 (T367856)', diff saved to https://phabricator.wikimedia.org/P65641 and previous config saved to /var/cache/conftool/dbconfig/20240702-084425-marostegui.json	[production]
08:40	<fabfur@cumin1002>	END (PASS) - Cookbook sre.cdn.roll-upgrade-haproxy (exit_code=0) rolling upgrade of HAProxy on P{cp6009.*} and A:cp	[production]
08:38	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on P{cp6009.*} and A:cp	[production]
08:36	<fabfur@cumin1002>	END (PASS) - Cookbook sre.cdn.roll-upgrade-haproxy (exit_code=0) rolling upgrade of HAProxy on A:cp-text_magru	[production]
08:34	<hashar@deploy1002>	rebuilt and synchronized wikiversions files: group0 wikis to 1.43.0-wmf.12 refs T366957	[production]
08:34	<fabfur@cumin1002>	END (PASS) - Cookbook sre.cdn.roll-upgrade-haproxy (exit_code=0) rolling upgrade of HAProxy on A:cp-upload_magru	[production]
08:30	<jayme@cumin1002>	conftool action : set/pooled=inactive; selector: name=kubernetes1051.eqiad.wmnet	[production]
08:29	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1188', diff saved to https://phabricator.wikimedia.org/P65640 and previous config saved to /var/cache/conftool/dbconfig/20240702-082918-marostegui.json	[production]
08:22	<fabfur@cumin1002>	END (PASS) - Cookbook sre.cdn.roll-upgrade-haproxy (exit_code=0) rolling upgrade of HAProxy on P{cp2031.*} and A:cp	[production]
08:20	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on P{cp2031.*} and A:cp	[production]
08:17	<fabfur@cumin1002>	END (PASS) - Cookbook sre.cdn.roll-upgrade-haproxy (exit_code=0) rolling upgrade of HAProxy on P{cp2030.*} and A:cp	[production]
08:16	<jayme@deploy1002>	helmfile [codfw] DONE helmfile.d/admin 'apply'.	[production]
08:15	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on P{cp2030.*} and A:cp	[production]
08:15	<jayme@deploy1002>	helmfile [codfw] START helmfile.d/admin 'apply'.	[production]
08:14	<fabfur@cumin1002>	END (PASS) - Cookbook sre.cdn.roll-upgrade-haproxy (exit_code=0) rolling upgrade of HAProxy on P{cp2028.*} and A:cp	[production]
08:14	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1188', diff saved to https://phabricator.wikimedia.org/P65639 and previous config saved to /var/cache/conftool/dbconfig/20240702-081411-marostegui.json	[production]
08:13	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on P{cp2028.*} and A:cp	[production]
08:12	<fabfur@cumin1002>	END (PASS) - Cookbook sre.cdn.roll-upgrade-haproxy (exit_code=0) rolling upgrade of HAProxy on P{cp2027.*} and A:cp	[production]
08:11	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on P{cp2027.*} and A:cp	[production]
08:10	<marostegui@cumin1002>	dbctl commit (dc=all): 'Depooling db2173 (T364069)', diff saved to https://phabricator.wikimedia.org/P65638 and previous config saved to /var/cache/conftool/dbconfig/20240702-081025-marostegui.json	[production]
08:10	<marostegui@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2 days, 0:00:00 on db2186.codfw.wmnet with reason: Maintenance	[production]
08:10	<marostegui@cumin1002>	START - Cookbook sre.hosts.downtime for 2 days, 0:00:00 on db2186.codfw.wmnet with reason: Maintenance	[production]
08:10	<marostegui@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 1 day, 0:00:00 on db2173.codfw.wmnet with reason: Maintenance	[production]
08:09	<marostegui@cumin1002>	START - Cookbook sre.hosts.downtime for 1 day, 0:00:00 on db2173.codfw.wmnet with reason: Maintenance	[production]
08:09	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db2170 (T364069)', diff saved to https://phabricator.wikimedia.org/P65637 and previous config saved to /var/cache/conftool/dbconfig/20240702-080948-marostegui.json	[production]
08:07	<jayme>	draining kubernetes1051.eqiad.wmnet	[production]
08:07	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on A:cp-text_magru	[production]
08:06	<fabfur@cumin1002>	START - Cookbook sre.cdn.roll-upgrade-haproxy rolling upgrade of HAProxy on A:cp-upload_magru	[production]
08:01	<jayme>	cordon kubernetes1051.eqiad.wmnet because of several failed image pulls	[production]
07:59	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1188 (T367856)', diff saved to https://phabricator.wikimedia.org/P65635 and previous config saved to /var/cache/conftool/dbconfig/20240702-075904-marostegui.json	[production]
07:58	<kharlan@deploy1002>	Finished scap: Backport for [[gerrit:1051246\|Revert "QuickSurveys: Add testing survey configuration" (T368459)]] (duration: 41m 45s)	[production]
07:54	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db2170', diff saved to https://phabricator.wikimedia.org/P65634 and previous config saved to /var/cache/conftool/dbconfig/20240702-075440-marostegui.json	[production]