production SAL

1651-1700 of 10000 results (100ms)

2024-12-03 §
19:00	<bking@cumin2002>	START - Cookbook sre.wdqs.data-transfer (T376150, initialize wdqs internal main tier) xfer wikidata_main from wdqs2021.codfw.wmnet -> wdqs2018.codfw.wmnet w/ force delete existing files, repooling source-only afterwards	[production]
18:59	<bking@cumin2002>	END (FAIL) - Cookbook sre.wdqs.data-transfer (exit_code=99) (T376150, initialize wdqs internal main tier) xfer scholarly_articles from wdqs2021.codfw.wmnet -> wdqs2018.codfw.wmnet, repooling source-only afterwards	[production]
18:58	<bking@cumin2002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 4:00:00 on wdqs2027.codfw.wmnet with reason: T376150	[production]
18:58	<bking@cumin2002>	START - Cookbook sre.hosts.downtime for 4:00:00 on wdqs2027.codfw.wmnet with reason: T376150	[production]
18:56	<bking@cumin2002>	START - Cookbook sre.wdqs.data-transfer (T376150, initialize wdqs internal main tier) xfer scholarly_articles from wdqs2021.codfw.wmnet -> wdqs2018.codfw.wmnet, repooling source-only afterwards	[production]
18:49	<ryankemper@deploy2002>	Finished deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-main host (duration: 00m 14s)	[production]
18:49	<ryankemper@deploy2002>	Started deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-main host	[production]
18:47	<ryankemper@deploy2002>	Finished deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-main host (duration: 00m 14s)	[production]
18:47	<ryankemper@deploy2002>	Started deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-main host	[production]
18:43	<ryankemper@deploy2002>	Finished deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-main host (duration: 03m 31s)	[production]
18:40	<ryankemper@deploy2002>	Started deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-main host	[production]
18:39	<ryankemper@deploy2002>	Finished deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-scholarly host (duration: 00m 11s)	[production]
18:39	<ryankemper@deploy2002>	Started deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-scholarly host	[production]
18:39	<ryankemper@deploy2002>	Finished deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-scholarly host (duration: 00m 11s)	[production]
18:39	<ryankemper@deploy2002>	Started deploy [wdqs/wdqs@9927a5a]: deploy to fresh wdqs-internal-scholarly host	[production]
18:35	<jelto@cumin1002>	END (PASS) - Cookbook sre.k8s.pool-depool-node (exit_code=0) pool for host wikikube-worker[1034-1035].eqiad.wmnet	[production]
18:35	<jelto@cumin1002>	START - Cookbook sre.k8s.pool-depool-node pool for host wikikube-worker[1034-1035].eqiad.wmnet	[production]
18:22	<jelto>	homer 'creqiad' commit 'T377876'	[production]
18:11	<jelto@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host wikikube-worker1035.eqiad.wmnet with OS bookworm	[production]
18:00	<jclark@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host ms-be1091.eqiad.wmnet with OS bullseye	[production]
18:00	<jclark@cumin1002>	END (PASS) - Cookbook sre.puppet.sync-netbox-hiera (exit_code=0) generate netbox hiera data: "Triggered by cookbooks.sre.hosts.reimage: Host reimage - jclark@cumin1002"	[production]
17:57	<hnowlan@deploy1003>	helmfile [codfw] DONE helmfile.d/admin 'apply'.	[production]
17:57	<hnowlan@deploy1003>	helmfile [codfw] START helmfile.d/admin 'apply'.	[production]
17:57	<hnowlan@deploy1003>	helmfile [eqiad] DONE helmfile.d/admin 'apply'.	[production]
17:56	<hnowlan@deploy1003>	helmfile [eqiad] START helmfile.d/admin 'apply'.	[production]
17:52	<jelto@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on wikikube-worker1035.eqiad.wmnet with reason: host reimage	[production]
17:50	<bking@cumin2002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 4:00:00 on wdqs2026.codfw.wmnet with reason: T376150	[production]
17:50	<bking@cumin2002>	START - Cookbook sre.hosts.downtime for 4:00:00 on wdqs2026.codfw.wmnet with reason: T376150	[production]
17:48	<jelto@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on wikikube-worker1035.eqiad.wmnet with reason: host reimage	[production]
17:47	<brett@puppetserver1001>	conftool action : set/pooled=yes; selector: dc=magru,service=cdn,name=cp7001.magru.wmnet	[production]
17:46	<brett>	Removing RSA certificate support from haproxy/cp (T370837)	[production]
17:38	<jclark@cumin1002>	START - Cookbook sre.puppet.sync-netbox-hiera generate netbox hiera data: "Triggered by cookbooks.sre.hosts.reimage: Host reimage - jclark@cumin1002"	[production]
17:32	<jelto@cumin1002>	START - Cookbook sre.hosts.reimage for host wikikube-worker1035.eqiad.wmnet with OS bookworm	[production]
17:30	<jelto@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host wikikube-worker1034.eqiad.wmnet with OS bookworm	[production]
17:20	<jclark@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on ms-be1091.eqiad.wmnet with reason: host reimage	[production]
17:17	<jclark@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on ms-be1091.eqiad.wmnet with reason: host reimage	[production]
17:11	<jelto@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on wikikube-worker1034.eqiad.wmnet with reason: host reimage	[production]
17:08	<jelto@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on wikikube-worker1034.eqiad.wmnet with reason: host reimage	[production]
17:07	<jclark@cumin1002>	START - Cookbook sre.hosts.reimage for host ms-be1091.eqiad.wmnet with OS bullseye	[production]
16:58	<jclark@cumin1002>	END (PASS) - Cookbook sre.hosts.provision (exit_code=0) for host ms-be1091.mgmt.eqiad.wmnet with chassis set policy FORCE_RESTART	[production]
16:52	<brett@puppetserver1001>	conftool action : set/pooled=no; selector: dc=magru,service=cdn,name=cp7001.magru.wmnet	[production]
16:51	<sbisson@deploy2002>	helmfile [ml-staging-codfw] 'sync' command on namespace 'recommendation-api-ng' for release 'main' .	[production]
16:51	<jelto@cumin1002>	START - Cookbook sre.hosts.reimage for host wikikube-worker1034.eqiad.wmnet with OS bookworm	[production]
16:50	<urbanecm@deploy2002>	Finished scap sync-world: Backport for [[gerrit:1100142\|Revert "Increase Nuke max age to 90 days" (T380846)]] (duration: 12m 29s)	[production]
16:49	<jelto@cumin1002>	END (FAIL) - Cookbook sre.hosts.reimage (exit_code=99) for host wikikube-worker1034.eqiad.wmnet with OS bookworm	[production]
16:47	<jclark@cumin1002>	START - Cookbook sre.hosts.provision for host ms-be1091.mgmt.eqiad.wmnet with chassis set policy FORCE_RESTART	[production]
16:44	<jclark@cumin1002>	END (FAIL) - Cookbook sre.hosts.provision (exit_code=99) for host ms-be1091.mgmt.eqiad.wmnet with chassis set policy FORCE_RESTART	[production]
16:44	<jclark@cumin1002>	START - Cookbook sre.hosts.provision for host ms-be1091.mgmt.eqiad.wmnet with chassis set policy FORCE_RESTART	[production]
16:38	<urbanecm@deploy2002>	Started scap sync-world: Backport for [[gerrit:1100142\|Revert "Increase Nuke max age to 90 days" (T380846)]]	[production]
16:30	<brett>	Disabling puppet on A:cp to prep for RSA removal - T370837	[production]