__all__ SAL

551-600 of 10000 results (22ms)

2025-01-23 §
15:49	<dhinus>	cumin 'P:base::cloud_production' 'rm /var/lib/prometheus/node.d/kernel-panic.prom' T382961	[admin]
15:48	<jhancock@cumin2002>	END (PASS) - Cookbook sre.network.configure-switch-interfaces (exit_code=0) for host db2189	[production]
15:48	<jhancock@cumin2002>	START - Cookbook sre.network.configure-switch-interfaces for host db2189	[production]
15:36	<kamila@cumin1002>	END (FAIL) - Cookbook sre.k8s.pool-depool-node (exit_code=99) pool for host wikikube-worker[1142-1147].eqiad.wmnet	[production]
15:36	<kamila@cumin1002>	START - Cookbook sre.k8s.pool-depool-node pool for host wikikube-worker[1142-1147].eqiad.wmnet	[production]
15:35	<brennen@deploy2002>	rebuilt and synchronized wikiversions files: group1 to 1.44.0-wmf.13 refs T382364	[production]
15:35	<kamila@cumin1002>	END (FAIL) - Cookbook sre.k8s.pool-depool-node (exit_code=99) pool for host wikikube-worker[1142-1147].eqiad.wmnet	[production]
15:35	<kamila@cumin1002>	START - Cookbook sre.k8s.pool-depool-node pool for host wikikube-worker[1142-1147].eqiad.wmnet	[production]
15:34	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1168', diff saved to https://phabricator.wikimedia.org/P72274 and previous config saved to /var/cache/conftool/dbconfig/20250123-153405-marostegui.json	[production]
15:32	<wmbot~dcaro@urcuchillay>	END (FAIL) - Cookbook wmcs.ceph.osd.undrain_node (exit_code=99)	[admin]
15:31	<kamila@cumin1002>	END (FAIL) - Cookbook sre.k8s.pool-depool-node (exit_code=99) pool for host wikikube-worker[1142-1147].eqiad.wmnet	[production]
15:31	<kamila@cumin1002>	START - Cookbook sre.k8s.pool-depool-node pool for host wikikube-worker[1142-1147].eqiad.wmnet	[production]
15:23	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host wikikube-worker1142.eqiad.wmnet with OS bookworm	[production]
15:21	<brennen>	1.44.0-wmf.13 train (T382364): unblocked, rolling to group1	[production]
15:18	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1168', diff saved to https://phabricator.wikimedia.org/P72273 and previous config saved to /var/cache/conftool/dbconfig/20250123-151858-marostegui.json	[production]
15:18	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host wikikube-worker1147.eqiad.wmnet with OS bookworm	[production]
15:15	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host wikikube-worker1143.eqiad.wmnet with OS bookworm	[production]
15:13	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host wikikube-worker1146.eqiad.wmnet with OS bookworm	[production]
15:12	<mforns>	[data lake temp accounts] re-ran DAG mediawiki_history_check_denormalized for 2024-12	[analytics]
15:11	<andrew@cloudcumin1001>	START - Cookbook wmcs.ceph.osd.drain_node	[admin]
15:11	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host wikikube-worker1145.eqiad.wmnet with OS bookworm	[production]
15:06	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host wikikube-worker1144.eqiad.wmnet with OS bookworm	[production]
15:04	<wmbot~dcaro@urcuchillay>	START - Cookbook wmcs.ceph.osd.undrain_node	[admin]
15:04	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on wikikube-worker1142.eqiad.wmnet with reason: host reimage	[production]
15:03	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1168 (T384592)', diff saved to https://phabricator.wikimedia.org/P72272 and previous config saved to /var/cache/conftool/dbconfig/20250123-150351-marostegui.json	[production]
14:59	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on wikikube-worker1147.eqiad.wmnet with reason: host reimage	[production]
14:57	<andrew@cloudcumin1001>	END (PASS) - Cookbook wmcs.ceph.osd.undrain_node (exit_code=0)	[admin]
14:57	<andrew@cloudcumin1001>	START - Cookbook wmcs.ceph.osd.undrain_node	[admin]
14:56	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on wikikube-worker1143.eqiad.wmnet with reason: host reimage	[production]
14:55	<marostegui@cumin1002>	dbctl commit (dc=all): 'Depooling db1168 (T384592)', diff saved to https://phabricator.wikimedia.org/P72271 and previous config saved to /var/cache/conftool/dbconfig/20250123-145540-marostegui.json	[production]
14:55	<marostegui@cumin1002>	DONE (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 10:00:00 on db1168.eqiad.wmnet with reason: Maintenance	[production]
14:55	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1165 (T384592)', diff saved to https://phabricator.wikimedia.org/P72270 and previous config saved to /var/cache/conftool/dbconfig/20250123-145518-marostegui.json	[production]
14:53	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on wikikube-worker1146.eqiad.wmnet with reason: host reimage	[production]
14:53	<bking@cumin2002>	START - Cookbook sre.elasticsearch.rolling-operation Operation.REBOOT (1 nodes at a time) for ElasticSearch cluster cloudelastic: demonstration - bking@cumin2002 - T380752	[production]
14:50	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on wikikube-worker1145.eqiad.wmnet with reason: host reimage	[production]
14:47	<raymond-ndibe@cloudcumin1001>	END (FAIL) - Cookbook wmcs.toolforge.component.deploy (exit_code=99) for component jobs-api	[tools]
14:46	<jmm@cumin2002>	END (PASS) - Cookbook sre.ganeti.drain-node (exit_code=0) for draining ganeti node ganeti2022.codfw.wmnet	[production]
14:46	<kamila@cumin1002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on wikikube-worker1144.eqiad.wmnet with reason: host reimage	[production]
14:44	<raymond-ndibe@cloudcumin1001>	START - Cookbook wmcs.toolforge.component.deploy for component jobs-api	[tools]
14:43	<kamila@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on wikikube-worker1147.eqiad.wmnet with reason: host reimage	[production]
14:43	<kamila@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on wikikube-worker1146.eqiad.wmnet with reason: host reimage	[production]
14:43	<kamila@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on wikikube-worker1145.eqiad.wmnet with reason: host reimage	[production]
14:43	<kamila@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on wikikube-worker1143.eqiad.wmnet with reason: host reimage	[production]
14:42	<kamila@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on wikikube-worker1142.eqiad.wmnet with reason: host reimage	[production]
14:42	<kamila@cumin1002>	START - Cookbook sre.hosts.downtime for 2:00:00 on wikikube-worker1144.eqiad.wmnet with reason: host reimage	[production]
14:40	<marostegui@cumin1002>	dbctl commit (dc=all): 'Repooling after maintenance db1165', diff saved to https://phabricator.wikimedia.org/P72269 and previous config saved to /var/cache/conftool/dbconfig/20250123-144011-marostegui.json	[production]
14:39	<raymond-ndibe@cloudcumin1001>	END (FAIL) - Cookbook wmcs.toolforge.component.deploy (exit_code=99) for component jobs-api	[tools]
14:39	<vgutierrez>	updating acme-chief on acmechief1002	[production]
14:33	<root@cumin1002>	END (PASS) - Cookbook sre.hosts.reimage (exit_code=0) for host db1239.eqiad.wmnet with OS bookworm	[production]
14:32	<raymond-ndibe@cloudcumin1001>	START - Cookbook wmcs.toolforge.component.deploy for component jobs-api	[tools]