production SAL

151-200 of 10000 results (110ms)

2025-04-25 §
13:47	<bking@cumin2002>	START - Cookbook sre.puppet.sync-netbox-hiera generate netbox hiera data: "Triggered by cookbooks.sre.dns.netbox: Renaming elastic2081 to cirrussearch2081 - bking@cumin2002"	[production]
13:46	<fceratto@cumin1002>	START - Cookbook sre.mysql.sanitize-wiki Managing sanitization for wikis nupwiki in section s5	[production]
13:45	<fceratto@cumin1002>	END (PASS) - Cookbook sre.mysql.sanitize-wiki (exit_code=0) Checking sanitization for wikis nupwiki in section s5	[production]
13:43	<taavi@cumin2002>	END (PASS) - Cookbook sre.hosts.reboot-single (exit_code=0) for host cloudlb2004-dev.codfw.wmnet	[production]
13:43	<fceratto@cumin1002>	START - Cookbook sre.mysql.sanitize-wiki Checking sanitization for wikis nupwiki in section s5	[production]
13:36	<fceratto@cumin1002>	END (FAIL) - Cookbook sre.mysql.sanitize-wiki (exit_code=99) Managing sanitization for wikis nupwiki in section s5	[production]
13:34	<taavi@cumin2002>	START - Cookbook sre.hosts.reboot-single for host cloudlb2004-dev.codfw.wmnet	[production]
13:33	<taavi>	add cloudlb2004-dev bgp session to cloudsw1-b1-codfw T377126	[production]
13:33	<bking@cumin2002>	START - Cookbook sre.dns.netbox	[production]
13:32	<bking@cumin2002>	START - Cookbook sre.hosts.rename from elastic2081 to cirrussearch2081	[production]
13:31	<fceratto@cumin1002>	START - Cookbook sre.mysql.sanitize-wiki Managing sanitization for wikis nupwiki in section s5	[production]
13:29	<fceratto@cumin1002>	END (PASS) - Cookbook sre.mysql.sanitize-wiki (exit_code=0) Checking sanitization for wikis nupwiki in section s5	[production]
13:26	<fceratto@cumin1002>	START - Cookbook sre.mysql.sanitize-wiki Checking sanitization for wikis nupwiki in section s5	[production]
13:08	<jmm@cumin2002>	END (FAIL) - Cookbook sre.hosts.reimage (exit_code=99) for host sretest1001.eqiad.wmnet with OS trixie	[production]
12:58	<vgutierrez>	restarting grafana-server.service @ grafana1002.eqiad.wmnet	[production]
11:53	<jmm@cumin2002>	END (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on sretest1001.eqiad.wmnet with reason: host reimage	[production]
11:49	<jmm@cumin2002>	START - Cookbook sre.hosts.downtime for 2:00:00 on sretest1001.eqiad.wmnet with reason: host reimage	[production]
11:31	<jmm@cumin2002>	START - Cookbook sre.hosts.reimage for host sretest1001.eqiad.wmnet with OS trixie	[production]
09:31	<moritzm>	restarting puppetserver on puppetserver1002 (apparently needs a restart which per timing seems related to https://gerrit.wikimedia.org/r/c/operations/puppet/+/1138904)	[production]
09:16	<vgutierrez>	restarting puppetserver on puppetserver1003	[production]
09:11	<taavi>	removed cloudlb2001-dev bgp session from cloudsw1-b1-codfw T377126	[production]
08:24	<marostegui@cumin1002>	dbctl commit (dc=all): 'Promote es2032 to es1 master T391921', diff saved to https://phabricator.wikimedia.org/P75463 and previous config saved to /var/cache/conftool/dbconfig/20250425-082420-marostegui.json	[production]
07:50	<taavi@cumin1002>	END (PASS) - Cookbook sre.hosts.reboot-single (exit_code=0) for host cloudlb2002-dev.codfw.wmnet	[production]
07:44	<jmm@cumin2002>	DONE (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 5:00:00 on krb1002.eqiad.wmnet with reason: work in progress, not yet active	[production]
07:38	<taavi@cumin1002>	START - Cookbook sre.hosts.reboot-single for host cloudlb2002-dev.codfw.wmnet	[production]
07:13	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 100%: Repooling', diff saved to https://phabricator.wikimedia.org/P75462 and previous config saved to /var/cache/conftool/dbconfig/20250425-071339-root.json	[production]
06:58	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 75%: Repooling', diff saved to https://phabricator.wikimedia.org/P75461 and previous config saved to /var/cache/conftool/dbconfig/20250425-065834-root.json	[production]
06:43	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 60%: Repooling', diff saved to https://phabricator.wikimedia.org/P75460 and previous config saved to /var/cache/conftool/dbconfig/20250425-064329-root.json	[production]
06:28	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 50%: Repooling', diff saved to https://phabricator.wikimedia.org/P75459 and previous config saved to /var/cache/conftool/dbconfig/20250425-062824-root.json	[production]
06:13	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 40%: Repooling', diff saved to https://phabricator.wikimedia.org/P75458 and previous config saved to /var/cache/conftool/dbconfig/20250425-061319-root.json	[production]
05:58	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 30%: Repooling', diff saved to https://phabricator.wikimedia.org/P75457 and previous config saved to /var/cache/conftool/dbconfig/20250425-055813-root.json	[production]
05:43	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 25%: Repooling', diff saved to https://phabricator.wikimedia.org/P75456 and previous config saved to /var/cache/conftool/dbconfig/20250425-054308-root.json	[production]
05:42	<marostegui@dns1006>	END - running authdns-update	[production]
05:39	<marostegui@dns1006>	START - running authdns-update	[production]
05:37	<marostegui@cumin1002>	dbctl commit (dc=all): 'Promote es1032 to es1 master T391921', diff saved to https://phabricator.wikimedia.org/P75455 and previous config saved to /var/cache/conftool/dbconfig/20250425-053744-marostegui.json	[production]
05:28	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 20%: Repooling', diff saved to https://phabricator.wikimedia.org/P75454 and previous config saved to /var/cache/conftool/dbconfig/20250425-052802-root.json	[production]
05:12	<marostegui@cumin1002>	dbctl commit (dc=all): 'es2030 (re)pooling @ 10%: Repooling', diff saved to https://phabricator.wikimedia.org/P75453 and previous config saved to /var/cache/conftool/dbconfig/20250425-051257-root.json	[production]
05:06	<marostegui@cumin1002>	DONE (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 2:00:00 on es2030.codfw.wmnet with reason: Maintenance	[production]
05:05	<marostegui@cumin1002>	dbctl commit (dc=all): 'Depool es2030 T391921', diff saved to https://phabricator.wikimedia.org/P75452 and previous config saved to /var/cache/conftool/dbconfig/20250425-050538-marostegui.json	[production]
2025-04-24 §
23:47	<pt1979@cumin2002>	END (PASS) - Cookbook sre.network.tls (exit_code=0) for network device lsw1-f1-codfw	[production]
23:47	<pt1979@cumin2002>	START - Cookbook sre.network.tls for network device lsw1-f1-codfw	[production]
23:42	<eileen>	config revision changed from 7bf2c087 to 1c84d1a7	[production]
23:32	<bking@cumin2002>	END (FAIL) - Cookbook sre.hosts.reimage (exit_code=99) for host cirrussearch2078.codfw.wmnet with OS bullseye	[production]
23:31	<rzl@deploy1003>	helmfile [eqiad] DONE helmfile.d/admin 'apply'.	[production]
23:30	<rzl@deploy1003>	helmfile [eqiad] START helmfile.d/admin 'apply'.	[production]
23:29	<rzl@deploy1003>	helmfile [codfw] DONE helmfile.d/admin 'apply'.	[production]
23:28	<rzl@deploy1003>	helmfile [codfw] START helmfile.d/admin 'apply'.	[production]
23:28	<rzl@deploy1003>	helmfile [staging-eqiad] DONE helmfile.d/admin 'apply'.	[production]
23:27	<rzl@deploy1003>	helmfile [staging-eqiad] START helmfile.d/admin 'apply'.	[production]
23:25	<rzl@deploy1003>	helmfile [staging-codfw] DONE helmfile.d/admin 'apply'.	[production]