본문 바로가기

분류 전체보기

(12)
log, logrt 개요: 로그 파일에서 원하는 검출 문구 패턴을 지정하여, 해당 문구 패턴이 들어간 로그 발생 시 값을 수집한다. 아이템 키: log[file,regexp,encoding,maxlines,mode,output,maxdelay,options,persistent_dir]                 logrt[file_pattern,regexp,encoding,maxlines,mode,maxdelay,options,persisten_dir] agent는 log의 마지막 수정 시간과 파일 크기를 추적하여 데이터베이스에 저장하고 이 두 Counter(*the time counter, the size counter)를 기준으로 로그를 분석한다.log 파일이 이전에 추적한 크기보다 작아지면, 크기 counter가 0..
active check configuration update from [x.x.x.x:10051] started to fail (...) 메시지: active check configuration update from [x.x.x.x:10051] started to fail (...) 원인수집 서버로 부터 agent(Client)가 수집해야할 Active 아이템 목록을 갱신 받는 데 실패한 경우. 종류 '자빅스 에이전트 (액티브)'. 즉, Active 아이템은 Trapping 방식의 아이템 수집으로 알려져 있지만, 단순히 agent(Client)가 무작정 Active 아이템 값을 수집하여 Zabbix Server(혹은 Proxy)로 전송하는 방식은 아니다. agent는 Active 아이템을 수집하기 위해 먼저 zabbix_agentd.conf 내의 파라미터인 RefreshActiveChecks=  에 지정된 갱신 간격 마다 수집 서버(Zab..
...item [item] on host [host] failed: first network error, wait for 15 seconds. 메시지: ...item [item] on host [host] failed: first network error, wait for 15 seconds. 원인Zabbix Server(혹은 Proxy) 로그에서 발견되는 메시지로, Slow query... 및 insert 관련 로그를 다수 동반하는 데이터 수집 처리 병목 현상.과도한 Zabbix Queue가 집계되며 Queue가 적재 경과 시간을 옮겨가며 무한 루프를 돌기 시작한다.수집 서버는 아이템 값이 수신되지 않으면 갱신 간격 동안 수집을 대기하다가 갱신 간격 시간이 경과하면 다시 수집을 시도한 뒤 경과 시간을 계산하기 때문에, Queue 경과 시간이 무한 루프를 돌기 시작하면 'N분 이상' Queue에서 일시적으로 수가 급락하여 해소된 듯 보이나, 갱..
active check configuration update from [x.x.x.x:10051] started to fail (cannot connect to [[x.x.x.x]:10051]: (null)) 메시지: active check configuration update from [x.x.x.x:10051] started to fail (cannot connect to [[x.x.x.x]:10051]: (null)) 원인agent(Client)에서 확인되는 log로, 수집 서버로 부터 agent가 수집할 Active(Trapping) 아이템 목록을 갱신받는 데 실패하는 메시지지만, 뒤의 null 값이 온다면 네트워크 접근 문제. null 값이 위치하는 자리에는 원래 Connection refused 등 접근 실패 원인 메시지가 출력되지만,null로 출력되는 경우는 주로 Hub나 Switch의 라우팅 테이블에 정책이 없어 Packet이 수집 서버까지 도달하지 못하는 것으로, agent(Client) 호스..
failed to accept an incoming connection 메시지: failed to accept an incoming connection: connection from "x.x.x.1" rejected, allowed hosts: "x.x.x.2" 원인agent의 log에 남는 메시지로, Connection을 시도하는 Zabbix Server(혹은 Proxy) IP는 x.x.x.1, agent에 설정된 Zabbix Server(혹은 Proxy) IP는 x.x.x.2 인 경우이다.요구 사항agent의 zabbix_agentd.conf 내 Zabbix Server(혹은 Proxy) 정보 변경agent의 zabbix_agentd.conf 내 Server= 영역에 접근을 시도하는 수집 서버의 IP를 설정한 뒤, 저장 후 agent 재기동하여 정상화.
no route to host 메시지: cannot connect to [x.x.x.x[10050]]: [113] No route to host 원인네트워크 경로 혹은 접근 경로를 못찾는 경우요구 사항Client 호스트 내 포트 사용 가능 여부(방화벽 등) 및 Zabbix agent 상태 확인실제 route 문제 보다는 다음의 경우가 많다.1. zabbix agent 기동 여부 확인zabbix agent 혹은 OS가 미기동 중인 경우. 기동 여부를 확인한다.2. agent(Client) 호스트의 방화벽, 즉 OS 상의 방화벽에 의한 10050 포트 차단 여부 확인 리눅스의 firewalld 등 OS 방화벽이 Active(running) 상태인 지 확인한다, firewalld 사용이 불가피 하다면 정책을 추가해야 한다.
dropped connection because of access permission 메시지: Received empty response from Zabbix Agent at[x.x.x.x]. Assuming that agent dropped connection because of access permissions. 원인Zabbix Server(혹은 Proxy)에서 Zabbix 웹페이지에 등록된 호스트 인터페이스 IP로 접근 시도 시 agent의 Zabbix Server 정보 설정 누락으로 인해 발생되는 경우요구 사항 agent의 zabbix_agentd.conf 내 Zabbix Server(혹은 Proxy) 정보 설정agent 호스트의 zabbix_agentd.conf 안의 Server= 영역에 수집을 시도하는 Zabbix Server(혹은 Proxy)의 IP를 정확히 기재 후 저장한 ..
permission denied 메시지: zabbix_get permission denied 혹은 Cannot open file "/var/log/messages": [13] Permission denied 등 원인Zabbix가 데이터를 수집하려는 대상에 대한 권한 부족으로(주로 root권한 파일) 접근 제한된 경우Zabbix agent는 zabbix 계정으로 실행되는 것이 default 설정이기 때문이다.요구 사항zabbix 계정에 root 권한 부여 혹은 root로 agent 기동1. zabbix_agent (3.x) 버전에서 설정하기 zabbix_agentd.conf 내 AllowRoot가 있는 영역을 검색### Option:  AllowRoot#            Allow the server t orun as 'root'. ..