Потеря линка на удаленном микротике и попытка понять что-то из логов

Обсуждение ПО и его настройки
Аватара пользователя
EIKA
Сообщения: 41
Зарегистрирован: 30 дек 2017, 21:59

Erik_U писал(а): 02 апр 2019, 15:43 Если роутер "зависает", то он и логи не пишет.
Пока его не перезагрузишь по питанию, или его вдруг не "отпустит".

Включите логирование температуры, загрузки процессора, памяти. Будет видно его состояние непосредственно перед паузой.
CPU load мониторится скриптом с отправкой в телеграм, и в среднем не превышает 5%, иногда скачки до 10%. Дело в том, что этот Микрот обслуживает 1 клиента на канале толщиной в 1Мбит/c, и загрузке там браться неоткуда.
В этой модели нет health-диагностики, и нет термодатчика в частности.


Bushi
Сообщения: 69
Зарегистрирован: 28 мар 2019, 08:40

Erik_U писал(а): 02 апр 2019, 15:43 Включите логирование температуры, загрузки процессора, памяти. Будет видно его состояние непосредственно перед паузой.
А научите, плз, как это сделать... :smu:sche_nie:


Аватара пользователя
Vlad-2
Модератор
Сообщения: 2531
Зарегистрирован: 08 апр 2016, 19:19
Откуда: Петропавловск-Камчатский (п-ов Камчатка)
Контактная информация:

EIKA писал(а): 02 апр 2019, 15:43 Теряется что? Вопрос как-то некорретно сформулирован, поэтому вас не понял.
Аптайм реальный и проблема со связью была в течение этого аптайма.
Если бы был ребут, то аптайм был бы маленьким. Таймер аптайма работает хорошо, и если перегрузить Микрота, то таймер начнет отсчет заново.
Ну тогда я не понимаю что Вы теряете или почему теряете этот промежуток, у меня такова не было,
я видел лишь что, если роутер ребутить неожиданно, то время у него на первых порах
при загрузке идёт "ложное", а потом синхронизируется и всё приходит в норму.

Других глюков со временем у меня не было, и с логами тоже.
Главное время, синхронизация и часовой пояс правильный.



На работе(ах): 2xCCR1016-12G, RB3011UiAS и hAP lite (RB941)
Дома: CCR1016-12G, RBcAP2n (standalone), RB wAP LTE kit
Для тестов(под рукой): RB3011UiAS, hAP mini (RB931) и что-то ещё по мелочи
MTCNA
MTCRE
Erik_U
Сообщения: 1768
Зарегистрирован: 09 июл 2014, 12:33

Если и связи нет, и логи не пишутся - микротик скорее всего завис.

Это может быть или перегрев, или просадка питания. Или другие внешние факторы. От конденсата до глушилок.
Как промониторить удаленное устройство без датчиков в конкретной модели - это уже вам придумывать.


Erik_U
Сообщения: 1768
Зарегистрирован: 09 июл 2014, 12:33

Bushi писал(а): 02 апр 2019, 15:54
Erik_U писал(а): 02 апр 2019, 15:43 Включите логирование температуры, загрузки процессора, памяти. Будет видно его состояние непосредственно перед паузой.
А научите, плз, как это сделать... :smu:sche_nie:
систем - логгинг - адд - хеалт. Можно еще в префиксе температуру указать. Или другое слово, с которого потом эти записи в логе будут начинаться.

https://wiki.mikrotik.com/wiki/Manual:System/Log
действие ( имя ; по умолчанию: память ) указывает одно из системных действий по умолчанию или указанное пользователем действие, указанное в меню действий
префикс ( строка ; по умолчанию:) добавлен префикс в начале сообщений журнала
разделы ( account, bfd, caps, ddns, dns, error, gsm, info, iscsi, l2tp, manager, ntp, пакет, pppoe, radvd, rip, script, smb, sstp, system, timer, vrrp, веб-прокси, async, bgp, сертификат, отладка, чувак, событие, точка доступа, интерфейс, isdn, ldp, mme, ospf, pim, pptp, raw, маршрут, sertcp, snmp, состояние, телефония, upnp, предупреждение, беспроводной, резервное копирование, calc, критический, dhcp, электронная почта, брандмауэр, igmp-прокси, ipsec, kvm, lte, mpls, ovpn, ppp, radius, read, rsvp, симулятор, ssh, store, tftp, ups, watchdog, write ; по умолчанию: info ) регистрировать все сообщения, которые попадают в указанную тему или список тем.
'!' символ может использоваться перед темой, чтобы исключить сообщения, подпадающие под эту тему. Например, мы хотим записать отладочную информацию NTP без лишних подробностей:
/system logging add topics=ntp,debug,!packet


Аватара пользователя
EIKA
Сообщения: 41
Зарегистрирован: 30 дек 2017, 21:59

Ребята, ну не сходится!

Ну как устройство может быть зависшим, если я на него захожу в любой момент, и лог в memory начинает идти после этого?
Конденсата никого нет, устройство стоит в серверном шкафу, там тепло и сухо.
В шкафу стоит 4 термодатчика, температура: 35-41 градус, в зависимости от места установки датчика внутри шкафа. Конечно, PCB микротика может быть разогретой, скажем, из-за дросселя на плате, и датчики это не увидят. Но вероятность этого мала. Скорее всего, внутри Микрота не выше 42 градусов при любом раскладе.
Причем тут глушики - вообще не понял. Да и какие глушилки, если устройство стоит в металлическом шкафу в круглосуточно закрытом помещении (со стеной в 60 см толщиной, с металлической дверью и без окон).


Erik_U
Сообщения: 1768
Зарегистрирован: 09 июл 2014, 12:33

Значит осталось проверить блок питания, если и он не виноват - поменять микротик.

Есть такой адрес - support@mikrotik.com.
Они сообщения даже на русском принимают.
У них по-любому побольше негативного опыта по микротикам. :)
Последний раз редактировалось Erik_U 02 апр 2019, 17:34, всего редактировалось 1 раз.


Аватара пользователя
EIKA
Сообщения: 41
Зарегистрирован: 30 дек 2017, 21:59

Vlad-2 писал(а): 02 апр 2019, 15:55 Ну тогда я не понимаю что Вы теряете или почему теряете этот промежуток, у меня такова не было,
я видел лишь что, если роутер ребутить неожиданно, то время у него на первых порах
при загрузке идёт "ложное", а потом синхронизируется и всё приходит в норму.
Я понял вашу проблему с первого раза. Но у меня, судя по аптайму и истории аптаймов, нет спонтанных ребутов. Только те, что инициировал я лично.


Аватара пользователя
EIKA
Сообщения: 41
Зарегистрирован: 30 дек 2017, 21:59

В общем, жду следующее падение линка, и веду логи типа remote. Сейчас то уж точно они не пропадут, да и наличие-отсуствие WAN-линка ни на что не влияет, так как syslog стоит в LAN.


Ответить