Периодический отвал интерфейсов

Обсуждение ПО и его настройки
Ответить
Kosmich564
Сообщения: 11
Зарегистрирован: 14 мар 2018, 09:27
Откуда: Волгоград
Контактная информация:

Добрый день коллеги.

Всю голову уже сломал. У клиента стоит микротик hEX Lite.
На 1 порт подключен PoE инжектор радиоантенны провайдера.
На 2 порт - коммутатор D-Link на 8 портов. К нему уже клиенты.

Периодически, примерно 1 раз в 3-4 часа, в логах маршрутизатора появляются записи, что оба интерфейса Down. И 1й и 2й. Через секунду, оба интерфейса поднимаются обратно. Такое может повторяться несколько раз подряд. Потом перерыв на несколько часов. При этом, сам роутер не перезагружается. Включено всё в одну переноску. Скрин прилагаю.
Изображение

Грешил на брак маршрутизатора. Поменял. Поставил точно такой же. На нём проблема тоже повторяется. У меня на столе такой проблемы нет.
Версия rOS - 6.41.2. Такая же проблема была на 6.41.1
HW offload выключал. Не помогает.

Подскажите, куда копнуть. Идей уже нет.


Аватара пользователя
Vlad-2
Модератор
Сообщения: 2531
Зарегистрирован: 08 апр 2016, 19:19
Откуда: Петропавловск-Камчатский (п-ов Камчатка)
Контактная информация:

1) поменяйте WAN-порт, 1й скажем на 4й?
2) принудительно отключите автосогласование по Ethernet и жёстко выставите 100Мбит (для всех подключаемых портов)
3) На столе проблемы нету именно с этим же роутером или с другим/другой модели?
4) Я бы прошил с нуля (не обновил), а именно прошил NetInstall'ом
5) Антена провайдерская как себя чувствует? Питание у неё стабильно
5.1) а питание роутера нормально тоже?
6) а если отключить всё, воткнуть ноутбук к роутеру и просто ничего не делать - тишина в логах будет долгой/постоянной?
6.1) воткнуть потом только свитч локальный и опять обождать?
6.2) включите защиту от петель (на всех портах Ethernet) и посмотрите, вдруг прилетает что-то откуда-то?



На работе(ах): 2xCCR1016-12G, RB3011UiAS и hAP lite (RB941)
Дома: CCR1016-12G, RBcAP2n (standalone), RB wAP LTE kit
Для тестов(под рукой): RB3011UiAS, hAP mini (RB931) и что-то ещё по мелочи
MTCNA
MTCRE
Kosmich564
Сообщения: 11
Зарегистрирован: 14 мар 2018, 09:27
Откуда: Волгоград
Контактная информация:

Vlad-2 писал(а): 15 мар 2018, 17:11 1) поменяйте WAN-порт, 1й скажем на 4й?
Попробую.
Vlad-2 писал(а): 15 мар 2018, 17:11 2) принудительно отключите автосогласование по Ethernet и жёстко выставите 100Мбит (для всех подключаемых портов)
Сделал.
Vlad-2 писал(а): 15 мар 2018, 17:11 3) На столе проблемы нету именно с этим же роутером или с другим/другой модели?
Именно с этим. Оба роутера, что ставились клиенту, на столе ведут себя прекрасно. У клиента - нет.
Vlad-2 писал(а): 15 мар 2018, 17:11 4) Я бы прошил с нуля (не обновил), а именно прошил NetInstall'ом
Попробую.
Vlad-2 писал(а): 15 мар 2018, 17:11 5) Антена провайдерская как себя чувствует? Питание у неё стабильно
5.1) а питание роутера нормально тоже?
Жалоб не было. Но гарантировать не могу. Если рубится питание, из-за гонявого сетевого фильтра, то МикроТИК тоже вырубался бы...
Vlad-2 писал(а): 15 мар 2018, 17:11 6) а если отключить всё, воткнуть ноутбук к роутеру и просто ничего не делать - тишина в логах будет долгой/постоянной?
6.1) воткнуть потом только свитч локальный и опять обождать?
На территории клиента не пробовал. У меня на столе всё прекрасно в любой конфигурации.
Vlad-2 писал(а): 15 мар 2018, 17:11 6.2) включите защиту от петель (на всех портах Ethernet) и посмотрите, вдруг прилетает что-то откуда-то?
Включил принудительно.

Спасибо за советы. Буду наблюдать. Отпишусь по результатам.


Аватара пользователя
Vlad-2
Модератор
Сообщения: 2531
Зарегистрирован: 08 апр 2016, 19:19
Откуда: Петропавловск-Камчатский (п-ов Камчатка)
Контактная информация:

Если подходить инженерно, и отталкиваться что у Вас на столе всё работает,
а на объекте нет, то идёт ИЛИ не правильное подключение,
ИЛИ что-то подвешивает порты у роутера.
Если роутер не Вы подключаете, оставьте нужные порты явно,
остальные временно отключите (disable).

Идея смены WAN порта с 1-го на 4-й тут должна быть одной из первых,
как бы антена не мешала роутеру случайно в этой ситуации.

Ну и конфиг на всякий случай показать было бы не лишним...



На работе(ах): 2xCCR1016-12G, RB3011UiAS и hAP lite (RB941)
Дома: CCR1016-12G, RBcAP2n (standalone), RB wAP LTE kit
Для тестов(под рукой): RB3011UiAS, hAP mini (RB931) и что-то ещё по мелочи
MTCNA
MTCRE
Kosmich564
Сообщения: 11
Зарегистрирован: 14 мар 2018, 09:27
Откуда: Волгоград
Контактная информация:

Отчитываюсь. Сделал всё по предыдущему посту, кроме диагностики возможных проблем по электрике и полной перепрошивки NETInstall`ом.
WAN сменил с 1го на 5й сегодня днём. Теперь валятся 2 и 5 порты.
Неиспользуемые порты только что отключил.
Конфиг (адреса и пароли заменены на * ).

Код: Выделить всё

# mar/19/2018 17:25:41 by RouterOS 6.41.2
# software id = VLC8-8EKU
#
# model = RouterBOARD 750 r2
# serial number = **********
/interface bridge
add admin-mac=**:**:**:**:**:** auto-mac=no comment=defconf name=bridge
/interface ethernet
set [ find default-name=ether1 ] auto-negotiation=no disabled=yes \
    loop-protect=on
set [ find default-name=ether2 ] auto-negotiation=no loop-protect=on
set [ find default-name=ether3 ] disabled=yes
set [ find default-name=ether4 ] disabled=yes
/interface pptp-client
add comment=PPTP-Proizvodstvo connect-to=***.***.***.*** disabled=no name=\
    pptp-proizv password=*************** user=pptp-rk27
/interface list
add comment=defconf name=WAN
add comment=defconf name=LAN
/interface wireless security-profiles
set [ find default=yes ] supplicant-identity=MikroTik
/ip hotspot profile
set [ find default=yes ] html-directory=flash/hotspot
/ip pool
add name=default-dhcp ranges=192.168.101.20-192.168.101.200
/ip dhcp-server
add address-pool=default-dhcp disabled=no interface=bridge name=defconf
/snmp community
add addresses=0.0.0.0/0 name=*************
/interface bridge port
add bridge=bridge comment=defconf hw=no interface=ether2
add bridge=bridge comment=defconf hw=no interface=ether3
add bridge=bridge comment=defconf hw=no interface=ether4
/interface list member
add comment=defconf interface=bridge list=LAN
add comment=defconf interface=ether1 list=WAN
/ip address
add address=192.168.101.254/24 comment=defconf interface=bridge network=\
    192.168.101.0
add address=***.***.***.***/30 interface=ether1 network=***.***.***.***
add address=***.***.***.***/30 interface=ether5 network=***.***.***.***
/ip dhcp-client
add comment=defconf dhcp-options=hostname,clientid interface=ether1
/ip dhcp-server network
add address=192.168.101.0/24 comment=defconf gateway=192.168.101.254
/ip dns
set allow-remote-requests=yes servers=***.***.***.***,***.***.***.***
/ip dns static
add address=192.168.88.1 name=router.lan
/ip firewall filter
add action=accept chain=input comment="WinBox Remote Control" dst-port=8291 \
    protocol=tcp
add action=accept chain=input comment=\
    "defconf: accept established,related,untracked" connection-state=\
    established,related,untracked
add action=drop chain=input comment="defconf: drop invalid" connection-state=\
    invalid
add action=accept chain=input comment="defconf: accept ICMP" protocol=icmp
add action=drop chain=input comment="defconf: drop all not coming from LAN" \
    in-interface-list=!LAN
add action=accept chain=forward comment="defconf: accept in ipsec policy" \
    ipsec-policy=in,ipsec
add action=accept chain=forward comment="defconf: accept out ipsec policy" \
    ipsec-policy=out,ipsec
add action=fasttrack-connection chain=forward comment="defconf: fasttrack" \
    connection-state=established,related
add action=accept chain=forward comment=\
    "defconf: accept established,related, untracked" connection-state=\
    established,related,untracked
add action=drop chain=forward comment="defconf: drop invalid" \
    connection-state=invalid
add action=drop chain=forward comment=\
    "defconf:  drop all from WAN not DSTNATed" connection-nat-state=!dstnat \
    connection-state=new in-interface-list=WAN
/ip firewall nat
add action=masquerade chain=srcnat comment="defconf: masquerade" \
    ipsec-policy=out,none out-interface-list=WAN
/ip route
add distance=1 gateway=***.***.***.***
add distance=1 dst-address=192.168.0.0/23 gateway=192.168.10.1
/snmp
set enabled=yes location=RTR.RK27 trap-community=**************** \
    trap-interfaces=all trap-version=2
/system clock
set time-zone-autodetect=no time-zone-name=Europe/Volgograd
/system identity
set name=MT-RK27
/tool mac-server
set allowed-interface-list=LAN
/tool mac-server mac-winbox
set allowed-interface-list=LAN


Аватара пользователя
Vlad-2
Модератор
Сообщения: 2531
Зарегистрирован: 08 апр 2016, 19:19
Откуда: Петропавловск-Камчатский (п-ов Камчатка)
Контактная информация:

1) пункт 6.1 из моего первого сообщения делали?
2) а что за адресация на первом порту? Я так понимаю 1й порт сейчас у нас пока что свободный?
2.1) также уберите из IP-DHCP Client чтобы первый порт не ждал/случайно не получил от чего-либо адрес
3) ну и всё же, я бы очистил просто роутер, без заливки заводской прошивки (такие глюки бывают)
и уже на чистый роутер набрал конфигурацию руками.....

P.S.
Совет№4: подключите антенну через маленький свитч к роутеру, может реально глюк?
На столе у Вас нет антенны действующей, а тут антенну подключаете и начинается...
странно что ещё и второй порт валится....

В логах синим цветом про петлю не было сообщений? И защиту от петель лучше включить
на всех портах, таймаут отключения можно с 5-и минут поставить на 2-минуты, думаю
5 минут ждать не нужно в данном случаи.

Вопрос: а почему я в конфигурации не вижу вообще ничего про 5-й порт?
Ни его объявление, ни комментарий к нему? Только адрес задан и всё.
В начале конфига не вижу строки с упоминанием про ether5 ???? Странно всё...

С закрытием адресов переборщили, надо было часть последнюю оставить,
ибо по конфигу не понятно что за адресация, также не понятно что за шлюз 192.168.10.1
через который Вы хотите дойти до сети 192.168.0.0/23
Кстати маска /23, надеюсь с другими сетями перехлёста нету?
А с сетью антенны?

Всё же анализ надо делать по пунктам и даже с паузами и смотреть.
А не все сразу мои советы за раз. :-)



На работе(ах): 2xCCR1016-12G, RB3011UiAS и hAP lite (RB941)
Дома: CCR1016-12G, RBcAP2n (standalone), RB wAP LTE kit
Для тестов(под рукой): RB3011UiAS, hAP mini (RB931) и что-то ещё по мелочи
MTCNA
MTCRE
Kosmich564
Сообщения: 11
Зарегистрирован: 14 мар 2018, 09:27
Откуда: Волгоград
Контактная информация:

Vlad-2 писал(а): 19 мар 2018, 18:08 1) пункт 6.1 из моего первого сообщения делали?
Нет такой возможности. Нет возможности оставить офис без работы на несколько часов. К сожалению.
Vlad-2 писал(а): 19 мар 2018, 18:08 2) а что за адресация на первом порту? Я так понимаю 1й порт сейчас у нас пока что свободный?
2.1) также уберите из IP-DHCP Client чтобы первый порт не ждал/случайно не получил от чего-либо адрес
Остатки прошлой конфигурации)) Да, порт физически отключен. DHCP клиент выключен изначально.
Vlad-2 писал(а): 19 мар 2018, 18:08 3) ну и всё же, я бы очистил просто роутер, без заливки заводской прошивки (такие глюки бывают)
и уже на чистый роутер набрал конфигурацию руками.....
Чует моя чуйка, так и буду пробовать.
Vlad-2 писал(а): 19 мар 2018, 18:08 P.S.
Совет№4: подключите антенну через маленький свитч к роутеру, может реально глюк?
На столе у Вас нет антенны действующей, а тут антенну подключаете и начинается...
странно что ещё и второй порт валится....
Вот это точно надо попробовать)
Vlad-2 писал(а): 19 мар 2018, 18:08 В логах синим цветом про петлю не было сообщений? И защиту от петель лучше включить
на всех портах, таймаут отключения можно с 5-и минут поставить на 2-минуты, думаю
5 минут ждать не нужно в данном случаи.
Неа. Не было. Защита от петель включена. На 5м порту стояло default. Включил принудительно.
Vlad-2 писал(а): 19 мар 2018, 18:08 Вопрос: а почему я в конфигурации не вижу вообще ничего про 5-й порт?
Ни его объявление, ни комментарий к нему? Только адрес задан и всё.
В начале конфига не вижу строки с упоминанием про ether5 ???? Странно всё...
Комментов не ставил. Почему нет объявления - сам не понимаю.
Vlad-2 писал(а): 19 мар 2018, 18:08 ...также не понятно что за шлюз 192.168.10.1 через который Вы хотите дойти до сети 192.168.0.0/23
Кстати маска /23, надеюсь с другими сетями перехлёста нету?
А с сетью антенны?
Шлюз 10.1 - это Local Address pptp туннеля со стороны сервера. Статичный адрес, а не из пула.
С другими сетями перехлёста нет. А вот с сетью антенны - не знаю. Постараюсь выяснить.
Vlad-2 писал(а): 19 мар 2018, 18:08 Всё же анализ надо делать по пунктам и даже с паузами и смотреть.
А не все сразу мои советы за раз. :-)
Что-то я так накинулся) Еле остановил себя))) Рублю с плеча, можно сказать))


Kosmich564
Сообщения: 11
Зарегистрирован: 14 мар 2018, 09:27
Откуда: Волгоград
Контактная информация:

Могу сказать, что наметились подвижки.
Вчера, у клиента выключали свет в офисе. После возобновления электроснабжения (возможно просто совпало) перестал отваливаться LAN порт. Теперь валится только WAN. Скрин во вложении.
Изображение
С предыдущего поста больше ничего не делал. Ни перепрошивки, ни установки маленького свитча в разрыв антенны и роутера.
С чем связаны изменения понять не могу.


Kosmich564
Сообщения: 11
Зарегистрирован: 14 мар 2018, 09:27
Откуда: Волгоград
Контактная информация:

Проблема решена. Спасибо большое за советы!
Причина была в Длинковском свитче. Он что-то фонил, видать сильно. В итоге сдох, потянув за собой 2 порт МикроТИКа. Свитч заменён, отвалы прекратились.


Аватара пользователя
romsandj
Сообщения: 143
Зарегистрирован: 17 янв 2017, 08:27
Откуда: Ростовская область

Практически аналогичная проблема.
Стоит Wi-Fi мост на SXT Lite 5 (4 года трудится на благо), из ST (station) в WAN RB951G
Всё работает уже длительное время, однако на точках (исходя из соображения "работает - не трогай") прошивка 5.25. На RB951 - последняя 6.41.3, на нём поднимется РРРоЕ до прова. В какое то время начал наблюдать частые разрывы РРРоЕ и длительное восстановление авторизации. Изначально грешил на провайдера, даже предъяву выкатил. Пришел чел, посмотрел все, грит всё у нас нормально - это у вас проблемы. (Ну это всем известная отговорка провайдеров, так что мне не привыкать) Но я настоял, чтобы мой линк перекинули на другой порт их коммутатора.
Я начал изучать логи всех своих устройств. И обнаружил именно такое же поведение моей точки (ST) как описано у ТС - просто в логах запись "Ethernet1 down" и через секунду - "Ethrnet1 up" Естественно, в логах RB951 в это время сразу идет разрыв РРРоЕ.
Изучая все логи, пытаясь понять причину разрыва обратил внимание, что сам линк между точками не падает, а падет только ethernet интерфейс и именно на секунду. Особой зависимости (отчего это может происходить) не заметил. Перешивать точки на полс. прошивки не стал (моя точка на крыше то доступна, а вот удаленная точка - с ней проблемы. Доступ то к ней есть, но там особая ситуация. Вобщем думал я думал и ..... решил просто заменить БП от своей точки. Родной микротиковский откинул, а воткнул старенький на 15В блок питания.
Прошло 2 недели. Проблема исчезла. Ethernet-порт не падает.


Я бы изменил мир, но Бог не даёт исходники...
Обладатель Mikrotik RB951G-2HnD, RB751U-2HnD, hAP Lite (RB941-2nD), SXT Lite 5 (RBSXT5nD)
Ответить