Firmwareupdate HoHo
David Lutz
kpanic at ff3l.net
Di Jul 11 01:01:20 CEST 2017
Morgen Jonas,
Also mir wurde jedenfalls von einem Downgrade per automatischem Update abgeraten.
Du kannst es gerne versuchen, aber mir war das Risiko zu hoch, die komplette Community zu bricken. So scheint es jetzt zwar auch leider fast 2/3 der Router gekostet zu haben, jedoch sollte nach einem Neustart alles wieder funktionieren. Das Problem ist, dass der Autoupdater wegen RAM-Mangels abbricht bevor der Router rebootet wird. Da der Autoupdater zu Beginn alle Dienste stoppt hängt er dann dadurch leider bis zum manuellen Powercycle in einem undefinierten Zustand ohne Verbindung in der Luft.
In der 2017.1.1 ist der RAM füllende Bug behoben und die Multicast-Optimierungen deaktiviert. Du hast also die Wahl ;)
Gruß
David
> Am 11.07.2017 um 00:52 schrieb sjw at gmx.ch:
>
> Hallo David
>
> Danke für die Warnung!
> Die 2017.1 wurde für das 3land offiziell ja noch nicht auf stable
> freigegeben. Ich habe die neuen Router dennoch immer damit geflasht,
> weil via Downloadseite verfügbar. Was empfiehlst du nun als Lösung für
> diese Knoten: Ein manuelles Update auf 2017.1.1 oder ein Downgrade auf
> die 2016.2.6 oder die v2016.2.5?
>
> Lg
> Jonas
>
>
> Am 11.07.2017 um 00:10 schrieb David Lutz via ff3l:
>> Hallo liebe Mitfunkende!
>>
>> Wie der eine oder andere schon gemerkt hat haben wir seit dem Update auf 2017.1 massive Performance- und Stabilitätsprobleme im Hochrhein-Hotzenwald-Netz.
>>
>> Schon kurz nach dem Update hat sich herausgestellt, dass ein Bug in der Firmware eine bestimmte Charge der Ubiquiti Picostation brickt.
>> Zudem stürzt ein Dienst in Gluon sehr häufig ab und schreibt mit Fehlerprotokollen den Arbeitsspeicher voll, bis irgendwann der Router aus Speichermangel neu startet.
>> Nun hat sich auch noch herauskristallisiert, dass ein Bug in Batman-Adv (unserem Mesh-Protokoll) quasi zu einem DDOS unseres Netzes führt, indem aufgrund eines Prüfsummenfehlers immer wieder ein Router eine ganze Welle lostritt. Normalerweise erfährt jeder Router von seinen direkten Nachbarn die Route über die jeder andere Router erreichbar ist. Durch diesen Bug schlägt das fehl, so dass jeder Router diesem Router die komplette Nachbarschaftstabelle sendet. Dadurch entstehen dermaßen hohe Paketraten, dass das Netz sporadisch fast unbenutzbar wird.
>> Dieses Problem lässt sich bis zur Behebung des Bugs im Batman-Protokoll nur dadurch beheben, dass die Multicast-Optimierung deaktiviert wird.
>> Die Gluon-Entwickler haben daher ziemlich zügig eine gefixte Version nachgelegt, Version 2017.1.1.
>> Leider genügt es, wenn nur ein einziger Router diese Optimierung noch aktiviert hat, durch die Vervielfachung des Traffics über die restlichen Knoten das gesamte Netz auszubremsen. Daher müssen wir schleunigst zusehen, dass alle Knoten die noch mit 2017.1.0 laufen aktualisiert werden.
>> Wir haben daher ziemlich kurzfristig die Firmware heute signiert und fürs automatische Update freigegeben.
>>
>> Leider kann es aufgrund der obengenannten Problematik mit dem Vollschreiben des Speichers bei den Knoten dazu führen, dass der Knoten nach dem Update nicht sauber neu startet.
>> Falls euer Knoten also nach dem Update nicht mehr funktionieren sollte, einfach den Neustart von Hand durchführen, sprich den Router kurz vom Strom nehmen.
>>
>> Ich bitte darum, die Unannehmlichkeiten zu verzeihen…
>>
>> Liebe Grüße
>> David
>
>
Mehr Informationen über die Mailingliste ff3l