Dziwne restarty i wieszanie się pomimo że było OK

Początkujący
Posty: 3
Rejestracja: 28 września 2014
Reputacja: 0
Reputacja postu: 
0
Napiwki za post: 0 BTC

Dziwne restarty i wieszanie się pomimo że było OK

Postautor: alicea » poniedziałek, 29 stycznia 2018, 12:20

Cześć koledzy, może pomożecie mi zdiagnozować problem.

Miałam 2 osobne koparki na identycznych płytach głównych Fujitsu Siemens (starych, ale działających), w jednej karta 5870, a w drugiej 6870, w obu koparkach po 2 GB ramu, system Mint, Catalysty aktualne (sprzed roku). Przez rok ciągłej pracy nie było z nimi praktycznie żadnych problemów, kopały stare algorytmy (Blake, keccak, neoscrypt itp) i były prawdziwą petardą. Problem zaczął się w listopadzie 2017, właściwie z dnia na dzień, gdy z theblocksfactory.com (neoscrypt) zaczęłam przestawiać się na altminer.net (też neoscrypt). Zaczęły się wieszać mimo, że nic nie zmieniałam poza adresem kopalni, przełączanie się na inne kopalnie tylko częściowo rozwiązywało problem, więc zaczęłam podejrzewać coś więcej. Potrafiły pochodzić od kilku dni do kilku tygodni, i tak zleciał mi grudzień i pół stycznia. W pierwszej z nich, która bez powodu się wieszała i restartowała, w końcu stwierdziłam że chyba na pewno jest uszkodzona płyta główna (restartowała się w absurdalnych momentach, np. otwarcia okienka terminala albo edytora tekstowego, kości ram zostały wszystkie kilkakrotnie przetestowane i są OK). W drugiej (6870) wszystko się unormowało, jak zmieniłam kopalnię. W związku z tym, w tej pierwszej (5870) wywaliłam płytę, wzięłam kartę, zakupiłam większy zasilacz i z 2 koparek zrobiłam jedną (dwukartową). Prądu na pewno starcza, policzyłam ampery, zasilacz obciążony jest w ok. 80%. Odpalam kopanie w neoscrypcie, po 5-6 minutach zwiecha. Restartuję, odpalam ponownie, autorestart po 10 godzinach, uruchamiam ponownie, zwiecha po 4-5 godzinach. Początkowo sądziłam, że jest to wina altminer.net, bo dostawałam tam często masę błędów typu JSON authentication error lub innych kopalni, ale na innych koparkach problem z JSONem wyeliminowałam ustawieniami (wyłączeniem vardiffa) albo po prostu przełączając się na inne kopalnie. Praktycznie w tej chwili na jakiejkolwiek kopalni bym nie kopała, to występuje problem.
Częściowo jest to wina kopalń, bo zdarza mi się na innych koparkach też, że miner ni z gruszki ni z pietruszki się wyłączał i koparka stoi. Rozwiązałam ten problem dopisując do skryptu w bashu, który steruje kopaniem, prostą pętlę. Ale to rozwiązało problem na innych koparkach, gdzie stawał miner, a nie wieszały się.
Nie sądzę, że to całkowicie wina kopalni, bo gdyby tak było, to miner by sypał błędami lub się wyłączał, ale przecież nie restartowałby ani nie wieszałby całej maszyny. Mimo wszystko wcześniej był związek (przynajmniej w czasie) pomiędzy błędami JSON a wieszaniem innych koparek. Teraz jednak (głównie kopię na zpool) nie ma żadnych komunikatów błędu, a koparka wiesza się po kilku godzinach - tak jakby ustawienia kopania były złe. A ustawienia typu -gpu-threads -w itp są na pewno dobre (wnioskuję stąd że przez więcej niż rok były dobre). Dodam jeszcze że parę lat temu miałam wszystkie karty przetaktowane, ale odkąd w jednej zatarłam wiatraki, to wszystkie już chodzą na zegarach fabrycznych (i nie ma wielkiej różnicy w wydajności). Nie były też nigdy zmieniane napięcia. Aha: jak odpalałam testy samych kart, żeby sprawdzić czy nie są uszkodzone, to wyszło że są dobre.
Co sądzicie? Co jest winne? Co można jeszcze sprawdzić?

Wróć do „Pomoc”

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 4 gości