GPU CUDA error in CudaProgram.cu:465 : an illegal memory access was encountered

Początkujący
Awatar użytkownika
Posty: 23
Rejestracja: 29 listopada 2020
Reputacja: 1
Reputacja postu: 
0
Napiwki za post: 0 BTC

GPU CUDA error in CudaProgram.cu:465 : an illegal memory access was encountered

Postautor: technic-figure » wtorek, 16 marca 2021, 15:16

Ul z rtx wydobywał eth i nagle któregoś dnia na jednym GPU (fan auto na 46%, gpu temp w okolicach 57 stopnii):

kernel: NVRM: Xid (PCI:0000:0a:00): 13, pid=1226, Graphics SM Warp Exception on (GPC 5, TPC 5, SM 0): Misaligned Address
kernel: NVRM: Xid (PCI:0000:0a:00): 13, pid=1226, Graphics Exception: ESR 0x52ef30=0x506000f 0x52ef34=0x20 0x52ef28=0x4c1eb72 0x52ef2c=0x174
kernel: NVRM: Xid (PCI:0000:0a:00): 43, pid=3144, Ch 00000010
kernel: NVRM: Xid (PCI:0000:0a:00): 31, pid=3142, Ch 00000012, intr 00000000. MMU Fault: ENGINE GRAPHICS GPCCLIENT_T1_3 faulted @ 0x7f10_4c583000. Fault is of type FAULT_PDE ACCESS_TYPE_VIRT_READ

w minerze phoenix:

GPU1 CUDA error in CudaProgram.cu:465 : an illegal memory access was encountered (700)
GPU1 GPU1 search error: an illegal memory access was encountered
wdog Fatal error detected. Restarting.

Po restarcie invalid share prawie na dzień dobry i ponownie restart jak wyżej po jakiś 30-60 min. Zamiana kart miejscami (riser, zasilanie) i ponownie invalid i restart po 30-60 min. Demontaż karty i wszystko wróciło do normy.

Podejrzane GPU zamontowane na innej platformie bez riserów, też takie restarty. Zdjęcie oc pamięci do wartości domyślnych i zaczęło chodzić z +/- 1-2 invalid share na dobę. Po tygodniu znowu te restarty i teraz to już nic nie pomaga - domyślny zegar karty, nowszy ul (hiveos-0.6-200-beta@210303), nowszy sterownik nvidia, nowszy phoenix czy lolminer (tutaj komunikaty "GPU 0: Error during mining: Out of resources" i "GPU 0: will be stopped.").

Macie pomysł czy RMA?

Weteran
Awatar użytkownika
Posty: 1638
Rejestracja: 10 czerwca 2017
Reputacja: 360
Reputacja postu: 
0
Napiwki za post: 0 BTC

GPU CUDA error in CudaProgram.cu:465 : an illegal memory access was encountered

Postautor: tonyxxl » wtorek, 16 marca 2021, 15:23

karta się nie uruchamia na domyślnych ustawieniach na 2 różnych komputerach, do naprawy/reklamacji

Początkujący
Awatar użytkownika
Posty: 23
Rejestracja: 29 listopada 2020
Reputacja: 1
Reputacja postu: 
0
Napiwki za post: 0 BTC

GPU CUDA error in CudaProgram.cu:465 : an illegal memory access was encountered

Postautor: technic-figure » środa, 14 lipca 2021, 12:46

Informacyjnie, uszkodzona i zwrócili pieniądze (takie jednak wrażenie, że był to przypadek w którym "sklep przez który taka gwarancja przechodzi może całkowicie legalnie zatrzymać taką naprawioną kartę graficzną i zwrócić Wam pieniądze").

Wróć do „Kopanie GPU”

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 2 gości