monitorare la causa dell'errore bluescreen (codice 124)

Ho avuto problemi con un computer porttile a schermo azure (BCCode 124) e ho cercato di individuare ciò che ha causato. (È bluescreened casualmente dopo 5-30 minuti di esecuzione in win7). Ha funzionato in modalità provvisoria. Ho provato a reinstallare Windows, che non funzionava, quindi ho provato ad installare diversi sisthemes Linux che anche non funzionavano.

L'unica cosa che funziona proprio ora è la versione magica divisa del cd di avvio finale (è un distro di riparazione Linux che viene eseguito dal vivo)

Ho avuto l'idea di eseguire una serie di prove di stabilità per cercare di isolare i componenti difettosi e ho voluto un po 'di input sui miei risultati.

Ho fatto diversi test di stress per diversi momentjs. Nessun problema (temerature ~ 60 ° C a volte picchi a 65)

Ho eseguito memtest senza errori molte volte.

Ho anche fatto un controllo GPU che è incluso nel disco di avvio finale – ha distrutto la distro magico – nessun problema.

Ho anche controllato il disco rigido con diversi strumenti inclusi nella magia divisa – anche nessun problema.

Ogni sistema di linux cerco di installare i crash quando provo ad installarlo. (O si blocca senza alcun errore (raramente succede) o mi viene qualcosa di simile poco dopo che lo dico di installare (provato circa 20 differenti distros): [*] 3 foto nella casella di andata

Cercando di isntall windows 7 solo dà un generico "c'è stato un problema" / "un errore si è verificato" schermo senza ulteriori informazioni.

Il porttile è un Lenovo B570. Ecco le specifiche di sistema dettagliate (il ram è ora un Kingston da 4 GB) [*] il file di hardinfo nella casella di dropbox

Ho 3 crashdumps da Windows che non posso aprire. (lo studio visivo dice che non può aprire vecchi file crashdump) [*] 3 discariche nella dropbox

Puoi aiutarmi a rintracciare la causa?

Modifica: non posso submit più di 2 link qui, quindi qui il dropboxfolder con tutte le cose che ho menzionato:

[*] https://www.dropbox.com/sh/f5v1tojm72js4nm/AADmKa0ahEi036ynHBXJUtDQa?dl=0

Si ottiene un errore GCACHEL2_EVICT_ERR (errore di cache di livello 2 durante un evento di espulsione della cache).

 0: kd> !errrec fffffa800966a038 =============================================================================== Common Platform Error Record @ fffffa800966a038 ------------------------------------------------------------------------------- Record Id : 01d0f21d97143e24 Severity : Fatal (1) Length : 873 Creator : Microsoft Notify Type : Machine Check Exception Timestamp : 9/18/2015 14:25:03 (UTC) Flags : 0x00000000 =============================================================================== Section 0 : Memory ------------------------------------------------------------------------------- Descriptor @ fffffa800966a0b8 Section @ fffffa800966a190 Offset : 344 Length : 73 Flags : 0x00000001 Primary Severity : Fatal Physical Addr.: 0x000000023c175dc0 =============================================================================== Section 1 : Processor Generic ------------------------------------------------------------------------------- Descriptor @ fffffa800966a100 Section @ fffffa800966a1d9 Offset : 417 Length : 192 Flags : 0x00000000 Severity : Fatal Proc. Type : x86/x64 Instr. Set : x64 Error Type : Cache error Operation : Generic Flags : 0x00 Level : 2 CPU Version : 0x00000000000206a7 Processor ID : 0x0000000000000000 =============================================================================== Section 2 : x86/x64 MCA ------------------------------------------------------------------------------- Descriptor @ fffffa800966a148 Section @ fffffa800966a299 Offset : 609 Length : 264 Flags : 0x00000000 Severity : Fatal Error : GCACHEL2_EVICT_ERR (Proc 0 Bank 5) Status : 0xfe2000000001117a Address : 0x000000023c175dc0 Misc. : 0x000000372e004086 

Cercare un aggiornamento del BIOS, se questo non lo risolve, la cache L2 è danneggiata e dovrai sostituire la CPU.

Da Microsoft (enfasi mine):

Il controllo di bug WHEA_UNCORRECTABLE_ERROR ha un valore di 0x00000124. Questo controllo di errore indica che si è verificato un errore hardware ferito .

Questo, in combinazione con il fatto che non è ansible eseguire o installare la maggior parte degli altri sisthemes operativi che stai tentando, mi dice che hai sicuramente un errore hardware di qualche tipo.

Le probabilità di essere un "errore della CPU" sono sottili, poiché le CPU sono una delle componenti less probabili di malfunzionamento; Più probabile che un problema della scheda madre causa gli errori correlati alla CPU – ma è fondamentalmente imansible dirlo senza sostituire e testare i componenti.

Indipendentemente da where si inizia, si dovrebbe iniziare a risolvere il problema hardware, un componente alla volta. ad esempio: Drives, RAM, PSU, scheda madre, CPU, in (fondamentalmente) quell'ordine.

Sono venuto qui per dire che ive è riuscito a fare funzionare linux con il startparametro maxcores = 1 (la sua cpu a 2 core).

Grazie per aver aiutato tutti, mi hai risparmiato 200 dollari!

Quindi, se qualcuno ha questo errore e non ha voglia di riparare hardware / acquisto di nuovi, get linux su di esso. Installare con quel parametro e aggiungere questo parametro ai parametri di default di grub.

Sarebbe interessante testare la CPU con la cache L2 disabilitata (e con l'altro nucleo abilitato di nuovo) ma questo è un livello completamente diverso.