DMA errors... [solved (?)]

Giorgos Pallas gpall at ccf.auth.gr
Sat Dec 1 18:54:39 EET 2007


Giannis Stoilis wrote:
> On 11/27/07, Giorgos Pallas <gpall at ccf.auth.gr> wrote:
>   
>> Καλησπέρα, αν και για μένα δεν είναι τόσο καλή...
>>
>> Ίσως να θυμάστε πριν κάποιες μέρες που είχα ρωτήσει περί κάποιων DMA
>> errors που έβγαζε ο δίσκος μου. Την τρίτη φορά που μου κόλλησε το
>> σύστημα λόγω DMA errors, κατέβασα ένα utility της samsung (o δίσκος
>> είναι samsung) και αυτό έβγαλε λάθη σε κάποιους LBA. Αγοράζω λοιπόν ένα
>> άλλο δίσκο από το Πλαίσιο (μόνο samsung είχαν), τον βάζω, κάνω  restore
>> με το clonezilla (χθες αυτό), όλα φαίνονταν να παιζουν μια χαρά. Σήμερα
>> καθώς έκανα κάτι αντιγραφές αρχείων από τον δίσκο σε ένα εξωτερικό
>> δίσκο, ξανακολλάει για λίγο το σύστημα και βγαίνει στο syslog:
>>
>> Nov 27 21:57:27 mordor kernel: hda: dma_intr: status=0x51 { DriveReady
>> SeekComplete Error }
>> Nov 27 21:59:28 mordor kernel: hda: dma_intr: error=0x40 {
>> UncorrectableError }, LBAsect=146676286, high=8,
>> Nov 27 21:59:28 mordor kernel: ide: failed opcode was: unknown
>> Nov 27 21:59:28 mordor kernel: end_request: I/O error, dev hda, sector
>> 146675883
>> Nov 27 21:59:28 mordor kernel: hda: dma_intr: status=0x51 { DriveReady
>> SeekComplete Error }
>> Nov 27 21:59:28 mordor kernel: hda: dma_intr: error=0x40 {
>> UncorrectableError }, LBAsect=146676286, high=8,
>> Nov 27 21:59:28 mordor kernel: ide: failed opcode was: unknown
>> Nov 27 21:59:28 mordor kernel: end_request: I/O error, dev hda, sector
>> 146675891
>> κτλ κτλ...
>>
>> Καινούριος δίσκος... Πείτε καμιά γνώμη τί παίζει... Σατανική σύμπτωση
>> όπου ο καινούριος δίσκος είναι κάπως προβληματικός; Το clonezilla πήρε
>> τα προβληματικά sectors και τα αντέγραψε στον καινούριο; :-P  Έχει πάθει
>> κάτι ο controller του laptop; (κλάφτα χαράλαμπε...). Και να πεις ότι
>> άλλαξα kernel πρόσφατα και έχει κάποιο bug στο DMA; 2.6.22-2 έχω, και
>> τον έχω πολύ καιρό... DAMN!
>>     

Το ιστορικό εν τάχει: Βγάζει DMA προβλήματα ο δίσκος του φορητού. Του
τρέχω το διαγνωστικό της samsung, βρίσκει προβλημα και συνιστά low level
format. Κάνω low level format, ξανατρέχω το διαγνωστικό, τον βρίσκει ΟΚ.
Κάνω restore από clonezilla image, μετά από μια ημέρα αρχίζει τα ίδια.
Αγοράζω άλλο samsung. Κάνω restore πάλι στον καινούριο, μετά από μια
μέρα αρχίζει τα ίδια.


Όπως είπε και ο κόσμος της λίστας, παίζει να φταίει το m/b, o controller
ή κάτι τέτοιο. Βάζω τον παλιό δίσκο σε ένα usb2ide καλώδιο, τον βάζω σε
laptop με windows και τον φορμάρω σε ntfs. Γράφω ένα αρχείο 2 GB πάνω
του, κάνω md5sum, βγάζει ένα άσχετο με το σωστό. Ξανακάνω md5sum, βγάζει
ένα ακόμα πιο άσχετο. Την τρίτη φορά βγάζει άλλο πάλι (...). Αρα ο
παλιός δίσκος είναι tilt, και μένει το ερώτημα γιατί ο καινούριος έκανε
κι αυτός τα δικά του (με smartctl έδωσε:
# 3  Short offline       Completed: read failure       00%        
5         146676286
)

Το μόνο που μπορούσα να σκεφτώ είναι ότι το clonezilla παίζει σε τόσο
χαμηλό επίπεδο που αντέγραψε όταν έκανα backup τα 'bad sectors', oπότε
και με το restore στον καινούριο, του τα 'κόλλησε'. Έκανα λοιπόν στον
καινούριο ένα low level format, και του έκανα restore ένα image
παλιότερο που είχα. Έκτοτε ο καινούριος λειτουργεί μια χαρά...

Συμπεράσματα;

Γ.
-------------- next part --------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/x-pkcs7-signature
Size: 6261 bytes
Desc: S/MIME Cryptographic Signature
URL: <http://lists.hellug.gr/pipermail/linux-greek-users/attachments/20071201/55f30dae/attachment.bin>


More information about the Linux-greek-users mailing list