Re: Η κυβέρνηση θα δαπανήσει εκ. ευρώ για ιδιόκτητο λογισμικό

Sat Nov 3 10:51:33 EET 2012

2012/11/3 P. Christeas <xrg at linux.gr>:
> Από τη δική μας τσέπη (και ακόμα περισσότερο όσων από εμάς είμαστε ελεύθεροι
> επαγγελματίες) θα βγούν τα λεφτά για να πάνε στους μεγαλοεργολάβους.
> Και μετά, εμείς οι ίδιοι είμαστε που θα ξαναπάμε στις ουρές στις εφορίες και
> τα επιμελητήρια, που θα μας ζητήσουν να τρέχουμε με κωλόχαρτα στο χέρι από
> γραφείο σε γραφείο, επειδή αυτά τα έργα με το "ελληνικό OCR" και προδιαγραφές
> ISO 34.000.000 θα έχουν μείνει στο στάδιο του "cloud" (δηλ. αιθέρα κοπανιστό).

FWIW με λίγο καλό προγραμματισμό (planning) το ελληνικό OCR θα μπορούσε
να δουλεύει με open source engines (ocropus / tesseract / gamera και
παρελκόμενα)
αν τα layouts αρκετών εγγράφων τυποποιηθούν (υπάρχουν δηλ. κατάλληλα templates)
και με κάποια extra δουλειά σε "προπόνηση" (τόσο ως προς γλωσσικά
μοντέλα όσο και
στο οπτικό κομμάτι, κυρίως μοντέλα για whitespace και diacritics).

Απλά είναι το είδος της δουλειάς που χρειάζεται 5-10 άτομα που έχουν ιδέα
από το αντικείμενο να ασχοληθούν σοβαρά για να υπάρχουν αποτελέσματα
π.χ. σε ένα εξάμηνο.

Ξέρω ότι εκτός από εμένα υπάρχει τουλάχιστον άλλος ένας που έχει παίξει
λίγο πιο σοβαρά με ocropus και tesseract αλλά δυστυχώς δεν έχω βρει
ακόμα τα στοιχεία του για να επικοινωνήσω μαζί του :P

Αντίστοιχα και με τη δουλειά για αναγνώριση ομιλίας / υποβοηθούμενη
απομαγνητοφώνηση για ελληνικά, αλλά εδώ εκτιμώ ότι η δουλειά που
χρειάζεται είναι περισσότερη (τουλάχιστον 2-3 μήνες για την πρώτη
alpha έκδοση ενός command & control συστήματος πάνω στο Simon
+ CMU Sphinx για παράδειγμα).

Όπως και να 'χει, προσωπικά προσπαθώ να ασχοληθώ με αυτά
ακόμα και 1 ώρα το μήνα αν υπάρχει διαθέσιμη, απλά τώρα
η πρόοδος είναι πολύυυυ αργή ...

Χαιρετισμούς,
Παντελής