Re: Σε διαβούλευση προκήρυξη για γιγάντιο έργο λογισμικού στο Δημόσιο

Pantelis Koukousoulas pktoss at gmail.com
Wed Dec 19 17:21:14 EET 2012


2012/12/19 Pantelis  Koukousoulas <pktoss at gmail.com>:
> Ένα πακέτο τέτοιου είδους μπορεί να φτιαχτεί και από ανοιχτού κώδικα
> components απλά χρειάζεται αρκετή δουλειά. Δε χρειάζεται όμως κάτι
> εξωπραγματικό όπως αυτόματη αναγνώριση ομιλίας με 0% error rate
> ή κάτι παρόμοιο.

Βασικά από την εμπειρία της ανάπτυξης σχετικού κώδικα για την κοπέλα
μου που κάνει απομαγνητοφώνηση συνεντεύξεων συχνά-πυκνά, με ένα
media player με global shortcuts έχεις ήδη αρκετό benefit με 0 κόστος
και cross-platform λειτουργία.

Το αμέσως επόμενο βήμα είναι Linux + USB πεταλάκι για start/pause
(που το αντιστοιχείς στα global shortcuts με udev rules) και μικρά features
του στυλ "γύρνα πίσω 5 δευτερόλεπτα κάθε φορά που πατάω pause".

Και το πιο σοφιστικέ είναι ότι εκμεταλλεύεσαι τις δυνατότητες του editor
ή office suite (vim / LibreOffice) για autosuggest και ελέγχους και συνεργάζεσαι
και με ένα σύστημα αναγνώρισης ομιλίας με μέτριο WER που θα δουλεύει
επικουρικά για καλύτερο seeking/alignment/autosuggest. Κάτι τέτοιο
θα χρειαστεί δουλειά αλλά δεν είναι κάτι αδύνατον
(με βάση Simon + HTK ή CMU Sphinx).

Και φυσικά αν μιλάμε για open source λύση δεν υπάρχουν όρια, δηλαδή
μετά μπορείς να πειραματιστείς με microphone arrays κλπ και να βελτιώνεις
τη λύση σταδιακά μέχρι να έχεις μειώσει στο ελάχιστο τον αριθμό των
υπαλλήλων που κάνουν απομαγνητοφώνηση και να μπορούν να κάνουν
πιο παραγωγικές δουλειές.

Θέλω να πω ότι ακόμα και σοφιστικέ απομαγνητοφώνηση κλπ
μπορεί να υλοποιηθεί με ΕΛ/ΛΑΚ εξαρτήματα και με τη μέθοδο
του iterative refinement με όχι απαγορευτικό κόστος.

Χαιρετισμούς,
Παντελής


More information about the Linux-greek-users mailing list