Επιστήμη

Τι είναι το ocr; »Ο ορισμός και η σημασία του

Anonim

Τα OCR είναι αυτά της οπτικής αναγνώρισης χαρακτήρων ή επίσης γνωστά στα Ισπανικά ως οπτική αναγνώριση χαρακτήρων. Το OCR είναι λογισμικό που επιτρέπει την αναγνώριση κειμένου, παράγοντας μια εικόνα του για να το μετατρέψει σε μια σειρά χαρακτήρων και, στη συνέχεια, να τα αποθηκεύσετε σε μια δεδομένη μορφή που μπορεί να χρησιμοποιηθεί σε αυτά τα προγράμματα επεξεργασίας κειμένου. Με άλλα λόγια, χάρη σε αυτήν τη νέα τεχνολογία, οποιοσδήποτε τύπος κειμένου ή εγγράφου, συμπεριλαμβανομένων αρχείων PDF, σαρωμένων εγγράφων ή ακόμη και εικόνων που λαμβάνονται από ψηφιακές φωτογραφικές μηχανές, μπορεί να μετατραπεί σε δεδομένα για να έχει τη δυνατότητα επεξεργασίας.

Αυτό το λογισμικό λειτουργεί με τον ακόλουθο τρόπο, πρώτα αναλύει κάθε μέρος της εικόνας του εν λόγω εγγράφου. διανείμετε τη σελίδα σε κομμάτια όπως πίνακες, εικόνες, μπλοκ κειμένου μεταξύ άλλων. τότε οι γραμμές διανέμονται με λέξεις για να γίνουν αργότερα χαρακτήρες. και αφού οι χαρακτήρες έχουν ήδη αναφερθεί, το λογισμικό κάνει τη σύγκριση με μια ομάδα εικόνων του μοτίβου. Αυτό εξελίσσεται σύμφωνα με τη σειρά υποθέσεων σχετικά με το τι είναι κάθε χαρακτήρας. και βασίζεται σε αυτές τις υποθέσεις, αναλύει τις διάφορες παραλλαγές των διαχωριστικών γραμμών σε λέξεις και λέξεις σε χαρακτήρες. Και μετά από μεγάλο αριθμό αναλύσεων και επεξεργασίας των υποθέσεων, το πρόγραμμα παρουσιάζει επιτέλους το κείμενο που έχει ήδη αναγνωριστεί και μετασχηματιστεί με μια νέα μορφή.

Πρέπει να σημειωθεί ότι σήμερα υπάρχουν πολλά προγράμματα που προσφέρει η αγορά υπολογιστών με βάση OCR όπως OmniPage, Abbyy Fine Reader ή READiris. YY που έχουν τη δυνατότητα, όχι μόνο να αναλύουν και να αναγνωρίζουν ένα κείμενο ως τέτοιο, αλλά και να αναγνωρίζουν τη μορφή και το στυλ, αλλά με ορισμένους περιορισμούς, απαιτώντας έτσι το κείμενο, αφού αναλυθεί, να επεξεργαστεί για να κάνει τις προσαρμογές που είναι απαιτώ.