ಕನ್ನಡಕ್ಕೆ OCR ಬೇಕೇ?
ಬರಹ
tesseract ಎನ್ನುವ ತತ್ರಾಂಶ ಮೂಲತ: ಮುಕ್ತ. ಇದು OCRಗೋಸ್ಕರ ತಯಾರಿಸಲಾಗಿದೆ. ಎಲ್ಲಾ ಭಾಷೆಗಳಿಗೂ ಅಳವಡಿಸಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಿದೆ. ತೆಲುಗಿನಲ್ಲಿ ಈ ಕೆಲಸ ನಡೆಯುತ್ತಿದೆಯೆಂದು ಕೇಳಿದ್ದೇನೆ. ಆ ತತ್ರಾಂಶವನ್ನು ಕೊಂಚ ತರಬೇತಿಕೊಟ್ಟು ಕನ್ನಡದ ಅಚ್ಚಿನ ಪುಟಗಳನ್ನೂ OCR ಉಪಯೋಗಿಸಿ ಚಿತ್ರವನ್ನು ಪಠ್ಯವಾಗಿ ಬದಲಾಯಿಸಿಕೊಂಡು ಪರಿಷ್ಕರಿಸಬಹುದು ಮತ್ತು ಪಠ್ಯವು ಕಡಿಮೆ ಸ್ಮೃತಿಕೋಶದಲ್ಲಿ ಕಡಿಮೆ ಜಾಗವನ್ನು ಉಪಯೋಗಿಸುವುದರಿಂದ ಬಹಳ ಅನುಕೂಲಗಳು ಇವೆ. ಕರ್ನಾಟಕದಲ್ಲಿ ಗಣಕ ತತ್ರಾಂಶ ಪರಿಣತರು ಕಡಿಮೆ ಏನಿಲ್ಲ. ಈ ಕೆಲಸಕ್ಕೆ ಏಕೆ ಮುಂದೆಬರಬಾರದು ಎಂದು ನನ್ನ ವಿನಂತಿ. ಸ್ವಯಂ ಸೇವಕರು ಒಂದು ಗುಂಪುಮಾಡಿಕೊಂಡು ಕನ್ನಡಕ್ಕೆ ಉಪಯೋಗವಾಗುವ ಕೆಲಸ ಮಾಡಬಾರದೇಕೆ?
ಇಷ್ಟವಿದ್ದವರು http://code.google.com/p/tesseract-ocr/ ಈ ಪುಟವನ್ನು ನೋಡಿ.
ನಾನು ಹಿರಿಯ ನಾಗರೀಕ. ನಾನು ತತ್ರಾಂಶ ಪರಿಣತನಲ್ಲ. ಆದರೆ ಈ ಕೆಲಸದಲ್ಲಿ ಕೆಲವು ಮಾಮೂಲು ಕೆಲಸಗಳಿಗೆ ನನ್ನ ಸಮಯ ಪರಿಶ್ರಮ ಮುಡುಪಾಗಿಡಲು ನಾನು ಸಿದ್ಧ.
ನಿಮಗೆ ಈ ಬರಹ ಇಷ್ಟವಾಯಿತೇ? ತಿಳಿಸಿ