Nhận dạng ký tự quang học (tiếng Anh: Optical Character Recognition, viết tắt là OCR), là loại phần mềm máy tính được tạo ra để chuyển các hình ảnh của chữ viết tay hoặc chữ đánh máy (thường được quét bằng máy scanner) thành các văn bản tài liệu. OCR được hình thành từ một lĩnh vực nghiên cứu về nhận dạng mẫu, trí tuệ nhận tạo và machine vision. Mặc dù công việc nghiên cứu học thuật vẫn tiếp tục, một phần công việc của OCR đã chuyển sang ứng dụng trong thực tế với các kỹ thuật đã được chứng minh.
Dự án OCR Tiếng Việt có tên VietOCR, được phát triển dựa trên nền tảng mã nguồn mở tesseract-ocr do Google tài trợ. VietOCR có khả năng nhận dạng chữ Việt rất tốt. Đây là một chương trình nguồn mở Java/.NET, hỗ trợ nhận dạng cho các dạng ảnh PDF, TIFF, JPEG, GIF, PNG, và BMP.
Nguồn: https://perspectra.org
Xem thêm bài viết khác: https://perspectra.org/tong-hop/
Xem thêm Bài Viết:
- Các tiêu chuẩn chọn mua tivi tốt nhất hiện nay
- Sim số đẹp Viettel tứ quý là gì? Bí quyết chọn sim tứ quý tài lộc
- Relevant Sex Education, a Visual Culture Tool
- Bật mí kinh nghiệm tạo combobox trong excel không phải ai cũng biết
- [Topgame] Top Game Offline Nhập Vai Chặt Chém Mới Đáng Chơi Trên Mobile 2020
cho mình xin code demo được không bạn
Anh có thể chia sẻ thêm link down và hướng dẫn setup được không ạ, tại vì VietORC phải chạy thêm cả phần mềm hỗ trợ Java runtime hay C++ đúng không ạ?
ban oi sao tieng anh từ ảnh xuất ra toàn la chữ gi đau khong ak
ban chi minh cah tai phan mem ve vs