Ứng dụng giúp nhận diện và trích xuất nội dung văn bản từ hình ảnh

Ứng dụng giúp nhận diện và trích xuất nội dung văn bản từ hình ảnh
HHT - Bạn muốn trích xuất một đoạn văn bản có trong hình ảnh hoặc muốn sao chép nhanh một đoạn nội dung từ trang báo giấy hoặc từ cuốn sách nào đó? Ứng dụng miễn phí dưới đây sẽ giúp bạn thực hiện những điều trên một cách dễ dàng.

Có đôi khi bạn muốn sao chép một đoạn nội dung văn bản nào đó trên sách hoặc trên giấy tờ, báo chí... để sử dụng trên smartphone hoặc máy tính của mình. Nhiều người sẽ chọn giải pháp ngồi gõ lại toàn bộ đoạn nội dung cần sử dụng, tuy nhiên với sự giúp đỡ của Text Scanner, mọi chuyện có thể trở nên dễ dàng hơn.

Text Scanner (OCR) là ứng dụng miễn phí, sử dụng kỹ thuật nhận dạng ký tự quang học (OCR), cho phép nhận diện và trích xuất các nội dung văn bản từ hình ảnh để chuyển đoạn văn bản trên smartphone. Với Text Scanner, khi muốn sao chép một đoạn văn bản nào đó từ bên ngoài vào smartphone, bạn chỉ việc chụp ảnh lại đoạn nội dung văn bản cần sao chép, ứng dụng sẽ trích xuất nội dung văn bản có trên hình ảnh để người dùng sử dụng.

Ứng dụng cũng hữu ích trong trường hợp bạn muốn quét nhanh một số điện thoại nào đó trên danh thiếp hoặc trên bảng hiệu, bạn chỉ việc chụp lại số điện thoại in trên đó, ứng dụng sẽ tự động nhận diện và trích xuất số điện thoại để người dùng lưu lại và sử dụng mà không cần phải tự nhập số bằng tay.

Quá trình thử nghiệm cho thấy Text Scanner nhận diện khá tốt ngôn ngữ tiếng Việt.

Cách dùng của ứng dụng khá đơn giản. Giao diện chính của Text Scanner là một giao diện chụp ảnh, cho phép người dùng chụp lại hình ảnh của đoạn văn bản muốn nhận diện chữ viết. Bạn nên chụp ảnh sao cho tập trung vào đoạn nội dung văn bản cần nhận diện, chẳng hạn nếu bạn muốn nhận diện một đoạn văn bản trên trang web, bạn nên tập trung vào đoạn nội dung chính, thay vì chụp cả những nội dung quảng cáo xung quanh... sẽ khiến cho ứng dụng khó nhận diện được chính xác.

Ngoài ra, bạn có thể nhấn vào biểu tượng hình ảnh ở phía trên để chọn một hình ảnh sẵn có trong smartphone của mình để nhận diện chữ viết trên hình ảnh đó. Với cách thức này, bạn có thể tải một hình ảnh từ Internet hoặc dùng ứng dụng chụp ảnh mặc định trên smartphone để chụp lại đoạn văn bản cần nhận diện chữ viết để sử dụng trong Text Scanner.

Ứng dụng giúp nhận diện và trích xuất nội dung văn bản từ hình ảnh ảnh 1
Nhấn vào biểu tượng hình ảnh (mũi tên đỏ) nếu muốn sử dụng hình ảnh sẵn có trên smartphone để trích xuất nội dung

Sau khi chụp ảnh, chờ trong giây lát, ứng dụng Text Scanner sẽ tự động quét và nhận diện văn bản có trong hình ảnh chụp, từ đó trích xuất đoạn văn bản từ hình ảnh đã chụp.

Tại giao diện tiếp theo, bạn có thể nhấn vào biểu tượng cây viết ở góc trên bên phải để chỉnh sửa lại đoạn văn bản đã được nhận diện từ hình ảnh sao cho chính xác và hoàn chỉnh hơn.

Ứng dụng giúp nhận diện và trích xuất nội dung văn bản từ hình ảnh ảnh 2

Trong quá trình thử nghiệm, Text Scanner cho thấy nhận diện khá chính xác các văn bản bằng tiếng Anh, trong khi đó với các hình ảnh chứa văn bản bằng tiếng Việt, ứng dụng cũng nhận diện khá ổn, tuy nhiên lại thường xảy ra hiện tượng mất dấu trong từng từ. Do vậy người dùng có thể chỉnh sửa lại đoạn văn bản sau khi nhận diện và thêm dấu vào từng từ để văn bản trở nên chính xác và hoàn chỉnh hơn. Dù sao việc chỉnh sửa các lỗi trong văn bản vẫn nhanh hơn là gõ lại toàn bộ đoạn văn bản.

Có thể nói Text Scanner là một trong những ứng dụng nhận diện chữ viết từ hình ảnh chính xác nhất hiện nay, bao gồm cả tiếng Việt, vốn được đánh giá là loại ngôn ngữ khó và phức tạp trong quá trình nhận diện chữ viết.

Theo dantri.com.vn
MỚI - NÓNG

Có thể bạn quan tâm

Tại sao nhiệt độ 40 độ C ở sa mạc lại dễ chịu đựng hơn ở các nước nhiệt đới?

Tại sao nhiệt độ 40 độ C ở sa mạc lại dễ chịu đựng hơn ở các nước nhiệt đới?

HHT - Khi nhiệt độ ở một thành phố thuộc một nước nhiệt đới, ví dụ như ở Thủ đô Hà Nội của nước ta, mà lên đến 40 độ C thì người dân sẽ cảm thấy rất mệt mỏi, dễ kiệt sức. Nhưng cùng mức nhiệt độ này ở sa mạc thì con người lại dễ chịu đựng được hơn. Tại sao lại như vậy?