Trích xuất văn bản từ hình ảnh

Trích xuất văn bản từ hình ảnh

Nguồn: As.com

Hiện tại, nhờ sự phát triển đúng đắn của công nghệ, chúng tôi đã làm cho nó trở nên khả thi và rất dễ dàng với các định dạng có thể chỉnh sửa. Trích xuất một văn bản từ một hình ảnh nó luôn là một nhiệm vụ được đặt câu hỏi cho đến giây phút cuối cùng.

Điều tưởng chừng như không thể đã có thể xảy ra. Trong bài đăng này, chúng tôi sẽ đưa bạn vào một trong các hướng dẫn nơi bạn sẽ làm việc với định dạng JPEG nổi tiếng. Chúng tôi không chỉ giới thiệu cho bạn định dạng này mà còn giải thích cách thực hiện hành động này và cố gắng làm cho công việc của bạn dễ dàng hơn với một chút trợ giúp.

Chúng ta đã bắt đầu.

Định dạng JPG

Định dạng jpg

Nguồn: ComputerHoy

Chắc chắn bạn đã nghe nói về định dạng này, và nếu chưa, chúng tôi sẽ giới thiệu cho bạn thế giới của nó để bạn biết trực tiếp và hiểu toàn bộ quá trình diễn ra sau đó.

Định dạng .JPG là một loại tệp như PNG, TIFF, TXT Vân vân. Sự khác biệt giữa tất cả chúng là định dạng này, Đây là một định dạng được sử dụng rộng rãi trong các tệp ảnhNói cách khác, nó rất quan trọng trong ngành công nghiệp kỹ thuật số mà chúng ta biết. Nếu bạn cống hiến hết mình cho thế giới nhiếp ảnh, định dạng này sẽ là người bạn đồng hành của bạn, vì Nó có mặt trong hầu hết các thiết bị: máy ảnh, điện thoại di động, v.v. 

Tên của anh ấy được tạo ra bởi Nhóm chuyên gia nhiếp ảnh chung, một nhóm các chuyên gia đã tạo ra. jpg,. một định dạng được thiết kế để nén hình ảnh, cả ở màu sắc và thang độ xám với chất lượng cao. Do đó, chúng tôi đang phải đối mặt với phương pháp phổ biến nhất khi tạo nén ảnh chụp. Tất nhiên, cần lưu ý rằng mức độ giảm có thể được điều chỉnh, chọn kích thước lưu trữ và chất lượng hình ảnh. Thông thường, đạt được độ nén từ một đến mười với chất lượng hình ảnh giảm đáng kể.

Là một tệp được sử dụng rộng rãi, nó đã trở nên rất lan truyền và phổ biến trên Internet. Việc sử dụng tuyệt vời này của định dạng đã cho phép nhiều trình duyệt có loại định dạng này khi tải xuống hoặc cập nhật.

JPG hoặc JPEG

Chúng ta đã nói về định dạng JPG nhưng không phải là JPEG, thực tế thì nó giống nhau nhưng trên thực tế thì việc nhầm lẫn và phân biệt nó là rất phổ biến. Mặc dù chúng có vẻ không giống nhau, nhưng chúng có nhiều điểm tương đồng, họ thực sự chia sẻ nhiều điểm tương đồng hơn là sự khác biệt.

Một số điểm tương đồng giữa hai tệp này là:

  • Cả hai tệp đều ở định dạng raster thay vì định dạng vectơ.
  • JPG là viết tắt của JPEG và Nhóm chuyên gia nhiếp ảnh chung.
  • Cả hai loại tệp này thường được sử dụng trong ảnh.
  • Cả hai đều áp dụng một quy trình nén trong đó kết quả là một sự thỏa hiệp về chất lượng.
  • Khi kết thúc quá trình nén, các tệp có kích thước nhỏ.

Nhưng, chúng cũng có một số điểm khác biệt nhỏ, tuy không ảnh hưởng đến nhau nhưng nó đã ảnh hưởng đến sự phát triển của công nghệ. Ví dụ:

Các phiên bản trước của Windows, tức là, các phiên bản cũ nhất, chỉ có thể hỗ trợ 3 phần mở rộng ký tự. Mặc dù ngày nay hệ thống Mac và các phiên bản Windows mới hơn có thể mở tệp bằng phần mở rộng .jpeg, nhưng các máy tính được sử dụng trước đây với hệ điều hành Windows cũ hơn đã phải rút ngắn phần mở rộng thành .jpg

Hiện nay hầu hết các chương trình xử lý ảnh đều sử dụng đuôi .jpg để tránh nhầm lẫn. Tóm lại và để tóm tắt điểm này, sự khác biệt giữa hai phần mở rộng tệp là số lượng chữ cái. Ngày nay chúng ta có thể sử dụng định dạng tệp .jpeg. Tuy nhiên, trên các hệ thống cũ hơn, họ chỉ cho phép định dạng .jpg.

Cách trích xuất văn bản từ hình ảnh

Bước đơn giản nhất để thực hiện quá trình này là sử dụng những gì chúng tôi biết là Google Drive. Nếu bạn có tài khoản Google, bạn sẽ có quyền truy cập vào công cụ này trong số các ứng dụng khác nhau mà Google có.

Đối với quá trình này, thực tế không cần thiết phải cài đặt bất cứ thứ gì. Tất cả những gì bạn phải làm là mở một hình ảnh như thể nó là một tài liệu văn bản. Và khi bạn làm Google Docs Nó không chỉ mở một tài liệu văn bản với hình ảnh mà còn cố gắng trích xuất bất kỳ văn bản nào mà nó có thể tìm thấy trong đó. Điều này dành cho cả ảnh chụp màn hình trang web và ảnh mà bạn có thể xuất thực tế.

Khi bạn đã có Google Drive và hình ảnh của mình, chúng ta sẽ bắt đầu với phần hướng dẫn.

Bước 1: Tải lên hình ảnh

Google Drive

Nguồn: ComputerHoy

Điều đầu tiên chúng tôi sẽ làm sau khi chúng tôi có hình ảnh sẵn sàng và chúng tôi đã mở Google Drive, là tải ảnh bạn muốn lên Google Drive. Bạn có thể thực hiện việc này bằng cách tải lên từ web hoặc chia sẻ trực tiếp với ứng dụng trên thiết bị di động của mình. Phương pháp này không quan trọng, chỉ tải lên ảnh có văn bản mà bạn muốn trích xuất.

mở hình ảnh

Nguồn: Googledoc

Tiếp theo, bên trong Google Drive, bạn phải thực hiện một chút nhấp chuột ngay trên ảnh có văn bản bạn muốn trích xuất, để có thể mở menu ngữ cảnh đó để tìm tùy chọn. Ảnh có thể là bất kỳ định dạng phổ biến nào mà Google Drive hỗ trợ.

Khi chúng tôi đã nhấp chuột phải vào hình ảnh, trong menu mở ra, bạn phải chọn tùy chọn Mở bằng. Điều đó sẽ mở ra một cửa sổ khác, nơi bạn phải chọn tùy chọn Google Documents để mở hình ảnh bằng ứng dụng gốc này mà tất cả người dùng Google Drive đều có.

Sau khi áp dụng Tài liệu Google khởi đầu, nó sẽ mở hình ảnh bên trong tài liệu và nếu nó phát hiện có văn bản trong đó, nó sẽ chuyển nó thành văn bản thuần túy, nơi bạn sẽ có thể chọn và sao chép theo ý thích của mình để giải nén nó theo cách bạn muốn nhất.

Các ứng dụng để chuyển đổi hình ảnh thành văn bản

Dưới đây là một số ứng dụng cũng có thể giúp bạn:

Google Lens

Công cụ này là được tích hợp với các sản phẩm khác nhau của Google, bao gồm cả Google Photos, được cài đặt sẵn trên thiết bị Android và cũng có thể được tải xuống miễn phí từ Apple Store trên iPhone. Để sử dụng nó, chỉ cần mở công cụ Hình ảnh, sau đó nhập hình ảnh bạn muốn làm việc và sau khi hoàn tất, hãy sơn văn bản để sao chép và sau đó dán vào tài liệu đích.

Google Lens cũng dịch văn bản, lưu danh thiếp trong danh bạ và thêm sự kiện vào lịch, cùng các chức năng khác. Ứng dụng cũng có thể được tải xuống riêng và được sử dụng để xác định các đối tượng trong môi trường thực. Hệ thống quét các áp phích, tượng đài và địa điểm.

Ống kính Microsoft Office

Ứng dụng Microsoft này phát hiện văn bản của hình ảnh đã chọn và sau đó tạo tài liệu Word hoặc One Note và tải nó lên đám mây OneDrive để sau này, chúng tôi có thể truy cập nó từ thiết bị di động hoặc máy tính. Nó cũng cho phép bạn lưu văn bản ở định dạng PDF.

iScanner

Ứng dụng này, chỉ có sẵn cho iPhone, cho phép bạn quét, lưu và chia sẻ tài liệu ở định dạng pdf hoặc jpg. Ngoài ra, như dễ dàng chuyển đổi hình ảnh thành văn bản với chức năng OCR, cho phép bạn dễ dàng trích xuất và chỉnh sửa văn bản từ ảnh của mình. Máy quét văn bản này nhận dạng nhiều ngôn ngữ.

Adobe Scan

Nó cho phép bạn quét văn bản và tạo PDF hoặc trích xuất văn bản từ một hình ảnh đã tạo. Khi nó phát hiện các hình thức, cho phép bạn hoàn thành chúng.

Onelineocr.net

Nó là một trang chuyển đổi văn bản từ hình ảnh thành văn bản thuần túy trong một vài giây. Đầu tiên, bạn phải tải ảnh lên, sau đó chọn ngôn ngữ của văn bản và cuối cùng là định dạng mà bạn muốn tài liệu xuất hiện.

Text Fairy (Trình quét văn bản OCR)

Chuyển đổi hình ảnh thành văn bản, cho phép bạn chỉnh sửa nội dung cũng như sao chép và dán nó vào các ứng dụng khác. Nền tảng này nhận dạng văn bản bằng hơn 50 ngôn ngữ.

Máy quét PDF

Ứng dụng này cho phép bạn quét tài liệu cũng như chuyển đổi ảnh thành văn bản. Nó được sử dụng để quét, lưu và chia sẻ bất kỳ tài liệu nào trong PDF, JPG hoặc TXT. Nó cũng có một tùy chọn để thêm chữ ký điện tử vào tài liệu.

Kết luận

Với sự phát triển và tạo ra nhiều ứng dụng, việc truy cập để có thể thực hiện loại quy trình trên máy tính đã trở nên dễ dàng. Việc trích xuất văn bản từ một hình ảnh, ngày nay đã trở thành một công việc dễ dàng và có thể tiếp cận được với tất cả các loại công chúng. Ngoài ra, nếu quá trình mà chúng tôi đã trình bày cho bạn vẫn chưa thuyết phục được bạn, Bạn luôn có thể sử dụng các công cụ mà chúng tôi đã đề xuất ở cuối bài đăng này.

Chúng là những ứng dụng có nhiều ứng dụng miễn phí và có sẵn cho cả hệ thống Android và Apple. Bạn chỉ cần nhấp vào và tải chúng xuống. Nếu bạn có tài khoản Google, bạn cũng có quyền truy cập vào nhiều ứng dụng trong đó một số ứng dụng cũng đã được thiết kế cho loại hoạt động này.

Nói tóm lại, trích xuất văn bản từ một hình ảnh là điều có thể làm được và nằm trong tầm tay của chúng tôi, cả từ phiên bản di động của ứng dụng và trên các nền tảng khác có sử dụng công cụ này. Bây giờ là lúc để bạn thử các công cụ và khám phá những công cụ khác có thể giúp bạn.


Nội dung bài viết tuân thủ các nguyên tắc của chúng tôi về đạo đức biên tập. Để báo lỗi, hãy nhấp vào đây.

Hãy là người đầu tiên nhận xét

Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố.

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.