Quay lại Blog
ocrnhận dạng văn bảnmacosnăng suấthướng dẫn

Cách trích xuất văn bản từ hình ảnh và ảnh chụp màn hình trên Mac

Snapzy Team

Cách trích xuất văn bản từ hình ảnh và ảnh chụp màn hình trên Mac

Bạn đã bao giờ chụp ảnh màn hình một đoạn mã, thông báo lỗi, hoặc đầu ra terminal — rồi phải đánh lại nó bằng tay? Hoặc nhận một PDF đã quét và cần sao chép một đoạn văn từ đó? Đó chính là lúc OCR (Nhận dạng Ký tự Quang học) tiết kiệm hàng giờ làm việc tẻ nhạt.

Hướng dẫn này giải thích cách trích xuất văn bản từ hình ảnh trên Mac bằng các công cụ tích hợp sẵn, ứng dụng bên thứ ba, và OCR tích hợp của Snapzy. Chúng tôi sẽ đề cập đến độ chính xác, tốc độ, ngôn ngữ được hỗ trợ, và công cụ nào phù hợp nhất với quy trình làm việc của bạn.


OCR là gì và tại sao nó quan trọng

OCR là công nghệ đọc văn bản bên trong hình ảnh và chuyển đổi nó thành văn bản có thể chỉnh sửa, có thể chọn. Thay vì nhìn vào một bức ảnh các từ, bạn nhận được các ký tự thực tế mà bạn có thể sao chép, dán, và tìm kiếm.

Trên Mac, OCR hữu ích cho:

  • Sao chép mã từ ảnh chụp màn hình mà không cần đánh lại
  • Trích xuất thông báo lỗi từ hộp thoại
  • Lấy văn bản từ tài liệu đã quét hoặc PDF
  • Chụp URL, số serial, hoặc địa chỉ từ ảnh
  • Chuyển đổi ghi chú viết tay (với các công cụ OCR nâng cao)

Đối với nhà phát triển, nhà thiết kế, và nhà văn, OCR không phải là một sự sang trọng — nó là một công cụ tiết kiệm thời gian hàng ngày.


Các tùy chọn OCR tích hợp sẵn trên macOS

Live Text (macOS 13+)

Apple đã giới thiệu Live Text trong macOS Ventura. Nó hoạt động trong Photos, Safari, Preview, và Quick Look. Khi bạn mở một hình ảnh chứa văn bản, một biểu tượng nhỏ xuất hiện ở góc dưới bên phải. Nhấp vào nó, và bạn có thể chọn, sao chép, và dán văn bản trực tiếp từ hình ảnh.

Ưu điểm: Miễn phí, không cần ứng dụng thêm, hoạt động trong các ứng dụng hệ thống. Nhược điểm: Chỉ hoạt động trong các ứng dụng được hỗ trợ, không xử lý hàng loạt, giới hạn ở các ngôn ngữ Apple hỗ trợ, không thể trích xuất mã với thụt lề được bảo toàn.

Preview

Preview có thể hiển thị văn bản trong PDF, nhưng nó không thực hiện OCR thực sự trên PDF dựa trên hình ảnh hoặc ảnh chụp màn hình. Nếu văn bản là một phần của hình ảnh (không phải lớp văn bản), Preview coi nó như một bức ảnh — không thể chọn.

Phù hợp nhất cho: Chỉ các PDF dựa trên văn bản. Không phải OCR thực sự.


Các công cụ OCR bên thứ ba cho Mac

Công cụGiáTốc độBảo toàn mãPhù hợp nhất cho
Live TextMiễn phíNhanhKémSao chép nhanh một lần
TextSniper$8Rất nhanhTrung bìnhTrích xuất nhanh từ thanh menu
ShottrMiễn phíNhanhTrung bìnhKết hợp ảnh chụp màn hình + OCR
SnapzyMiễn phíNhanhXuất sắcẢnh chụp màn hình, mã, bất kỳ hình ảnh nào

TextSniper

TextSniper là một công cụ OCR thanh menu phổ biến cho Mac. Nhấn một phím tắt, kéo qua bất kỳ văn bản nào trên màn hình, và nó sao chép vào clipboard ngay lập tức. Giá $8 một lần và hoạt động tốt cho văn bản chung.

Hạn chế: Thụt lề mã thường bị mất. Định dạng nhiều dòng có thể bị hỏng. Không có công cụ ảnh chụp màn hình hoặc chú thích tích hợp — chỉ là OCR.

Shottr

Shottr bao gồm OCR như một phần của công cụ ảnh chụp màn hình miễn phí của nó. Sau khi chụp một vùng, bạn có thể chọn văn bản bên trong hình ảnh. Nó nhanh và tiện lợi, nhưng độ chính xác giảm với các phông chữ nhỏ hoặc bố cục phức tạp.

Hạn chế: Không có phím tắt OCR chuyên dụng cho các hình ảnh hiện có. Bạn phải chụp ảnh màn hình trước.


Snapzy OCR: Tích hợp sẵn, Miễn phí, và Nhận biết Mã

Snapzy bao gồm Nhận dạng Văn bản OCR miễn phí. Không giống như hầu hết các công cụ miễn phí, nó được thiết kế đặc biệt cho các loại văn bản mà người dùng nâng cao gặp phải hàng ngày: các khối mã, đầu ra terminal, dấu vết lỗi, và nhãn UI.

Cách sử dụng OCR Snapzy

Phương pháp 1: Chế độ Chụp OCR

Nhấn ⇧⌘2 để kích hoạt chế độ chụp OCR. Kéo qua bất kỳ khu vực nào trên màn hình của bạn. Snapzy trích xuất văn bản ngay lập tức và hiển thị nó trong một bảng điều khiển sạch sẽ, nơi bạn có thể:

  • Sao chép toàn bộ đầu ra
  • Sao chép dưới dạng mã (bảo toàn thụt lề và định dạng)
  • Chọn các dòng cụ thể để sao chép
  • Tìm kiếm trong văn bản đã trích xuất

Phương pháp 2: Từ Bất kỳ Hình ảnh Nào

Kéo bất kỳ PNG, JPEG, hoặc ảnh chụp màn hình nào vào trình chỉnh sửa chú thích của Snapzy. Nhấp vào công cụ OCR và chọn vùng chứa văn bản. Snapzy xử lý nó và hiển thị kết quả trong cùng một bảng điều khiển.

Điều này hoạt động trên các ảnh chụp màn hình bạn đã chụp nhiều tháng trước, hình ảnh từ web, hoặc tài liệu đã quét.

Tại sao OCR Snapzy khác biệt

  • Nhận diện mã: Nhận ra các khối mã và bảo toàn thụt lề, khoảng cách, và ngắt dòng tốt hơn OCR chung
  • Độ chính xác nhiều dòng: Xử lý các đoạn văn, danh sách, và bảng mà không làm hỏng định dạng
  • Kích hoạt tức thì: Phím tắt chuyên dụng (⇧⌘2) có nghĩa là không cần đào sâu vào menu
  • Không giới hạn: Sử dụng OCR không giới hạn, không đăng ký, không phí tính theo trang
  • Ưu tiên quyền riêng tư: Trích xuất văn bản diễn ra trên Mac của bạn. Không xử lý đám mây, không gửi dữ liệu đến máy chủ

Độ chính xác OCR: Những yếu tố ảnh hưởng đến kết quả

Không có công cụ OCR nào là hoàn hảo. Độ chính xác phụ thuộc vào một số yếu tố:

Yếu tốTác độngMẹo
Cỡ phông chữPhông chữ nhỏ (<10px) khó đọc hơnPhóng to trước khi chụp
Độ phân giải hình ảnhHình ảnh độ phân giải thấp tạo ra nhiều lỗi hơnChụp ở độ phân giải Retina
Độ tương phản nềnĐộ tương phản thấp làm giảm độ chính xácTránh văn bản trên nền bận rộn
Kiểu phông chữPhông chữ trang trí làm OCR bối rốiTuân thủ các phông chữ tiêu chuẩn khi có thể
Ngôn ngữCác ký tự phi Latin cần hỗ trợ cụ thểSnapzy hỗ trợ các ngôn ngữ chính
Định dạng mãThụt lề và khoảng cách quan trọngSử dụng "Sao chép dưới dạng Mã" trong Snapzy

Để có kết quả tốt nhất, hãy chụp văn bản ở độ phân giải cao nhất có sẵn và đảm bảo độ tương phản tốt giữa văn bản và nền.


Các quy trình làm việc OCR thực tế

Quy trình 1: Sao chép Terminal

Bạn đã chạy một lệnh và nhận được một dấu vết lỗi dài. Bạn cần dán nó vào một vấn đề GitHub.

  1. Nhấn ⇧⌘2 và kéo qua đầu ra terminal
  2. Nhấp vào Sao chép dưới dạng Mã
  3. Dán vào vấn đề GitHub với thụt lề hoàn hảo

Thời gian tiết kiệm: 2–5 phút cho mỗi thông báo lỗi.

Quy trình 2: Đoạn mã Stack Overflow

Bạn tìm thấy một đoạn mã trong một ảnh chụp màn hình trên Stack Overflow. Bài đăng gốc không có phiên bản văn bản.

  1. Kéo hình ảnh vào trình chỉnh sửa chú thích của Snapzy
  2. Sử dụng công cụ OCR để chọn vùng mã
  3. Sao chép dưới dạng mã và dán vào IDE của bạn

Thời gian tiết kiệm: 1–3 phút cho mỗi đoạn mã.

Quy trình 3: Chụp nhãn UI

Bạn đang viết tài liệu và cần văn bản nhãn chính xác từ một bảng cài đặt.

  1. Nhấn ⇧⌘2 và kéo qua nhãn
  2. Sao chép văn bản đã trích xuất
  3. Dán vào tài liệu của bạn với chính tả chính xác

Thời gian tiết kiệm: 30 giây cho mỗi nhãn. Cộng dồn nhanh trong các tài liệu dài.


OCR miễn phí trong Snapzy, như mọi tính năng khác

Các công cụ khác tính phí cho OCR hoặc giới hạn sử dụng. Snapzy bao gồm nhận dạng văn bản không giới hạn miễn phí. Nếu hướng dẫn này đã cứu bạn khỏi việc đánh lại, hãy cân nhắc hỗ trợ dự án.


Câu hỏi thường gặp

Làm thế nào để sao chép văn bản từ ảnh chụp màn hình trên Mac?

Sử dụng chế độ OCR của Snapzy. Nhấn ⇧⌘2, kéo qua văn bản, và sao chép kết quả. Bạn cũng có thể kéo bất kỳ hình ảnh nào vào Snapzy và chạy OCR trên đó.

Có công cụ OCR miễn phí nào cho Mac không?

Có. Snapzy bao gồm OCR miễn phí không giới hạn sử dụng. Live Text của Apple cũng miễn phí nhưng chỉ hoạt động trong các ứng dụng được hỗ trợ và thiếu khả năng bảo toàn mã.

OCR có thể đọc mã có thụt lề không?

Tính năng "Sao chép dưới dạng Mã" của Snapzy bảo toàn thụt lề và ngắt dòng tốt hơn các công cụ OCR chung. Nó được thiết kế đặc biệt để trích xuất mã từ ảnh chụp màn hình.

OCR có hoạt động trên văn bản viết tay không?

OCR tiêu chuẩn hoạt động tốt nhất trên văn bản in hoặc kỹ thuật số. Độ chính xác của chữ viết tay thay đổi tùy thuộc vào độ dễ đọc. Để có kết quả tốt nhất với ghi chú viết tay, hãy sử dụng bản chụp độ phân giải cao và các nét bút rõ ràng.

OCR trong Snapzy có riêng tư không?

Có. Tất cả quá trình xử lý OCR diễn ra cục bộ trên Mac của bạn. Không có văn bản nào được gửi đến máy chủ bên ngoài hoặc dịch vụ đám mây.

Tôi có thể trích xuất văn bản từ hình ảnh PDF trên Mac không?

Có. Chuyển đổi trang PDF thành hình ảnh hoặc kéo PDF vào Snapzy. Sử dụng công cụ OCR để chọn các vùng văn bản và trích xuất nội dung có thể chỉnh sửa.


Suy nghĩ cuối cùng

Đánh lại văn bản từ hình ảnh là một trong những công việc lãng phí nhất trong công việc hiện đại. Một công cụ OCR tốt biến một công việc năm phút thành một hành động năm giây. Các tùy chọn macOS tích hợp sẵn hữu ích cho việc sử dụng thông thường, nhưng chúng thiếu sót đối với các chuyên gia cần độ chính xác, tốc độ, và bảo toàn mã.

OCR của Snapzy được xây dựng cho thực tế đó. Nó nhanh, miễn phí, nhận biết mã, và riêng tư. Cho dù bạn đang trích xuất đầu ra terminal, sao chép các đoạn mã, hoặc chụp các nhãn cho tài liệu, nó loại bỏ hoàn toàn ma sát.

Nếu bạn đã sẵn sàng ngừng đánh lại và bắt đầu sao chép, tải Snapzy miễn phí và thử OCR với ⇧⌘2.

Hỗ trợ dự án

Snapzy miễn phí và mã nguồn mở. Nếu bạn thấy nó hữu ích, hãy cân nhắc tài trợ để giúp duy trì phát triển và tiếp cận với mọi người.