VintaSoft OCR .NET Plug-in - 개발 내역

제품 출시 정보

이 페이지에서는 VintaSoft OCR .NET Plug-in의 일반적인 개발 내역에 대한 정보를 찾을 수 있습니다. API SDK 변경 사항에 대한 정보는 설명서를 참조하십시오.

  • .NET 개발:
    • Windows 및 Linux에서 .NET 10 지원이 추가되었습니다.
    • Tesseract OCR 엔진이 버전 5.5.1로 업데이트되었습니다.
  • .NET 개발:
    • Windows 및 Linux에서 .NET 9 지원이 추가되었습니다.
    • Tesseract OCR 엔진이 버전 5.5.0으로 업데이트되었습니다.
    • Vintasoft.Imaging.Ocr.ML 어셈블리가 이제 Microsoft.ML 4.0.0을 사용합니다.
    • 데모 애플리케이션:
      • "OCR Demo" 웹 데모 애플리케이션에서 이제 로드된 모든 이미지의 텍스트를 한 번에 인식하고, OCR 결과를 검색 가능한 PDF 문서로 저장하고, 생성된 검색 가능한 PDF 문서에서 텍스트를 선택하고 검색할 수 있습니다.
  • .NET 개발:
    • Microsoft.ML 기반 신경망을 사용하여 손으로 쓴 숫자 문자열을 인식하는 기능이 추가되었습니다.
    • 사소한 버그가 수정되었습니다.
  • .NET 개발:
    • 사용 중인 Tesseract OCR 엔진이 버전 5.3.4로 업데이트되었습니다.
  • Windows, Linux 및 macOS에서 .NET 8.0 지원이 추가되었습니다.
  • 사용 중인 Tesseract OCR 엔진이 버전 5.3.3으로 업데이트되었습니다.
  • 이제 이미지 분할 명령에서 수신된 모든 텍스트 블록은 RecognizeSingleColumn 블록으로 표시됩니다. 이전에는 RecognizeSingleBlock 블록으로 표시되었습니다. 이 변경으로 전체 텍스트 인식 성능을 저하시키지 않으면서 복잡한 텍스트에 대한 인식 품질이 향상되었습니다.
  • .NET 개발:
    • Tesseract OCR 엔진이 버전 5.3으로 업데이트되었습니다.
  • .NET 개발:
    • Windows 및 Linux에서 .NET 7 지원이 추가되었습니다.
    • Linux에서 텍스트 인식 기능이 추가되었습니다.
    • 인식된 문자 영역을 감지하는 알고리즘이 개선되었습니다.
    • 데모 애플리케이션:
      • OcrDemo에 TextOverImage 모드로 검색 가능한 PDF 문서를 생성하는 기능이 추가되었습니다.
    • 몇 가지 사소한 버그가 수정되었습니다.
  • .NET 개발:
    • 지원 플랫폼:
      • Windows용 .NET 6 지원이 추가되었습니다.
    • 지원되는 개발 환경:
      • Visual Studio 2022와의 호환성 지원이 추가되었습니다.
    • 지원되는 운영 체제:
      • Windows 11과의 호환성 지원이 추가되었습니다.
      • Windows Server 2003과의 호환성 지원이 중단되었습니다.
    • Tesseract OCR 엔진이 버전 5.0으로 업데이트되었습니다. 테스트 결과, Tesseract OCR 5와 Tesseract OCR 4는 거의 동일한 텍스트 인식 결과를 제공하지만, Tesseract OCR 5는 Tesseract OCR 4보다 최대 2배 빠릅니다.
    • OcrPage 객체를 TextRegion 객체로 변환하는 기능이 추가되었습니다(OcrDocument.Create 및 OcrPage.Create 메서드).
    • 데모 애플리케이션:
      • "OCR Demo" 데모 애플리케이션에 새로운 기능이 추가되었습니다.
        • PDF 문서의 텍스트에서 OCR 결과를 불러오는 기능이 추가되었습니다.
    • 몇 가지 사소한 버그가 수정되었습니다.
  • 웹 개발:
    • 데모 애플리케이션:
      • 데모 애플리케이션 "ASP.NET OCR Demo"("ASP.NET Core Angular OCR Demo", "ASP.NET MVC OCR Demo", "ASP.NET WebForms OCR Demo")의 코드가 개선되어 이제 다음 기능을 사용할 수 있습니다.
        • 텍스트 인식 전에 문서를 미리 보기
        • 텍스트 인식 전에 문서 페이지 처리
        • 문서 전체, 특정 페이지 또는 페이지의 특정 영역에서 텍스트 인식
    • OCR 웹 서비스의 몇 가지 사소한 버그를 수정했습니다.
  • .NET 개발:
    • 지원 플랫폼:
      • Windows용 .NET 5 지원이 추가되었습니다.
  • .NET 개발:
    • 지원 플랫폼:
      • Windows용 .NET Core 3 지원(UI 컨트롤 제외)을 추가했습니다.
        다음 .NET Core 어셈블리가 생성되었습니다.
        • Vintasoft.Imaging.Ocr.dll
        • Vintasoft.Imaging.Ocr.Tesseract.dll
      • .NET Framework 2.0 지원이 중단되었으며, SDK는 이제 .NET Framework 4 이상 및 3.5를 지원합니다.
    • 사용된 Tesseract OCR 엔진이 버전 4.1.0으로 업데이트되었습니다.
  • Tesseract OCR 엔진이 버전 4.0으로 업데이트되었습니다.
    • 텍스트 인식 성능과 품질이 향상되었습니다.
    • 새로운 언어 인식 지원이 추가되었습니다.
  • Tesseract OCR 기능을 사용하여 여러 언어의 텍스트를 동시에 인식할 수 있는 기능이 추가되었습니다. 이전에는 SDK 기능을 사용하여 여러 언어의 텍스트를 동시에 인식할 수 있었습니다.
  • 이제 "OCR Demo" 데모 애플리케이션에서 텍스트 인식을 위해 여러 언어를 선택할 수 있습니다.
  • Tesseract OCR 엔진이 버전 3.04로 업데이트되었습니다.
    • 텍스트 인식 품질이 향상되었습니다.
    • 지원되는 인식 언어 목록이 확장되었습니다.
  • 멀티 스레드 환경에서 Tesseract OCR 엔진을 사용할 수 있는 기능이 추가되었습니다.
  • 컬러 이미지에서 텍스트 인식 품질이 향상되었습니다.
  • 컬러 이미지에서 텍스트를 인식할 때 최대 메모리 사용량이 감소했습니다.
  • 인식 결과 트리를 HOCR 형식으로 가져오기/내보내기할 수 있는 기능이 추가되었습니다.
  • 다양한 사소한 버그 수정 및 개선 사항이 적용되었습니다.
  • 텍스트 인식 전에 텍스트 영역의 직교 회전 각도를 지정할 수 있는 기능이 추가되었습니다. 이전에는 모든 텍스트가 회전되지 않은 상태로 인식되었습니다.
  • 이제 "OCR Demo" 데모 애플리케이션에서 MRC 압축을 사용하여 검색 가능한 PDF 문서를 생성할 수 있습니다.
  • 몇 가지 사소한 개선 사항이 적용되었습니다.
  • 데모 애플리케이션 "OCR Demo"의 코드가 개선되었습니다.
  • 어셈블리 이름이 변경되었고 네임스페이스 구조가 바뀌었습니다. 자세한 내용은 설명서를 참조하세요.
  • Tesseract OCR 엔진이 버전 3.02로 업데이트되었습니다.
    • OCR 품질이 향상되었습니다.
    • 새로운 지원 언어: 아프리칸스어, 알바니아어, 아제르바이잔어, 벨라루스어, 벵골어, 에스토니아어, 바스크어, 프랑코어, 갈리시아어, 크로아티아어아이슬란드어, 말라얄람어, 마케도니아어, 몰타어, 말레이어, 스와힐리어, 타밀어, 텔루구어.
  • 사소한 버그가 수정되었습니다.
  • 기본 OCR .NET 인터페이스가 생성되었습니다(Vintasoft.Ocr.dll):
    • 이미지 또는 이미지 모음에서 텍스트를 인식하는 기능.
    • 이미지의 임의 영역에서 텍스트를 인식하는 기능.
    • 인식 진행 상황을 볼 수 있는 기능.
    • 인식 전에 이미지를 분할하고 발견된 각 영역에 대한 인식 매개변수를 설정하는 기능.
    • 인식 결과를 문서, 페이지, 영역, 단락, 줄, 기호의 계층 구조로 볼 수 있는 기능.
    • 인식 결과를 탐색하는 기능.
    • 인식 결과를 편집하는 기능이 추가되었습니다.
    • 인식 결과를 텍스트(TXT) 문서로 저장하는 기능.
  • Tesseract OCR 인터페이스(Vintasoft.Ocr.Tesseract.dll)가 생성되었습니다.
    • Tesseract OCR 엔진 기능에 대한 접근 권한 제공.
    • 이미지에서 텍스트를 인식하는 기능.
    • 이미지의 임의 영역에서 텍스트를 인식하는 기능.
    • 지원 언어: 영어, 아랍어, 불가리아어, 카탈루냐어, 체코어, 체로키어, 중국어 간체, 중국어 번체, 덴마크어, 네덜란드어, 핀란드어, 프랑스어, 독일어, 그리스어, 히브리어, 힌디어, 헝가리어, 인도네시아어, 이탈리아어, 일본어, 한국어, 라트비아어, 리투아니아어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 세르비아어, 슬로바키아어, 슬로베니아어, 스페인어, 스웨덴어, 타갈로그어, 태국어, 터키어, 우크라이나어, 베트남어.
    • 인식 진행 상황을 볼 수 있는 기능.
    • Tesseract OCR 변수 값을 가져오거나 설정할 수 있습니다.
    • 사용자 지정 사전을 사용할 수 있습니다.
  • 텍스트 검색 기능을 갖춘 PDF 파일을 생성하는 인터페이스가 개발되었습니다(Vintasoft.Pdf.Ocr.dll).
    • OCR 인식 결과를 PDF 문서에 텍스트로 저장할 수 있습니다.
    • OCR 인식 결과를 PDF 문서에 이미지 아래에 숨겨진 텍스트로 저장할 수 있습니다.