VintaSoft OCR .Plug-in .NET - Cronologia dello sviluppo

Informazioni sulle versioni del prodotto

In questa pagina puoi trovare informazioni sulla cronologia generale dello sviluppo del VintaSoft OCR .NET Plug-in. Informazioni sulle modifiche apportate all'API SDK sono disponibili nella documentazione.

  • .NET-sviluppo:
    • Aggiunto supporto per .NET 9 su Windows e Linux.
    • Il motore OCR Tesseract utilizzato è stato aggiornato alla versione 5.5.0.
    • L'assembly Vintasoft.Imaging.Ocr.ML ora utilizza Microsoft.ML 4.0.0.
    • Applicazioni demo:
      • L'applicazione demo web "OCR Demo" ora consente di riconoscere il testo in tutte le immagini caricate contemporaneamente, di salvare il risultato del riconoscimento del testo in un documento PDF ricercabile e di visualizzare il documento PDF ricercabile creato con la possibilità di selezionare e ricercare il testo.
  • .NET-sviluppo:
    • Aggiunta la possibilità di riconoscere una stringa di numeri scritti a mano utilizzando una rete neurale basata su Microsoft.ML.
    • Bug minori risolti.
  • .NET-sviluppo:
    • Il motore Tesseract OCR utilizzato è stato aggiornato alla versione 5.3.4.
  • Aggiunto supporto per .NET 8.0 su Windows, Linux e macOS.
  • Il motore OCR Tesseract utilizzato è stato aggiornato alla versione 5.3.3.
  • Ora tutti i blocchi di testo ricevuti dal comando di segmentazione dell'immagine vengono contrassegnati come blocchi di tipo RecognizeSingleColumn. In precedenza, i blocchi venivano contrassegnati come blocchi RecognizeSingleBlock. Questa modifica ha aumentato la qualità del riconoscimento di testi complessi senza ridurre le prestazioni complessive del riconoscimento del testo.
  • .NET-sviluppo:
    • Il motore Tesseract OCR utilizzato è stato aggiornato alla versione 5.3.
  • .NET-sviluppo:
    • Aggiunto supporto per .NET 7 su Windows e Linux.
    • Aggiunta la possibilità di riconoscere il testo su Linux.
    • Migliorato l'algoritmo per determinare le regioni dei caratteri riconosciuti.
    • Applicazioni demo:
      • A OcrDemo è stata aggiunta la possibilità di creare un documento PDF ricercabile in modalità TextOverImage.
    • Corretti diversi bug minori.
  • .NET-sviluppo:
    • Piattaforme supportate:
      • Aggiunto supporto per .NET 6 per Windows.
    • Ambienti di sviluppo supportati:
      • Aggiunto supporto per la compatibilità con Visual Studio 2022.
    • SO supportati:
      • Aggiunto supporto per la compatibilità con Windows 11.
      • Eliminato supporto per la compatibilità con Windows Server 2003.
    • Il motore OCR Tesseract utilizzato è stato aggiornato alla versione 5.0. I nostri test hanno dimostrato che Tesseract OCR 5 e Tesseract OCR 4 forniscono approssimativamente gli stessi risultati nel riconoscimento del testo, ma Tesseract OCR 5 è fino a 2 volte più veloce di Tesseract OCR 4.
    • Aggiunta la possibilità di convertire un oggetto OcrPage in un oggetto TextRegion (metodi OcrDocument.Create e OcrPage.Create).
    • Applicazioni demo:
      • Sono state aggiunte nuove funzionalità all'applicazione demo "OCR Demo":
        • È stata aggiunta la possibilità di scaricare i risultati OCR dal testo di un documento PDF.
    • Corretti diversi bug minori.
  • Web-sviluppo:
    • Applicazioni demo:
      • Il codice dell'applicazione demo "ASP.NET OCR Demo" ("ASP.NET Core Angular OCR Demo", "ASP.NET MVC OCR Demo", "ASP.NET WebForms OCR Demo") è stato migliorato e ora l'applicazione demo consente di:
        • visualizza l'anteprima del documento prima di riconoscere il testo
        • elabora le pagine del documento prima di riconoscere il testo
        • riconosce il testo nell'intero documento, in una singola pagina o in una parte di una pagina.
    • Sono stati risolti diversi bug minori nel servizio web OCR.
  • .NET-sviluppo:
    • Piattaforme supportate:
      • Aggiunto supporto per .NET 5 per Windows.
  • .NET-sviluppo:
    • Piattaforme supportate:
      • Aggiunto supporto (senza controlli dell'interfaccia utente) per .NET Core 3 per Windows.
        Sono stati creati i seguenti assembly .NET Core:
        • Vintasoft.Imaging.Ocr.dll
        • Vintasoft.Imaging.Ocr.Tesseract.dll
      • Il supporto per .NET Framework 2.0 è stato eliminato, l'SDK ora supporta .NET Framework 4+ e 3.5.
    • Il motore OCR Tesseract utilizzato è stato aggiornato alla versione 4.1.0.
  • Il motore Tesseract OCR utilizzato è stato aggiornato alla versione 4.0:
    • Prestazioni e qualità migliorate del riconoscimento del testo.
    • Aggiunto supporto per il riconoscimento di nuove lingue.
  • Aggiunta la possibilità di riconoscere testo in più lingue contemporaneamente utilizzando la funzionalità Tesseract OCR. In precedenza era possibile riconoscere contemporaneamente testi in più lingue utilizzando la funzionalità SDK.
  • L'applicazione demo "OCR Demo" ora consente di selezionare più lingue per il riconoscimento del testo.
  • Il motore OCR Tesseract utilizzato è stato aggiornato alla versione 3.04:
    • è stata migliorata la qualità del riconoscimento del testo
    • è stato ampliato l'elenco delle lingue di riconoscimento supportate.
  • Aggiunta la possibilità di utilizzare il motore OCR Tesseract in un ambiente multi-thread.
  • È stata migliorata la qualità del riconoscimento del testo nelle immagini a colori.
  • Riduzione del picco di utilizzo della memoria durante il riconoscimento del testo nelle immagini a colori.
  • Aggiunta la possibilità di importare/esportare l'albero dei risultati del riconoscimento in formato HOCR.
  • Molte piccole correzioni e miglioramenti.
  • Aggiunta la possibilità di specificare l'angolo di rotazione ortogonale di un'area di testo prima del riconoscimento del testo. In precedenza, tutto il testo veniva riconosciuto come non ruotato.
  • L'applicazione demo "OCR Demo" può ora creare documenti PDF ricercabili con compressione MRC.
  • Diversi piccoli miglioramenti.
  • Il codice dell'applicazione demo "OCR Demo" è stato migliorato.
  • Gli assembly sono stati rinominati e sono state apportate modifiche alla struttura dello spazio dei nomi. Informazioni più dettagliate sono disponibili nella documentazione.
  • Il motore OCR Tesseract utilizzato è stato aggiornato alla versione 3.02.
    • La qualità OCR è stata migliorata.
    • Nuove lingue supportate: afrikaans, albanese, azero, bielorusso, bengalese, estone, basco, franco, galiziano, croato, islandese, malayalam, macedone, maltese, malese, swahili, tamil, telugu.
  • Bug minori risolti.
  • È stata creata un'interfaccia OCR .NET di base (Vintasoft.Ocr.dll):
    • Capacità di riconoscere il testo su un'immagine o una raccolta di immagini.
    • Capacità di riconoscere il testo in qualsiasi area di un'immagine.
    • Possibilità di ricevere progressi di riconoscimento.
    • La possibilità di segmentare un'immagine prima del riconoscimento e di impostare i parametri di riconoscimento per ciascuna delle regioni trovate.
    • Possibilità di ottenere il risultato del riconoscimento sotto forma di gerarchia: Documento, Pagina, Regione, Paragrafo, Riga, Simbolo.
    • Possibilità di navigare nel risultato del riconoscimento.
    • Possibilità di modificare il risultato del riconoscimento.
    • Possibilità di salvare i risultati del riconoscimento come documento di testo (TXT).
  • Interfaccia Tesseract OCR (Vintasoft.Ocr.Tesseract.dll) creata:
    • Fornisce accesso alle funzionalità del motore Tesseract OCR.
    • Capacità di riconoscere il testo in un'immagine.
    • Capacità di riconoscere il testo in qualsiasi area di un'immagine.
    • Lingue supportate: inglese, arabo, bulgaro, catalano, ceco, cherokee, cinese semplificato, cinese tradizionale, danese, olandese, finlandese, francese, tedesco, greco, ebraico, hindi, ungherese, indonesiano, italiano, giapponese, coreano, lettone, lituano, norvegese, polacco, portoghese, rumeno, russo, serbo, slovacco, sloveno, spagnolo, svedese, tagalog, tailandese, turco, ucraino, vietnamita.
    • Possibilità di ricevere progressi di riconoscimento.
    • Possibilità di ottenere/impostare valori variabili Tesseract OCR.
    • Possibilità di utilizzare dizionari personalizzati.
  • È stata creata un'interfaccia per la generazione di file PDF con la possibilità di ricercare testo (Vintasoft.Pdf.Ocr.dll):
    • È possibile salvare i risultati del riconoscimento OCR in un documento PDF come testo.
    • La possibilità di salvare i risultati del riconoscimento OCR in un documento PDF come testo nascosto posizionato sotto l'immagine.