VintaSoft OCR.NET Plug-in - Զարգացման պատմություն

Տեղեկություններ արտադրանքի թողարկման մասին

Այս էջում կարող եք տեղեկություններ ստանալ VintaSoft OCR .NET Plug-in-ի զարգացման ընդհանուր պատմության մասին: SDK API-ի փոփոխությունների մասին տեղեկությունները կարելի է գտնել փաստաթղթերում:

  • .NET-ի մշակում՝
    • Ավելացվել է .NET 9-ի աջակցություն Windows-ում և Linux-ում:
    • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.5.0 տարբերակին:
    • Vintasoft.Imaging.Ocr.ML հավաքումն այժմ օգտագործում է Microsoft.ML 4.0.0:
    • Դեմո հավելված՝
      • Վեբ ցուցադրական "OCR Demo" հավելվածն այժմ թույլ է տալիս միանգամից ճանաչել տեքստը բոլոր բեռնված պատկերներում, պահպանել տեքստի ճանաչման արդյունքը որոնելի PDF փաստաթղթում և ցուցադրել ստեղծված որոնելի PDF փաստաթուղթը՝ տեքստ ընտրելու և որոնելու ունակությամբ:
  • .NET-ի մշակում՝
    • Ավելացվել է Microsoft.ML-ի վրա հիմնված նեյրոնային ցանցի միջոցով ձեռագիր թվերի շարքը ճանաչելու ունակություն:
    • Փոքր վրիպակներ շտկվեցին:
  • .NET-ի մշակում՝
    • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.3.4 տարբերակին:
  • Ավելացված է աջակցություն .NET 8.0-ին Windows, Linux և macOS-ում։
  • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.3.3 տարբերակին:
  • Այժմ բոլոր տեքստային բլոկները, որոնք ստացվում են պատկերի հատվածավորման հրամանից, նշվում են որպես RecognizeSingleColumn տեսակի բլոկներ։ Նախկինում բլոկները նշվում էին որպես RecognizeSingleBlock բլոկներ: Այս փոփոխությունը բարձրացրեց բարդ տեքստի ճանաչման որակը՝ չնվազեցնելով տեքստի ճանաչման ընդհանուր կատարումը:
  • .NET-ի մշակում՝
    • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.3 տարբերակին:
  • .NET-ի մշակում՝
    • Ավելացվել է .NET 7-ի աջակցություն Windows-ում և Linux-ում։
    • Ավելացրել է Linux-ում տեքստը ճանաչելու հնարավորություն։
    • Բարելավել է ճանաչված նիշերի շրջանները որոշելու ալգորիթմը։
    • Դեմո հավելվածներ՝
      • TextOverImage ռեժիմում որոնելի PDF փաստաթուղթ ստեղծելու հնարավորությունն ավելացվել է OcrDemo-ին:
    • Մի քանի աննշան ուղղում է սխալները:
  • .NET-ի մշակում՝
    • Աջակցվող հարթակներ՝
      • Ավելացված է աջակցություն .NET 6 Windows-ի համար:
    • Աջակցվող զարգացման միջավայրեր.
      • Ավելացվեց աջակցություն Visual Studio 2022-ի հետ համատեղելիության համար:
    • Աջակցվող ՕՀ՝
      • Ավելացված աջակցություն Windows 11 ՕՀ-ի հետ համատեղելիության համար:
      • Համատեղելիությունը Windows Server 2003-ի հետ դադարեցվել է
    • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.0 տարբերակին: Մեր թեստերը ցույց են տվել, որ Tesseract OCR 5-ը և Tesseract OCR 4-ը տալիս են մոտավորապես նույն տեքստի ճանաչման արդյունքները, բայց Tesseract OCR 5-ը մինչև 2 անգամ ավելի արագ է, քան Tesseract OCR 4-ը:
    • Ավելացրել է OcrPage օբյեկտը փոխարկելու հնարավորությունը Textreate.
    • Դեմո հավելվածներ՝
      • Նոր ֆունկցիոնալություն ավելացվել է OCR-ի ցուցադրությանը.
        • Ավելացրել է PDF փաստաթղթի տեքստից OCR-ի արդյունքները ներբեռնելու հնարավորություն:
    • Մի քանի աննշան ուղղում է սխալները:
  • Վեբ մշակում՝
    • Դեմո հավելվածներ՝
      • ASP.NET OCR Դեմո կոդը բարելավվել է (ASP.NET Core Angular OCR Demo, ASP.NET MVC OCR Demo, ASP.NET WebForms OCR Demo) և այժմ ցուցադրական հավելվածը թույլ է տալիս.
        • նախադիտել փաստաթուղթը նախքան տեքստը ճանաչելը
        • մշակել փաստաթղթի էջերը նախքան տեքստը ճանաչելը
        • ճանաչել տեքստը ամբողջ փաստաթղթում, մեկ էջի կամ էջի հատվածում:
    • OCR վեբ ծառայության մի քանի փոքր վրիպակներ շտկվել են:
  • .NET-ի մշակում՝
    • Աջակցվող հարթակներ՝
      • Ավելացված է աջակցություն .NET 5 Windows-ի համար:
  • .NET-ի մշակում՝
    • Աջակցվող հարթակներ՝
      • Ավելացված աջակցություն (առանց UI-ի կառավարումների) .NET Core 3 Windows-ի համար:
        Ստեղծվել են հետևյալ .NET Core հավաքները.
        • Vintasoft.Imaging.Ocr.dll
        • Vintasoft.Imaging.Ocr.Tesseract.dll
      • .NET Framework 2.0-ը դադարեցվել է, SDK-ն այժմ աջակցում է .NET Framework 4+ և 3.5:
    • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 4.1.0 տարբերակին:
  • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 4.0 տարբերակին՝
    • Բարելավված կատարողականություն և տեքստի ճանաչման որակ:
    • Ավելացվեց նոր լեզուներ ճանաչելու աջակցություն:
  • Ավելացրել է մի քանի լեզուներով տեքստը միանգամից ճանաչելու հնարավորություն՝ օգտագործելով Tesseract OCR ֆունկցիան: Նախկինում հնարավոր էր ճանաչել տեքստը միանգամից մի քանի լեզուներով՝ օգտագործելով SDK ֆունկցիոնալությունը:
  • OcrDemo ցուցադրական հավելվածն այժմ թույլ է տալիս ընտրել բազմաթիվ լեզուներ տեքստի ճանաչման համար:
  • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 3.04 տարբերակին.
    • Տեքստի ճանաչման որակը բարելավվել է
    • Աջակցվող ճանաչման լեզուների ցանկը ընդլայնվել է:
  • Ավելացվել է Tesseract OCR շարժիչը բազմաշերտ միջավայրում օգտագործելու հնարավորություն:
  • Գունավոր պատկերներում տեքստի ճանաչման որակը բարելավվել է:
  • Հիշողության առավելագույն օգտագործման նվազեցում գունավոր պատկերներում տեքստը ճանաչելիս:
  • Ավելացվեց HOCR ձևաչափով ճանաչման արդյունքների ծառը ներմուծելու/արտահանելու հնարավորություն:
  • Շատ աննշան ուղղումներ և բարելավումներ:
  • Ավելացրել է տեքստային շրջանի ուղղանկյուն պտտման անկյունը նշելու հնարավորությունը տեքստի ճանաչումից առաջ: Նախկինում ամբողջ տեքստը ճանաչվում էր որպես չպտտվող:
  • OCR Demo-ն այժմ կարող է ստեղծել որոնելի PDF փաստաթղթեր MRC սեղմումով:
  • Մի քանի փոքր բարելավումներ:
  • Բարելավվել է OcrDemo ցուցադրական հավելվածի կոդը։
  • Վերանվանել է ժողովները և փոփոխություններ է կատարել անվանատարածքի կառուցվածքում: Ավելի մանրամասն տեղեկություններ ներկայացված են փաստաթղթերում:
  • Օգտագործված Tesseract OCR շարժիչը թարմացվել է 3.02 տարբերակին:
    • OCR որակը բարելավվել է:
    • Նոր աջակցվող լեզուներ՝ աֆրիկանս, ալբաներեն, ադրբեջաներեն, բելառուսերեն, բենգալերեն, էստոներեն, բասկերեն, ֆրանկո, գալիցերեն, խորվաթերեն, իսլանդերեն, մալայալամ, մակեդոներեն, մալթերեն, մալայերեն, սուահիլի, թամիլերեն, թելուգու:
  • Մի փոքր ուղղումներ։
  • Ստեղծվել է հիմնական OCR .NET ինտերֆեյս (Vintasoft.Ocr.dll).
    • Պատկերի կամ պատկերների հավաքածուի տեքստը ճանաչելու ունակություն:
    • Պատկերի ցանկացած հատվածի տեքստը ճանաչելու ունակություն:
    • Ճանաչման առաջընթաց ստանալու ունակություն։
    • Պատկերը ճանաչելուց առաջ հատվածավորելու և գտնված յուրաքանչյուր շրջանի համար ճանաչման պարամետրեր սահմանելու ունակություն:
    • Հիերարխիայի տեսքով ճանաչման արդյունքը ստանալու հնարավորություն՝ փաստաթուղթ, էջ, տարածաշրջան, պարբերություն, տող, խորհրդանիշ:
    • Հնարավորություն նավարկելու ճանաչման արդյունքով:
    • Հնարավորություն է խմբագրել ճանաչման արդյունքը։
    • Ճանաչման արդյունքները որպես տեքստային (TXT) փաստաթուղթ պահելու ունակություն:
  • Tesseract OCR ինտերֆեյսը (Vintasoft.Ocr.Tesseract.dll) ստեղծվել է՝
    • Տեսերակտի OCR շարժիչի ֆունկցիոնալության հասանելիության ապահովում:
    • Պատկերում տեքստը ճանաչելու ունակություն:
    • Պատկերի ցանկացած հատվածի տեքստը ճանաչելու ունակություն:
    • Աջակցվող լեզուներ՝ անգլերեն, արաբերեն, բուլղարերեն, կատալոներեն, չեխերեն, չերոկի,Չինարեն պարզեցված, չինարեն ավանդական, դանիերեն, հոլանդերեն, ֆիններեն, ֆրանսերեն, գերմաներեն, հունարեն, եբրայերեն, հինդի, հունգարերեն, ինդոնեզերեն, իտալերեն, ճապոներեն, կորեերեն, լատվիերեն, լիտվերեն, նորվեգերեն, լեհերեն, պորտուգալերեն, ռումիներեն, ռուսերեն, սերբերեն, սլովակերեն, սլովեներեն, իսպաներեն, շվեդերեն, տագալոգ, թայերեն, թուրքերեն, ուկրաիներեն, վիետնամերեն:
    • Ճանաչման առաջընթաց ստանալու ունակություն։
    • Tesseract OCR փոփոխական արժեքներ ստանալու/սահմանելու ունակություն:
    • Պատվիրված բառարաններ օգտագործելու ունակություն:
  • Ստեղծվել է PDF ֆայլեր ստեղծելու ինտերֆեյս՝ տեքստ որոնելու ունակությամբ (Vintasoft.Pdf.Ocr.dll):
    • OCR ճանաչումը պահպանելու ունակությունը հանգեցնում է PDF փաստաթղթի՝ որպես տեքստ:
    • OCR ճանաչումը պահպանելու ունակությունը հանգեցնում է PDF փաստաթղթի՝ որպես թաքնված տեքստի, որը գտնվում է պատկերի տակ: