VintaSoft OCR .NET Plug-in | Արտադրանքի զարգացման պատմություն

Տարբերակ 10.0 (VintaSoft Imaging .NET SDK-ի 15.0 տարբերակը)

.NET-ի մշակում՝
- Ավելացվել է .NET 10-ի աջակցությունը Windows-ում և Linux-ում:
- Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.5.1 տարբերակին:

Տարբերակ 9.0 (VintaSoft Imaging .NET SDK-ի 14.0 տարբերակը)

.NET-ի մշակում՝
- Ավելացվել է .NET 9-ի աջակցություն Windows-ում և Linux-ում:
- Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.5.0 տարբերակին:
- Vintasoft.Imaging.Ocr.ML հավաքումն այժմ օգտագործում է Microsoft.ML 4.0.0:
- Դեմո հավելված՝
  - Վեբ ցուցադրական "OCR Demo" հավելվածն այժմ թույլ է տալիս միանգամից ճանաչել տեքստը բոլոր բեռնված պատկերներում, պահպանել տեքստի ճանաչման արդյունքը որոնելի PDF փաստաթղթում և ցուցադրել ստեղծված որոնելի PDF փաստաթուղթը՝ տեքստ ընտրելու և որոնելու ունակությամբ:

Տարբերակ 7.5 (VintaSoft Imaging .NET SDK-ի 12.5 տարբերակը)

.NET-ի մշակում՝
- Ավելացվել է Microsoft.ML-ի վրա հիմնված նեյրոնային ցանցի միջոցով ձեռագիր թվերի շարքը ճանաչելու ունակություն:
- Փոքր վրիպակներ շտկվեցին:

Տարբերակ 7.4 (VintaSoft Imaging .NET SDK-ի 12.4 տարբերակը)

.NET-ի մշակում՝
- Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.3.4 տարբերակին:

Տարբերակ 7.3 (VintaSoft Imaging .NET SDK-ի 12.3 տարբերակը)

Ավելացված է աջակցություն .NET 8.0-ին Windows, Linux և macOS-ում։
Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.3.3 տարբերակին:
Այժմ բոլոր տեքստային բլոկները, որոնք ստացվում են պատկերի հատվածավորման հրամանից, նշվում են որպես RecognizeSingleColumn տեսակի բլոկներ։ Նախկինում բլոկները նշվում էին որպես RecognizeSingleBlock բլոկներ: Այս փոփոխությունը բարձրացրեց բարդ տեքստի ճանաչման որակը՝ չնվազեցնելով տեքստի ճանաչման ընդհանուր կատարումը:

Տարբերակ 7.2 (VintaSoft Imaging .NET SDK-ի 12.2 տարբերակը)

.NET-ի մշակում՝
- Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.3 տարբերակին:

Տարբերակ 7.1 (VintaSoft Imaging .NET SDK-ի 12.1 տարբերակը)

.NET-ի մշակում՝
- Ավելացվել է .NET 7-ի աջակցություն Windows-ում և Linux-ում։
- Ավելացրել է Linux-ում տեքստը ճանաչելու հնարավորություն։
- Բարելավել է ճանաչված նիշերի շրջանները որոշելու ալգորիթմը։
- Դեմո հավելվածներ՝
  - TextOverImage ռեժիմում որոնելի PDF փաստաթուղթ ստեղծելու հնարավորությունն ավելացվել է OcrDemo-ին:
- Մի քանի աննշան ուղղում է սխալները:

Տարբերակ 6.0 (VintaSoft Imaging .NET SDK-ի 11.0 տարբերակը)

.NET-ի մշակում՝
- Աջակցվող հարթակներ՝
  - Ավելացված է աջակցություն .NET 6 Windows-ի համար:
- Աջակցվող զարգացման միջավայրեր.
  - Ավելացվեց աջակցություն Visual Studio 2022-ի հետ համատեղելիության համար:
- Աջակցվող ՕՀ՝
  - Ավելացված աջակցություն Windows 11 ՕՀ-ի հետ համատեղելիության համար:
  - Համատեղելիությունը Windows Server 2003-ի հետ դադարեցվել է
- Օգտագործված Tesseract OCR շարժիչը թարմացվել է 5.0 տարբերակին: Մեր թեստերը ցույց են տվել, որ Tesseract OCR 5-ը և Tesseract OCR 4-ը տալիս են մոտավորապես նույն տեքստի ճանաչման արդյունքները, բայց Tesseract OCR 5-ը մինչև 2 անգամ ավելի արագ է, քան Tesseract OCR 4-ը:
- Ավելացրել է OcrPage օբյեկտը փոխարկելու հնարավորությունը Textreate.
- Դեմո հավելվածներ՝
  - "OCR Demo" ցուցադրական հավելվածին ավելացվել է նոր ֆունկցիոնալություն.
    - Ավելացրել է PDF փաստաթղթի տեքստից OCR-ի արդյունքները ներբեռնելու հնարավորություն:
- Մի քանի աննշան ուղղում է սխալները:
Վեբ մշակում՝
- Դեմո հավելվածներ՝
  - "ASP.NET OCR Demo" ցուցադրական հավելվածի կոդը ("ASP.NET Core Angular OCR Demo", "ASP.NET MVC OCR Demo", "ASP.NET WebForms OCR Demo") բարելավվել է, և այժմ ցուցադրական հավելվածը թույլ է տալիս.
    - նախադիտել փաստաթուղթը նախքան տեքստը ճանաչելը
    - մշակել փաստաթղթի էջերը նախքան տեքստը ճանաչելը
    - ճանաչել տեքստը ամբողջ փաստաթղթում, մեկ էջի կամ էջի հատվածում:
- OCR վեբ ծառայության մի քանի փոքր վրիպակներ շտկվել են:

Տարբերակ 5.0 (VintaSoft Imaging .NET SDK-ի 10.0 տարբերակը)

.NET-ի մշակում՝
- Աջակցվող հարթակներ՝
  - Ավելացված է աջակցություն .NET 5 Windows-ի համար:

Տարբերակ 4.0 (VintaSoft Imaging .NET SDK-ի 9.0 տարբերակը)

.NET-ի մշակում՝
- Աջակցվող հարթակներ՝
  - Ավելացված աջակցություն (առանց UI-ի կառավարումների) .NET Core 3 Windows-ի համար:
    Ստեղծվել են հետևյալ .NET Core հավաքները.
    - Vintasoft.Imaging.Ocr.dll
    - Vintasoft.Imaging.Ocr.Tesseract.dll
  - .NET Framework 2.0-ը դադարեցվել է, SDK-ն այժմ աջակցում է .NET Framework 4+ և 3.5:
- Օգտագործված Tesseract OCR շարժիչը թարմացվել է 4.1.0 տարբերակին:

Տարբերակ 3.7.2 (VintaSoft Imaging .NET SDK-ի 8.7.2 տարբերակ)

Օգտագործված Tesseract OCR շարժիչը թարմացվել է 4.0 տարբերակին՝
- Բարելավված կատարողականություն և տեքստի ճանաչման որակ:
- Ավելացվեց նոր լեզուներ ճանաչելու աջակցություն:
Ավելացրել է մի քանի լեզուներով տեքստը միանգամից ճանաչելու հնարավորություն՝ օգտագործելով Tesseract OCR ֆունկցիան: Նախկինում հնարավոր էր ճանաչել տեքստը միանգամից մի քանի լեզուներով՝ օգտագործելով SDK ֆունկցիոնալությունը:
"OCR Demo" ցուցադրական հավելվածին ավելացվել է տեքստի ճանաչման համար մի քանի լեզուներ ընտրելու հնարավորություն:

Տարբերակ 3.5 (VintaSoft Imaging .NET SDK-ի 8.5 տարբերակը)

Օգտագործված Tesseract OCR շարժիչը թարմացվել է 3.04 տարբերակին.
- Տեքստի ճանաչման որակը բարելավվել է
- Աջակցվող ճանաչման լեզուների ցանկը ընդլայնվել է:
Ավելացվել է Tesseract OCR շարժիչը բազմաշերտ միջավայրում օգտագործելու հնարավորություն:
Գունավոր պատկերներում տեքստի ճանաչման որակը բարելավվել է:
Հիշողության առավելագույն օգտագործման նվազեցում գունավոր պատկերներում տեքստը ճանաչելիս:
Ավելացվեց HOCR ձևաչափով ճանաչման արդյունքների ծառը ներմուծելու/արտահանելու հնարավորություն:
Շատ աննշան ուղղումներ և բարելավումներ:

Տարբերակ 3.4 (VintaSoft Imaging .NET SDK-ի 8.4 տարբերակը)

Ավելացրել է տեքստային շրջանի ուղղանկյուն պտտման անկյունը նշելու հնարավորությունը տեքստի ճանաչումից առաջ: Նախկինում ամբողջ տեքստը ճանաչվում էր որպես չպտտվող:

Տարբերակ 3.3 (VintaSoft Imaging .NET SDK-ի 8.3 տարբերակը)

"OCR Demo" ցուցադրական ծրագիրը այժմ կարող է ստեղծել որոնելի PDF փաստաթղթեր MRC սեղմման միջոցով։

Տարբերակ 3.1 (VintaSoft Imaging .NET SDK-ի 8.1 տարբերակը)

Մի քանի փոքր բարելավումներ:
"OCR Demo" դեմո ծրագրի կոդը բարելավվել է։

Տարբերակ 3.0 (VintaSoft Imaging .NET SDK-ի 8.0 տարբերակը)

Վերանվանել է ժողովները և փոփոխություններ է կատարել անվանատարածքի կառուցվածքում: Ավելի մանրամասն տեղեկություններ ներկայացված են փաստաթղթերում:

Տարբերակ 2.2 (VintaSoft Imaging .NET SDK-ի 7.2 տարբերակը)

Օգտագործված Tesseract OCR շարժիչը թարմացվել է 3.02 տարբերակին:
- OCR որակը բարելավվել է:
- Նոր աջակցվող լեզուներ՝ աֆրիկանս, ալբաներեն, ադրբեջաներեն, բելառուսերեն, բենգալերեն, էստոներեն, բասկերեն, ֆրանկո, գալիցերեն, խորվաթերեն, իսլանդերեն, մալայալամ, մակեդոներեն, մալթերեն, մալայերեն, սուահիլի, թամիլերեն, թելուգու:
Փոքր վրիպակներ շտկվեցին:

Տարբերակ 1.0 (VintaSoft Imaging .NET SDK-ի 6.0 տարբերակը)

Ստեղծվել է հիմնական OCR .NET ինտերֆեյս (Vintasoft.Ocr.dll).
- Պատկերի կամ պատկերների հավաքածուի տեքստը ճանաչելու ունակություն:
- Պատկերի ցանկացած հատվածի տեքստը ճանաչելու ունակություն:
- Ճանաչման առաջընթաց ստանալու ունակություն։
- Պատկերը ճանաչելուց առաջ հատվածավորելու և գտնված յուրաքանչյուր շրջանի համար ճանաչման պարամետրեր սահմանելու ունակություն:
- Հիերարխիայի տեսքով ճանաչման արդյունքը ստանալու հնարավորություն՝ փաստաթուղթ, էջ, տարածաշրջան, պարբերություն, տող, խորհրդանիշ:
- Հնարավորություն նավարկելու ճանաչման արդյունքով:
- Հնարավորություն է խմբագրել ճանաչման արդյունքը։
- Ճանաչման արդյունքները որպես տեքստային (TXT) փաստաթուղթ պահելու ունակություն:
Tesseract OCR ինտերֆեյսը (Vintasoft.Ocr.Tesseract.dll) ստեղծվել է՝
- Տեսերակտի OCR շարժիչի ֆունկցիոնալության հասանելիության ապահովում:
- Պատկերում տեքստը ճանաչելու ունակություն:
- Պատկերի ցանկացած հատվածի տեքստը ճանաչելու ունակություն:
- Աջակցվող լեզուներ՝ անգլերեն, արաբերեն, բուլղարերեն, կատալոներեն, չեխերեն, չերոկի,Չինարեն պարզեցված, չինարեն ավանդական, դանիերեն, հոլանդերեն, ֆիններեն, ֆրանսերեն, գերմաներեն, հունարեն, եբրայերեն, հինդի, հունգարերեն, ինդոնեզերեն, իտալերեն, ճապոներեն, կորեերեն, լատվիերեն, լիտվերեն, նորվեգերեն, լեհերեն, պորտուգալերեն, ռումիներեն, ռուսերեն, սերբերեն, սլովակերեն, սլովեներեն, իսպաներեն, շվեդերեն, տագալոգ, թայերեն, թուրքերեն, ուկրաիներեն, վիետնամերեն:
- Ճանաչման առաջընթաց ստանալու ունակություն։
- Tesseract OCR փոփոխական արժեքներ ստանալու/սահմանելու ունակություն:
- Պատվիրված բառարաններ օգտագործելու ունակություն:
Ստեղծվել է PDF ֆայլեր ստեղծելու ինտերֆեյս՝ տեքստ որոնելու ունակությամբ (Vintasoft.Pdf.Ocr.dll):
- OCR ճանաչումը պահպանելու ունակությունը հանգեցնում է PDF փաստաթղթի՝ որպես տեքստ:
- OCR ճանաչումը պահպանելու ունակությունը հանգեցնում է PDF փաստաթղթի՝ որպես թաքնված տեքստի, որը գտնվում է պատկերի տակ:

VintaSoft OCR .NET Plug-in - Մշակման պատմություն

Տարբերակ 10.0 (VintaSoft Imaging .NET SDK-ի 15.0 տարբերակը)

Տարբերակ 9.0 (VintaSoft Imaging .NET SDK-ի 14.0 տարբերակը)

Տարբերակ 7.5 (VintaSoft Imaging .NET SDK-ի 12.5 տարբերակը)

Տարբերակ 7.4 (VintaSoft Imaging .NET SDK-ի 12.4 տարբերակը)

Տարբերակ 7.3 (VintaSoft Imaging .NET SDK-ի 12.3 տարբերակը)

Տարբերակ 7.2 (VintaSoft Imaging .NET SDK-ի 12.2 տարբերակը)

Տարբերակ 7.1 (VintaSoft Imaging .NET SDK-ի 12.1 տարբերակը)

Տարբերակ 6.0 (VintaSoft Imaging .NET SDK-ի 11.0 տարբերակը)

Տարբերակ 5.0 (VintaSoft Imaging .NET SDK-ի 10.0 տարբերակը)

Տարբերակ 4.0 (VintaSoft Imaging .NET SDK-ի 9.0 տարբերակը)

Տարբերակ 3.7.2 (VintaSoft Imaging .NET SDK-ի 8.7.2 տարբերակ)

Տարբերակ 3.5 (VintaSoft Imaging .NET SDK-ի 8.5 տարբերակը)

Տարբերակ 3.4 (VintaSoft Imaging .NET SDK-ի 8.4 տարբերակը)

Տարբերակ 3.3 (VintaSoft Imaging .NET SDK-ի 8.3 տարբերակը)

Տարբերակ 3.1 (VintaSoft Imaging .NET SDK-ի 8.1 տարբերակը)

Տարբերակ 3.0 (VintaSoft Imaging .NET SDK-ի 8.0 տարբերակը)

Տարբերակ 2.2 (VintaSoft Imaging .NET SDK-ի 7.2 տարբերակը)

Տարբերակ 1.0 (VintaSoft Imaging .NET SDK-ի 6.0 տարբերակը)