Convertir un document PDF en document DOCX en C#

Catégorie du blog: PDFOffice.NET

12.04.2024

Un document PDF est un document contenant une description complète de la mise en page fixe de ses éléments sur un plan, notamment le texte, les polices, les graphiques et toutes les autres informations nécessaires à son affichage. L'avantage principal du PDF est qu'il conserve un aspect identique quel que soit l'appareil utilisé. Autre avantage: le contenu de chaque page est stocké séparément. Ainsi, il est possible d'afficher uniquement la dernière page d'un document PDF de 1 000 pages sans avoir à charger toutes les autres. En revanche, la modification du contenu d'un document PDF s'avère complexe.

Un document DOCX est un document au format Microsoft Word Open XML contenant du texte, des images, des graphiques, etc. L'avantage d'un document DOCX réside dans la simplicité et l'intuitivité de son édition. Son inconvénient est qu'il nécessite une mise en page pour diviser le contenu en pages. Autrement dit, pour un document DOCX de 1 000 pages, il faut générer toutes les pages, même si l'on ne souhaite consulter que la dernière.

Compte tenu des avantages et inconvénients décrits ci-dessus, il apparaît qu'un fichier PDF est pratique pour la consultation et le stockage d'un document, tandis qu'un fichier DOCX est pratique pour sa création et son édition.

VintaSoft Imaging .NET SDK permet de modifier le contenu d'un document PDF et vous pouvez en savoir plus à ce sujet ici.

VintaSoft Imaging .NET SDK permet également de convertir un document PDF en document DOCX afin de le modifier ultérieurement dans un éditeur de texte approprié, tel que Microsoft Office Word ou OpenOffice Writer.

VintaSoft Imaging .NET SDK permet également de convertir un document DOCX Retour à un document PDF.

Voici du code C# permettant de convertir un document PDF en document DOCX:
/// <summary>
/// Converts PDF document to a DOCX document.
/// </summary>
public static void ConvertPdfToDocx(string pdfFileName, string docxFileName)
{
    // create an image collection
    using (Vintasoft.Imaging.ImageCollection imageCollection = new Vintasoft.Imaging.ImageCollection())
    {
        // add PDF document to the image collection
        imageCollection.Add(pdfFileName);

        // save images of image collection (PDF pages) to a DOCX file
        imageCollection.SaveSync(docxFileName);

        // dispose images
        imageCollection.ClearAndDisposeItems();
    }
}

Voici du code C# permettant de convertir un document DOCX en document PDF:
/// <summary>
/// Converts DOCX document to a PDF document.
/// </summary>
public static void ConvertDocxToPdf(string docxFileName, string pdfFileName)
{
    // create an image collection
    using (Vintasoft.Imaging.ImageCollection imageCollection = new Vintasoft.Imaging.ImageCollection())
    {
        // add DOCX document to the image collection
        imageCollection.Add(docxFileName);

        // create PdfEncoder
        using (Vintasoft.Imaging.Codecs.Encoders.PdfEncoder pdfEncoder = 
            new Vintasoft.Imaging.Codecs.Encoders.PdfEncoder(true))
        {
            // set compression for image resources in PDF document
            pdfEncoder.Settings.Compression = Vintasoft.Imaging.Codecs.Encoders.PdfImageCompression.Jpeg;

            // save images of image collection (DOCX pages) to a PDF document
            imageCollection.SaveSync(pdfFileName, pdfEncoder);
        }

        // dispose images
        imageCollection.ClearAndDisposeItems();
    }
}