Konvertierung eines PDF-Dokuments in ein DOCX-Dokument in C#

Blog-Kategorie: PDFOffice.NET

12.04.2024

Ein PDF-Dokument ist ein Dokument, das eine vollständige Beschreibung des festen Layouts seiner Elemente auf einer Ebene enthält, einschließlich Text, Schriftarten, Grafiken und anderer Informationen, die zur Anzeige des Dokuments erforderlich sind. Der Vorteil eines PDF-Dokuments besteht darin, dass es auf jedem Gerät gleich aussieht. Ein weiterer Vorteil ist, dass der Inhalt jeder Seite separat gespeichert wird. So kann man beispielsweise die letzte Seite eines 1000-seitigen PDF-Dokuments anzeigen, ohne alle anderen Seiten neu laden zu müssen. Der Nachteil von PDF-Dokumenten ist die Schwierigkeit, ihren Inhalt zu bearbeiten.

Ein DOCX-Dokument ist ein Microsoft Word Open XML-Dokument, das Text, Bilder, Grafiken und mehr enthält. Der Vorteil von DOCX-Dokumenten liegt in der einfachen und intuitiven Bearbeitung des Inhalts. Der Nachteil besteht darin, dass der Dokumentinhalt formatiert werden muss, um ihn in Seiten aufzuteilen. Das heißt, bei einem 1000-seitigen DOCX-Dokument müssen alle Seiten gerendert werden, selbst wenn man nur die letzte Seite benötigt.

Aufgrund der oben beschriebenen Vor- und Nachteile ist eine PDF-Datei praktisch zum Anzeigen und Speichern eines Dokuments, während eine DOCX-Datei praktisch zum Erstellen und Bearbeiten eines Dokuments ist.

VintaSoft Imaging .NET SDK ermöglicht die Bearbeitung von PDF-Dokumenten. Weitere Informationen finden Sie hier.

Das VintaSoft Imaging .NET SDK ermöglicht außerdem die Konvertierung eines PDF-Dokuments in ein DOCX-Dokument zur weiteren Bearbeitung in einem geeigneten Texteditor wie Microsoft Office Word oder OpenOffice Writer.

Das VintaSoft Imaging .NET SDK ermöglicht auch die Rückkonvertierung eines DOCX-Dokuments in ein PDF-Dokument.

Hier ist C#-Code, der die Konvertierung eines PDF-Dokuments in ein DOCX-Dokument ermöglicht:
/// <summary>
/// Converts PDF document to a DOCX document.
/// </summary>
public static void ConvertPdfToDocx(string pdfFileName, string docxFileName)
{
    // create an image collection
    using (Vintasoft.Imaging.ImageCollection imageCollection = new Vintasoft.Imaging.ImageCollection())
    {
        // add PDF document to the image collection
        imageCollection.Add(pdfFileName);

        // save images of image collection (PDF pages) to a DOCX file
        imageCollection.SaveSync(docxFileName);

        // dispose images
        imageCollection.ClearAndDisposeItems();
    }
}

Hier ist C#-Code, der die Konvertierung eines DOCX-Dokuments in ein PDF-Dokument ermöglicht:
/// <summary>
/// Converts DOCX document to a PDF document.
/// </summary>
public static void ConvertDocxToPdf(string docxFileName, string pdfFileName)
{
    // create an image collection
    using (Vintasoft.Imaging.ImageCollection imageCollection = new Vintasoft.Imaging.ImageCollection())
    {
        // add DOCX document to the image collection
        imageCollection.Add(docxFileName);

        // create PdfEncoder
        using (Vintasoft.Imaging.Codecs.Encoders.PdfEncoder pdfEncoder = 
            new Vintasoft.Imaging.Codecs.Encoders.PdfEncoder(true))
        {
            // set compression for image resources in PDF document
            pdfEncoder.Settings.Compression = Vintasoft.Imaging.Codecs.Encoders.PdfImageCompression.Jpeg;

            // save images of image collection (DOCX pages) to a PDF document
            imageCollection.SaveSync(pdfFileName, pdfEncoder);
        }

        // dispose images
        imageCollection.ClearAndDisposeItems();
    }
}