Nicht angemeldeter Benutzer - Bearbeiten von Seiten ist nur als angemeldeter Benutzer möglich.

Portable Document Format: Unterschied zwischen den Versionen

Aus imedwiki
Zur Navigation springen Zur Suche springen
[unmarkierte Version][unmarkierte Version]
K (Interwikilinks anpassen)
 
Zeile 1: Zeile 1:
Das '''Portable Document Format''' (kurz '''PDF'''; deutsch: ''(trans)portables Dokumentenformat'') ist ein [[Plattformunabhängigkeit|plattformunabhängiges]] [[Dateiformat]], das 1993 vom Unternehmen [[Adobe Inc.]] entwickelt und veröffentlicht wurde und aktuell von der [[PDF Association]] weiterentwickelt wird.
+
Das '''Portable Document Format''' (kurz '''PDF'''; deutsch: ''(trans)portables Dokumentenformat'') ist ein [[Wikipedia:Plattformunabhängigkeit|plattformunabhängiges]] [[Wikipedia:Dateiformat|Dateiformat]], das 1993 vom Unternehmen [[Wikipedia:Adobe Inc.|Adobe Inc.]] entwickelt und veröffentlicht wurde und aktuell von der [[Wikipedia:PDF Association|PDF Association]] weiterentwickelt wird.
  
 
Ziel war, ein Dateiformat für elektronische Schriftstücke zu schaffen, sodass diese unabhängig vom ursprünglichen Anwendungsprogramm, vom Betriebssystem oder von der Hardwareplattform originalgetreu wiedergegeben werden können. Das Ziel wurde erreicht und findet seinen Niederschlag in der [[Internationale Organisation für Normung|ISO]]-Normenserie 32000 (ISO 15930 für [[PDF/X]]).
 
Ziel war, ein Dateiformat für elektronische Schriftstücke zu schaffen, sodass diese unabhängig vom ursprünglichen Anwendungsprogramm, vom Betriebssystem oder von der Hardwareplattform originalgetreu wiedergegeben werden können. Das Ziel wurde erreicht und findet seinen Niederschlag in der [[Internationale Organisation für Normung|ISO]]-Normenserie 32000 (ISO 15930 für [[PDF/X]]).
  
Hierzu griff man wesentlich auf die Funktionsweise des [[PostScript]]-Formats zurück. Ein Leser einer PDF-Datei soll das Schriftstück immer in der Form betrachten und ausdrucken können, die der Autor festgelegt hat. Die typischen Konvertierungsprobleme (wie veränderter Seitenumbruch oder falsche Schriftarten) beim Austausch eines Schriftstückes zwischen verschiedenen Programmen entfallen dadurch.
+
Hierzu griff man wesentlich auf die Funktionsweise des [[Wikipedia:PostScript|PostScript]]-Formats zurück. Ein Leser einer PDF-Datei soll das Schriftstück immer in der Form betrachten und ausdrucken können, die der Autor festgelegt hat. Die typischen Konvertierungsprobleme (wie veränderter Seitenumbruch oder falsche Schriftarten) beim Austausch eines Schriftstückes zwischen verschiedenen Programmen entfallen dadurch.
  
 
Neben Text, Bildern und Grafik kann eine PDF-Datei auch Hilfen enthalten, die die Navigation innerhalb des Schriftstückes erleichtern. Dazu gehören zum Beispiel anklickbare Inhaltsverzeichnisse und miniaturisierte Seitenvorschauen.
 
Neben Text, Bildern und Grafik kann eine PDF-Datei auch Hilfen enthalten, die die Navigation innerhalb des Schriftstückes erleichtern. Dazu gehören zum Beispiel anklickbare Inhaltsverzeichnisse und miniaturisierte Seitenvorschauen.
Zeile 9: Zeile 9:
 
== Übersicht ==
 
== Übersicht ==
 
=== Grundlagen und Software ===
 
=== Grundlagen und Software ===
Aus [[Text]]en, [[Rastergrafik|Bildern]] und [[Vektorgrafik|Grafiken]] – gemischt oder einzeln – lassen sich mit entsprechenden Programmen PDF-Dokumente und -Dateien erzeugen (z. B. mit freien Programmen wie dem [[PDFCreator]] und Büropaketen [[LibreOffice]]/[[Apache OpenOffice|OpenOffice.org]], kostenpflichtigen wie [[Adobe Acrobat]] oder einfach über den Druckdialog) und mit entsprechenden Leseprogrammen darstellen (z. B. [[Evince]], [[Ghostscript]], [[Okular (Software)|Okular]], [[Adobe Reader]], [[Foxit Reader|Foxit]], [[Vorschau (Software)|Vorschau]]). Der Ersteller einer PDF-Datei kann diese in vielfältiger Weise vor ungewolltem Gebrauch schützen, indem er die Sicherungsmechanismen von PDF aktiviert. Durch [[Verschlüsselung]] soll der Zugriff Unbefugter verhindert werden. Je nach Bedarf kann bereits das Öffnen der Datei ein Passwort erfordern, oder das Kopieren von Inhalten aus der Datei oder das Ausdrucken wird nicht zugelassen. Die dafür in PDF implementierten Schutzmechanismen sind jedoch nicht zuverlässig; insbesondere sind einfachere Formen der Verschlüsselung leicht zu überwinden.
+
Aus [[Wikipedia:Text|Text]]en, [[Wikipedia:Rastergrafik|Bildern]] und [[Wikipedia:Vektorgrafik|Grafiken]] – gemischt oder einzeln – lassen sich mit entsprechenden Programmen PDF-Dokumente und -Dateien erzeugen (z. B. mit freien Programmen wie dem [[Wikipedia:PDFCreator|PDFCreator]] und Büropaketen [[Wikipedia:LibreOffice|LibreOffice]]/[[Wikipedia:Apache OpenOffice|OpenOffice.org]], kostenpflichtigen wie [[Wikipedia:Adobe Acrobat|Adobe Acrobat]] oder einfach über den Druckdialog) und mit entsprechenden Leseprogrammen darstellen (z. B. [[Wikipedia:Evince|Evince]], [[Wikipedia:Ghostscript|Ghostscript]], [[Wikipedia:Okular (Software)|Okular]], [[Wikipedia:Adobe Reader|Adobe Reader]], [[Wikipedia:Foxit Reader|Foxit]], [[Wikipedia:Vorschau (Software)|Vorschau]]). Der Ersteller einer PDF-Datei kann diese in vielfältiger Weise vor ungewolltem Gebrauch schützen, indem er die Sicherungsmechanismen von PDF aktiviert. Durch [[Wikipedia:Verschlüsselung|Verschlüsselung]] soll der Zugriff Unbefugter verhindert werden. Je nach Bedarf kann bereits das Öffnen der Datei ein Passwort erfordern, oder das Kopieren von Inhalten aus der Datei oder das Ausdrucken wird nicht zugelassen. Die dafür in PDF implementierten Schutzmechanismen sind jedoch nicht zuverlässig; insbesondere sind einfachere Formen der Verschlüsselung leicht zu überwinden.
  
In der Startphase war der Adobe Reader kostenpflichtig. Erst die kostenfreie Weitergabe der [[Software]] ermöglichte die Verbreitung des Formats im heutigen Ausmaß. PDF war lange Zeit ein [[kommerz]]ielles ([[proprietär]]es), aber offengelegtes Dateiformat, das im PDF Reference Manual von Adobe dokumentiert ist. Anfang 2007 hatte Adobe es in den Standardisierungsprozess der [[Internationale Organisation für Normung|ISO]] eingebracht und mit der Veröffentlichung am 1. Juli 2008 ist PDF in Version 1.7 als ISO 32000-1:2008 ein [[Offener Standard]].
+
In der Startphase war der Adobe Reader kostenpflichtig. Erst die kostenfreie Weitergabe der [[Wikipedia:Software|Software]] ermöglichte die Verbreitung des Formats im heutigen Ausmaß. PDF war lange Zeit ein [[Wikipedia:kommerz|kommerz]]ielles ([[Wikipedia:proprietär|proprietär]]es), aber offengelegtes Dateiformat, das im PDF Reference Manual von Adobe dokumentiert ist. Anfang 2007 hatte Adobe es in den Standardisierungsprozess der [[Internationale Organisation für Normung|ISO]] eingebracht und mit der Veröffentlichung am 1. Juli 2008 ist PDF in Version 1.7 als ISO 32000-1:2008 ein [[Wikipedia:Offener Standard|Offener Standard]].
  
Bestimmte Methoden beim Umgang mit PDF wurden zur Erleichterung des [[Datenaustausch]]es in der [[Druckvorstufe]] (als [[PDF/X]]) schon vorher und zur Langzeitarchivierung von PDF-Dateien (als [[PDF/A]]-1 in ISO 19005-1:2005) von der ISO genormt.
+
Bestimmte Methoden beim Umgang mit PDF wurden zur Erleichterung des [[Wikipedia:Datenaustausch|Datenaustausch]]es in der [[Wikipedia:Druckvorstufe|Druckvorstufe]] (als [[PDF/X]]) schon vorher und zur Langzeitarchivierung von PDF-Dateien (als [[Wikipedia:PDF/A|PDF/A]]-1 in ISO 19005-1:2005) von der ISO genormt.
  
 
=== Erzeugung und Umwandlung ===
 
=== Erzeugung und Umwandlung ===
PDF ist eine [[Vektorgrafik|vektorbasierte]] [[Seitenbeschreibungssprache]], die die freie Skalierbarkeit der Darstellung erlaubt. PDF-Dateien beschreiben das mit der Erstellungsanwendung erzeugte [[Layout]] in einer vom Drucker und von Voreinstellungen unabhängigen Form [[Proportionalität|proportional]], und daher so originalgetreu, wie es prinzipiell möglich ist. Hierin unterscheidet sich das PDF wesentlich von fortgeschrittenen Beschreibungs- und [[Auszeichnungssprache]]n wie [[Standard Generalized Markup Language|SGML]] oder [[Hypertext Markup Language|HTML]], wenn es um die Forderung nach optimaler Layout-Treue geht.
+
PDF ist eine [[Wikipedia:Vektorgrafik|vektorbasierte]] [[Wikipedia:Seitenbeschreibungssprache|Seitenbeschreibungssprache]], die die freie Skalierbarkeit der Darstellung erlaubt. PDF-Dateien beschreiben das mit der Erstellungsanwendung erzeugte [[Wikipedia:Layout|Layout]] in einer vom Drucker und von Voreinstellungen unabhängigen Form [[Wikipedia:Proportionalität|proportional]], und daher so originalgetreu, wie es prinzipiell möglich ist. Hierin unterscheidet sich das PDF wesentlich von fortgeschrittenen Beschreibungs- und [[Wikipedia:Auszeichnungssprache|Auszeichnungssprache]]n wie [[Wikipedia:Standard Generalized Markup Language|SGML]] oder [[Wikipedia:Hypertext Markup Language|HTML]], wenn es um die Forderung nach optimaler Layout-Treue geht.
Um eine Darstellung auch auf Ausgabegeräten mit kleiner Anzeigefläche – wie beispielsweise [[Personal Digital Assistant|PDAs]] oder Mobiltelefonen – zu optimieren, können in einem PDF Auszeichnungen (ähnlich HTML-Tags) eingelagert werden, die ein Umbrechen der Seiteninhalte – dann zwangsläufig unter Einschränkung der Layout-Treue – ermöglichen. Solche Auszeichnungen ermöglichen es zudem einem Vorleseprogramm, sehbehinderten Nutzern das Dokument vorzulesen und erleichtern das Konvertieren des Inhalts in andere Formate.
+
Um eine Darstellung auch auf Ausgabegeräten mit kleiner Anzeigefläche – wie beispielsweise [[Wikipedia:Personal Digital Assistant|PDAs]] oder Mobiltelefonen – zu optimieren, können in einem PDF Auszeichnungen (ähnlich HTML-Tags) eingelagert werden, die ein Umbrechen der Seiteninhalte – dann zwangsläufig unter Einschränkung der Layout-Treue – ermöglichen. Solche Auszeichnungen ermöglichen es zudem einem Vorleseprogramm, sehbehinderten Nutzern das Dokument vorzulesen und erleichtern das Konvertieren des Inhalts in andere Formate.
  
Eine häufig verwendete Anwendung zur Erzeugung von PDF-Dateien ist ''[[Adobe Distiller|Adobe Acrobat Distiller]]'', das aus [[PostScript]]-Dateien PDFs erstellt. Acrobat Distiller ist als Desktopprodukt für Windows und Mac OS verfügbar. Serverversionen sowie der kostenlose Adobe Reader existieren auch für andere Plattformen. Mit Hilfe der freien Software [[Wine]] läuft Acrobat Distiller auch unter Linux. Diverse [[Office-Paket|Office]]- und [[Desktop-Publishing|DTP]]-Programme anderer Hersteller bieten einen direkten PDF-Export an und sind auf einer Reihe von [[Plattform (Computer)|Plattformen]] verfügbar. Mit inzwischen zahlreichen Werkzeugen und Programmierbibliotheken lassen sich auf verschiedene Weise mit unterschiedlicher Spezialisierung PDF-Dateien erstellen, die Erzeugung von PDF-Dateien ist nahezu auf jeder Plattform möglich.
+
Eine häufig verwendete Anwendung zur Erzeugung von PDF-Dateien ist ''[[Wikipedia:Adobe Distiller|Adobe Acrobat Distiller]]'', das aus [[Wikipedia:PostScript|PostScript]]-Dateien PDFs erstellt. Acrobat Distiller ist als Desktopprodukt für Windows und Mac OS verfügbar. Serverversionen sowie der kostenlose Adobe Reader existieren auch für andere Plattformen. Mit Hilfe der freien Software [[Wikipedia:Wine|Wine]] läuft Acrobat Distiller auch unter Linux. Diverse [[Wikipedia:Office-Paket|Office]]- und [[Wikipedia:Desktop-Publishing|DTP]]-Programme anderer Hersteller bieten einen direkten PDF-Export an und sind auf einer Reihe von [[Wikipedia:Plattform (Computer)|Plattformen]] verfügbar. Mit inzwischen zahlreichen Werkzeugen und Programmierbibliotheken lassen sich auf verschiedene Weise mit unterschiedlicher Spezialisierung PDF-Dateien erstellen, die Erzeugung von PDF-Dateien ist nahezu auf jeder Plattform möglich.
  
Adobe räumt Entwicklern teilweise das Recht ein, eigene Anwendungen zur Generierung und Bearbeitung von PDF-Dokumenten zu entwickeln, behält sich aber das Copyright über die Spezifikationen vor.<ref name="adobe_intelectual_property">{{Internetquelle |autor=Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr |url=http://partners.adobe.com/public/developer/en/pdf/PDFReference16.pdf |titel=PDF Reference, fifth Edition, Section 1.5 Intellectual Property |hrsg=Adobe Systems Incorporated |seiten=7 |datum=2004-11 |format=PDF, 8,1&nbsp;MB |sprache=en |abruf=2010-11-03 |archiv-url=https://web.archive.org/web/20150616000240/http://partners.adobe.com/public/developer/en/pdf/PDFReference16.pdf |archiv-datum=2015-06-16 |offline=1}}</ref> PDF als Seitenbeschreibungssprache kann als Weiterentwicklung des Grafikmodells von PostScript angesehen werden, das ebenfalls offengelegt ist. Ende Februar 2007 hat Adobe angekündigt, die PDF-Spezifikation in der Version 1.7 in die [[Internationale Organisation für Normung|ISO-Normierung]] einzubringen und arbeitet dafür mit dem amerikanischen Branchenverband [[AIIM]] zusammen, der das Sekretariat des [[Internationale Organisation für Normung|ISO]]-Komitees TC 171 innehat. Adobe drohte [[Microsoft]] bei Integration des offenen Standards PDF mit kartellrechtlichen Klagen.
+
Adobe räumt Entwicklern teilweise das Recht ein, eigene Anwendungen zur Generierung und Bearbeitung von PDF-Dokumenten zu entwickeln, behält sich aber das Copyright über die Spezifikationen vor.<ref name="adobe_intelectual_property">{{Internetquelle |autor=Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr |url=http://partners.adobe.com/public/developer/en/pdf/PDFReference16.pdf |titel=PDF Reference, fifth Edition, Section 1.5 Intellectual Property |hrsg=Adobe Systems Incorporated |seiten=7 |datum=2004-11 |format=PDF, 8,1&nbsp;MB |sprache=en |abruf=2010-11-03 |archiv-url=https://web.archive.org/web/20150616000240/http://partners.adobe.com/public/developer/en/pdf/PDFReference16.pdf |archiv-datum=2015-06-16 |offline=1}}</ref> PDF als Seitenbeschreibungssprache kann als Weiterentwicklung des Grafikmodells von PostScript angesehen werden, das ebenfalls offengelegt ist. Ende Februar 2007 hat Adobe angekündigt, die PDF-Spezifikation in der Version 1.7 in die [[Internationale Organisation für Normung|ISO-Normierung]] einzubringen und arbeitet dafür mit dem amerikanischen Branchenverband [[AIIM]] zusammen, der das Sekretariat des [[Internationale Organisation für Normung|ISO]]-Komitees TC 171 innehat. Adobe drohte [[Wikipedia:Microsoft|Microsoft]] bei Integration des offenen Standards PDF mit kartellrechtlichen Klagen.
  
 
Weitere Erzeugungsmethoden werden unter ''[[#Konvertierung anderer Formate zu PDF|Konvertierung anderer Formate zu PDF]]'' behandelt.
 
Weitere Erzeugungsmethoden werden unter ''[[#Konvertierung anderer Formate zu PDF|Konvertierung anderer Formate zu PDF]]'' behandelt.
Zeile 27: Zeile 27:
 
== Verwendung und Eigenschaften ==
 
== Verwendung und Eigenschaften ==
 
=== Generelle Eigenschaften ===
 
=== Generelle Eigenschaften ===
Eine PDF-Datei kann Dokumente einschließlich aller Farben, [[Rastergrafik|Raster]]- und [[Vektorgrafik]]en, sowie [[Schrift]]typen präzise wiedergeben. Eine der Stärken von PDF ist es, dass es für alle gängigen [[Plattform (Computer)|Plattformen]] [[Dateibetrachter|Anzeigeprogramme]] gibt, so dass eine plattformunabhängige Darstellung des Inhaltes möglich ist.
+
Eine PDF-Datei kann Dokumente einschließlich aller Farben, [[Wikipedia:Rastergrafik|Raster]]- und [[Wikipedia:Vektorgrafik|Vektorgrafik]]en, sowie [[Wikipedia:Schrift|Schrift]]typen präzise wiedergeben. Eine der Stärken von PDF ist es, dass es für alle gängigen [[Wikipedia:Plattform (Computer)|Plattformen]] [[Wikipedia:Dateibetrachter|Anzeigeprogramme]] gibt, so dass eine plattformunabhängige Darstellung des Inhaltes möglich ist.
  
 
Eine nachträgliche Bearbeitung von PDF-Dateien gestaltet sich schwierig. Es gibt jedoch verschiedene Programme, mit denen man einzelne Seiten ausschneiden und bestimmte Inhalte verändern kann. Ab der Microsoft-Word-Version 2013 können PDF-Dateien in Word-Dateien direkt im Programm umgewandelt werden.<ref>[http://wiki.ubuntuusers.de/PDF Wiki von Ubuntuusers.de – Artikel PDF]</ref>
 
Eine nachträgliche Bearbeitung von PDF-Dateien gestaltet sich schwierig. Es gibt jedoch verschiedene Programme, mit denen man einzelne Seiten ausschneiden und bestimmte Inhalte verändern kann. Ab der Microsoft-Word-Version 2013 können PDF-Dateien in Word-Dateien direkt im Programm umgewandelt werden.<ref>[http://wiki.ubuntuusers.de/PDF Wiki von Ubuntuusers.de – Artikel PDF]</ref>
Zeile 41: Zeile 41:
 
In PDF-Dateien werden alle Informationen als nummerierte Objekte abgespeichert. Objekte sind beispielsweise Schriftinformationen, Zeichenbreiten, verwendete Zeichen-Encodings (Mac/PC …), Seitenbeschreibung, Parameter für Decoder, Crop-Boxes, einzelne Lesezeichen, Farbdefinitionen, Seitenreihenfolgen, Bitmaps, Formulare, Sprungmarken und alles andere, was in PDF-Dateien gespeichert werden kann. Eine hundertseitige PDF-Datei kann ohne Weiteres 10.000 Objekte enthalten.
 
In PDF-Dateien werden alle Informationen als nummerierte Objekte abgespeichert. Objekte sind beispielsweise Schriftinformationen, Zeichenbreiten, verwendete Zeichen-Encodings (Mac/PC …), Seitenbeschreibung, Parameter für Decoder, Crop-Boxes, einzelne Lesezeichen, Farbdefinitionen, Seitenreihenfolgen, Bitmaps, Formulare, Sprungmarken und alles andere, was in PDF-Dateien gespeichert werden kann. Eine hundertseitige PDF-Datei kann ohne Weiteres 10.000 Objekte enthalten.
  
PDF basiert auf dem gleichen Grafikmodell wie die Seitenbeschreibungssprache [[PostScript]], erlaubt jedoch gegenüber dieser einige zusätzliche Funktionen – insbesondere interaktive Elemente wie Lesezeichen, Kommentare, Formularfelder und deren Programmierung mit [[JavaScript]] sind möglich. Auch das Grafikmodell für die Seiteninhalte wurde gegenüber PostScript um Funktionen wie Transparenz oder optionalen oder schaltbaren Inhalt (in der Acrobat-Bedienungsoberfläche als Ebenen bezeichnet) oder die Unterstützung von [[ICC-Profil]]en und [[OpenType]]-Schriften erweitert.
+
PDF basiert auf dem gleichen Grafikmodell wie die Seitenbeschreibungssprache [[Wikipedia:PostScript|PostScript]], erlaubt jedoch gegenüber dieser einige zusätzliche Funktionen – insbesondere interaktive Elemente wie Lesezeichen, Kommentare, Formularfelder und deren Programmierung mit [[Wikipedia:JavaScript|JavaScript]] sind möglich. Auch das Grafikmodell für die Seiteninhalte wurde gegenüber PostScript um Funktionen wie Transparenz oder optionalen oder schaltbaren Inhalt (in der Acrobat-Bedienungsoberfläche als Ebenen bezeichnet) oder die Unterstützung von [[Wikipedia:ICC-Profil|ICC-Profil]]en und [[Wikipedia:OpenType|OpenType]]-Schriften erweitert.
  
Schriften (mit Ausnahme von Pixelschriften) und Vektorgrafiken können beliebig ohne Qualitätsverlust vergrößert werden. Große [[Topologie (Rechnernetz)|Netzwerkpläne]] und [[Datenmodellierung|Datenmodelle]] lassen sich unter diesen Voraussetzungen verlustfrei auf einer PDF-Seite unterbringen.
+
Schriften (mit Ausnahme von Pixelschriften) und Vektorgrafiken können beliebig ohne Qualitätsverlust vergrößert werden. Große [[Wikipedia:Topologie (Rechnernetz)|Netzwerkpläne]] und [[Wikipedia:Datenmodellierung|Datenmodelle]] lassen sich unter diesen Voraussetzungen verlustfrei auf einer PDF-Seite unterbringen.
  
Aus PDF-Dokumenten lassen sich Textpassagen, [[Tabelle]]n und Grafiken (auch Ausschnitte davon) leicht in anderen [[Anwendungssoftware|Anwendungsprogrammen]] durch Kopieren und Einfügen der jeweiligen Elemente weiterverarbeiten, ''falls'' der Ersteller des Dokumentes es zugelassen hat. Text kann nicht nur zur Weiterverarbeitung in anderen Anwendungen, sondern auch zum Durchsuchen oder zur Verwendung mit anderen Ausgabemedien, wie [[Screenreader]]n, extrahiert werden. Durch die [[String-Matching-Algorithmus|Textsuche]] im einzelnen Dokument oder die [[Volltextrecherche]] innerhalb einer PDF-Dokumentensammlung lassen sich Detailinhalte sehr einfach auffinden. Das funktioniert selbst dann, wenn der Text grafisch verzerrt, etwa in Kreis- oder Kurvenform, dargestellt ist.
+
Aus PDF-Dokumenten lassen sich Textpassagen, [[Wikipedia:Tabelle|Tabelle]]n und Grafiken (auch Ausschnitte davon) leicht in anderen [[Wikipedia:Anwendungssoftware|Anwendungsprogrammen]] durch Kopieren und Einfügen der jeweiligen Elemente weiterverarbeiten, ''falls'' der Ersteller des Dokumentes es zugelassen hat. Text kann nicht nur zur Weiterverarbeitung in anderen Anwendungen, sondern auch zum Durchsuchen oder zur Verwendung mit anderen Ausgabemedien, wie [[Wikipedia:Screenreader|Screenreader]]n, extrahiert werden. Durch die [[Wikipedia:String-Matching-Algorithmus|Textsuche]] im einzelnen Dokument oder die [[Wikipedia:Volltextrecherche|Volltextrecherche]] innerhalb einer PDF-Dokumentensammlung lassen sich Detailinhalte sehr einfach auffinden. Das funktioniert selbst dann, wenn der Text grafisch verzerrt, etwa in Kreis- oder Kurvenform, dargestellt ist.
  
 
=== Sicherheit von Dokumenten ===
 
=== Sicherheit von Dokumenten ===
Eine Besonderheit von PDF ist der optionale Dokumentenschutz mit 40- oder 128-Bit-[[Verschlüsselung]]. Durch Vergabe eines Benutzerpasswortes ist es so möglich, das Dokument nur einem beschränkten Personenkreis zugänglich zu machen. Weiterhin kann der Autor mit einem separaten Besitzerpasswort gezielt die Rechtevergabe des betreffenden Dokuments festlegen. So kann verhindert werden, dass Benutzer das Dokument abändern, ausdrucken oder Teilinhalte kopieren können. Auch ohne Kenntnis des Besitzerpasswortes lassen sich diese Rechteeinschränkungen jedoch mithilfe diverser Werkzeuge insbesondere dann leicht entfernen, wenn zwar ein Besitzerpasswort verwendet wird, das Öffnen des Dokuments jedoch kein Passwort erfordert (das bedeutet, dass kein Benutzerpasswort gesetzt ist). Die mit der Verschlüsselung verbundenen Nutzungseinschränkungen lassen sich durch Speichern von Screenshots als Bitmaps und darauf folgende [[Texterkennung|optische Texterkennung]] leicht umgehen.
+
Eine Besonderheit von PDF ist der optionale Dokumentenschutz mit 40- oder 128-Bit-[[Wikipedia:Verschlüsselung|Verschlüsselung]]. Durch Vergabe eines Benutzerpasswortes ist es so möglich, das Dokument nur einem beschränkten Personenkreis zugänglich zu machen. Weiterhin kann der Autor mit einem separaten Besitzerpasswort gezielt die Rechtevergabe des betreffenden Dokuments festlegen. So kann verhindert werden, dass Benutzer das Dokument abändern, ausdrucken oder Teilinhalte kopieren können. Auch ohne Kenntnis des Besitzerpasswortes lassen sich diese Rechteeinschränkungen jedoch mithilfe diverser Werkzeuge insbesondere dann leicht entfernen, wenn zwar ein Besitzerpasswort verwendet wird, das Öffnen des Dokuments jedoch kein Passwort erfordert (das bedeutet, dass kein Benutzerpasswort gesetzt ist). Die mit der Verschlüsselung verbundenen Nutzungseinschränkungen lassen sich durch Speichern von Screenshots als Bitmaps und darauf folgende [[Wikipedia:Texterkennung|optische Texterkennung]] leicht umgehen.
  
 
Durch entsprechende Werkzeuge lassen sich auch Rechte vergeben, die es ermöglichen, PDF-Dokumente mit Notizen, Kommentaren und Dateianhängen zu versehen oder Formulareinträge abzuspeichern. Ursprünglich konnten diese Merkmale nur mit Adobe Acrobat genutzt werden, ab Version 7 ist es jedoch auch mit dem kostenlosen Adobe Reader möglich, Notizen und Kommentare hinzuzufügen und interaktive Formularfelder auszufüllen, sofern das entsprechende Dokument vom Verfasser mit den notwendigen Berechtigungen versehen wurde.
 
Durch entsprechende Werkzeuge lassen sich auch Rechte vergeben, die es ermöglichen, PDF-Dokumente mit Notizen, Kommentaren und Dateianhängen zu versehen oder Formulareinträge abzuspeichern. Ursprünglich konnten diese Merkmale nur mit Adobe Acrobat genutzt werden, ab Version 7 ist es jedoch auch mit dem kostenlosen Adobe Reader möglich, Notizen und Kommentare hinzuzufügen und interaktive Formularfelder auszufüllen, sofern das entsprechende Dokument vom Verfasser mit den notwendigen Berechtigungen versehen wurde.
  
Mittlerweile existieren auch [[Digitale Rechteverwaltung|DRM]]-geschützte PDF-Dateien. Diese sind unter anderem mit [[Adobe Digital Editions]] lesbar.
+
Mittlerweile existieren auch [[Wikipedia:Digitale Rechteverwaltung|DRM]]-geschützte PDF-Dateien. Diese sind unter anderem mit [[Wikipedia:Adobe Digital Editions|Adobe Digital Editions]] lesbar.
  
 
=== Sicherheitslücken durch menschliches Versagen ===
 
=== Sicherheitslücken durch menschliches Versagen ===
PDF-Dateien können mitunter unbeabsichtigt [[Vertraulichkeit|vertrauliche]] Informationen enthalten, die zwar nicht unmittelbar sichtbar sind, aber durch Textsuche gefunden werden können. Einerseits können Informationen durch Objekte verdeckt sein oder sich außerhalb des Seitenanzeigebereichs befinden, andererseits kann ein PDF Metadaten enthalten, die nur beim Aufruf entsprechender Dialoge angezeigt werden und gelegentlich unbemerkt bleiben. Insbesondere beim „Schwärzen“ von Textpassagen ist es nicht ausreichend, die jeweilige Textpassage abzudecken, sondern sie muss vollständig aus dem PDF entfernt werden. Es ist nicht immer einfach, ungewollte Informationen in einem PDF zu vermeiden, insbesondere dann nicht, wenn man nicht ausschließlich selbst das PDF (sowie das Dokument, aus dem es generiert wurde) erstellt und bearbeitet hat. Es ist wichtig, dass beim Schwärzen von Textpassagen ein Werkzeug eingesetzt wird, das die betreffenden Inhalte vollständig entfernt. Genauso wichtig ist das Prüfen der Metadaten (in Acrobat zu finden über Datei/Eigenschaften). Acrobat Professional 8 bietet hier weitgehende Unterstützung, insbesondere durch eine spezielle Funktion zum Entfernen versteckter Informationen.
+
PDF-Dateien können mitunter unbeabsichtigt [[Wikipedia:Vertraulichkeit|vertrauliche]] Informationen enthalten, die zwar nicht unmittelbar sichtbar sind, aber durch Textsuche gefunden werden können. Einerseits können Informationen durch Objekte verdeckt sein oder sich außerhalb des Seitenanzeigebereichs befinden, andererseits kann ein PDF Metadaten enthalten, die nur beim Aufruf entsprechender Dialoge angezeigt werden und gelegentlich unbemerkt bleiben. Insbesondere beim „Schwärzen“ von Textpassagen ist es nicht ausreichend, die jeweilige Textpassage abzudecken, sondern sie muss vollständig aus dem PDF entfernt werden. Es ist nicht immer einfach, ungewollte Informationen in einem PDF zu vermeiden, insbesondere dann nicht, wenn man nicht ausschließlich selbst das PDF (sowie das Dokument, aus dem es generiert wurde) erstellt und bearbeitet hat. Es ist wichtig, dass beim Schwärzen von Textpassagen ein Werkzeug eingesetzt wird, das die betreffenden Inhalte vollständig entfernt. Genauso wichtig ist das Prüfen der Metadaten (in Acrobat zu finden über Datei/Eigenschaften). Acrobat Professional 8 bietet hier weitgehende Unterstützung, insbesondere durch eine spezielle Funktion zum Entfernen versteckter Informationen.
  
 
Fallbeispiele:
 
Fallbeispiele:
* Eine Datei, die den Tod des italienischen Agenten [[Nicola Calipari]] behandelte, der im März 2005 die Journalistin [[Giuliana Sgrena]] aus irakischer Geiselhaft befreite. US-Soldaten erschossen ihn dabei kurz nach dieser Aktion. Der veröffentlichte Bericht war zensiert. Doch fanden sich in der veröffentlichten Datei die redaktionellen Überarbeitungen durch Kopieren des Textes und Abspeichern in eine neue Datei.
+
* Eine Datei, die den Tod des italienischen Agenten [[Wikipedia:Nicola Calipari|Nicola Calipari]] behandelte, der im März 2005 die Journalistin [[Wikipedia:Giuliana Sgrena|Giuliana Sgrena]] aus irakischer Geiselhaft befreite. US-Soldaten erschossen ihn dabei kurz nach dieser Aktion. Der veröffentlichte Bericht war zensiert. Doch fanden sich in der veröffentlichten Datei die redaktionellen Überarbeitungen durch Kopieren des Textes und Abspeichern in eine neue Datei.
* Das [[Weißes Haus|Weiße Haus]] in [[Washington, D.C.|Washington]] veröffentlichte [[George W. Bush]]s Rede zum „Plan für den Sieg im Irak“. Die Dateiangaben legten den [[Ghostwriter]] offen, nämlich [[Peter Feaver]], Professor für Politikwissenschaft von der [[Duke University|Duke-Universität]] in [[North Carolina]], der seit Juni 2005 das [[Nationaler Sicherheitsrat der Vereinigten Staaten|National Security Council]] berät.
+
* Das [[Wikipedia:Weißes Haus|Weiße Haus]] in [[Wikipedia:Washington, D.C.|Washington]] veröffentlichte [[Wikipedia:George W. Bush|George W. Bush]]s Rede zum „Plan für den Sieg im Irak“. Die Dateiangaben legten den [[Wikipedia:Ghostwriter|Ghostwriter]] offen, nämlich [[Wikipedia:Peter Feaver|Peter Feaver]], Professor für Politikwissenschaft von der [[Wikipedia:Duke University|Duke-Universität]] in [[Wikipedia:North Carolina|North Carolina]], der seit Juni 2005 das [[Wikipedia:Nationaler Sicherheitsrat der Vereinigten Staaten|National Security Council]] berät.
* Nach dem [[Attentat auf Rafiq al-Hariri|Attentat auf den Fahrzeugkonvoi]] des [[Libanon|libanesischen]] Politikers [[Rafiq al-Hariri|Rafiq Hariri]] fanden sich in einer öffentlich publizierten PDF der [[Vereinte Nationen|UNO]] die vorher gelöschten Verweise auf Namen syrischer Funktionsträger, die im Verdacht standen, für das Attentat verantwortlich zu sein (siehe [[Mehlis-Bericht]]).
+
* Nach dem [[Wikipedia:Attentat auf Rafiq al-Hariri|Attentat auf den Fahrzeugkonvoi]] des [[Wikipedia:Libanon|libanesischen]] Politikers [[Wikipedia:Rafiq al-Hariri|Rafiq Hariri]] fanden sich in einer öffentlich publizierten PDF der [[Wikipedia:Vereinte Nationen|UNO]] die vorher gelöschten Verweise auf Namen syrischer Funktionsträger, die im Verdacht standen, für das Attentat verantwortlich zu sein (siehe [[Wikipedia:Mehlis-Bericht|Mehlis-Bericht]]).
* 2007 gelangten im Rahmen der [[Spionageaffäre in der Formel 1 2007|Formel-1-Spionageaffäre]] vertrauliche Daten über den Wagen der [[Scuderia Ferrari]] an die Öffentlichkeit, nachdem dessen zentrale technische Werte in einem PDF-Dokument, das als Beweismittel diente, lediglich mit einem schwarzen Balken versehen wurden, der Text jedoch weiterhin vorhanden und extrahierbar war.
+
* 2007 gelangten im Rahmen der [[Wikipedia:Spionageaffäre in der Formel 1 2007|Formel-1-Spionageaffäre]] vertrauliche Daten über den Wagen der [[Wikipedia:Scuderia Ferrari|Scuderia Ferrari]] an die Öffentlichkeit, nachdem dessen zentrale technische Werte in einem PDF-Dokument, das als Beweismittel diente, lediglich mit einem schwarzen Balken versehen wurden, der Text jedoch weiterhin vorhanden und extrahierbar war.
  
 
=== Bearbeiten von Dokumenten ===
 
=== Bearbeiten von Dokumenten ===
PDF wurde als ein [[Austauschformat]] für fertiggestellte Dokumente konzipiert. Inzwischen gibt es eine Reihe von Programmen und Erweiterungen für Adobe Acrobat, mit denen sich PDF-Dateien bearbeiten lassen. Das Format ist jedoch nicht mit Dateiformaten von [[Textverarbeitung]]sprogrammen oder Grafikprogrammen vergleichbar und eignet sich, abgesehen von der Notiz- und Kommentarfunktion, nur begrenzt zur Weiterverarbeitung von Dokumenten. Es ist allerdings innerhalb gewisser Grenzen möglich, beispielsweise [[Tippfehler]] zu entfernen. Vorteile im Desktop-Publishing sind für Grafiker und Designer die Einbindung aller Elemente für die Druckerstellung.
+
PDF wurde als ein [[Wikipedia:Austauschformat|Austauschformat]] für fertiggestellte Dokumente konzipiert. Inzwischen gibt es eine Reihe von Programmen und Erweiterungen für Adobe Acrobat, mit denen sich PDF-Dateien bearbeiten lassen. Das Format ist jedoch nicht mit Dateiformaten von [[Wikipedia:Textverarbeitung|Textverarbeitung]]sprogrammen oder Grafikprogrammen vergleichbar und eignet sich, abgesehen von der Notiz- und Kommentarfunktion, nur begrenzt zur Weiterverarbeitung von Dokumenten. Es ist allerdings innerhalb gewisser Grenzen möglich, beispielsweise [[Wikipedia:Tippfehler|Tippfehler]] zu entfernen. Vorteile im Desktop-Publishing sind für Grafiker und Designer die Einbindung aller Elemente für die Druckerstellung.
  
 
PDF-Dokumente können abhängig vom Einzelfall sowohl größer als auch kleiner als die Dateien der Ursprungsanwendung sein. Die Größe eines Dokuments hängt von der Art der enthaltenen Daten, von der Effizienz des Erstellungsprogramms und davon ab, ob Schriften eingebettet wurden. Schriften können entweder vollständig, als Untermenge der tatsächlich im Dokument verwendeten Zeichen oder aber überhaupt nicht eingebettet werden. Soll ein Dokument zuverlässig darstellbar sein, unabhängig davon, ob auf der Zielplattform die verwendeten Schriften installiert sind, müssen mindestens die tatsächlich verwendeten Zeichen eingebettet werden.
 
PDF-Dokumente können abhängig vom Einzelfall sowohl größer als auch kleiner als die Dateien der Ursprungsanwendung sein. Die Größe eines Dokuments hängt von der Art der enthaltenen Daten, von der Effizienz des Erstellungsprogramms und davon ab, ob Schriften eingebettet wurden. Schriften können entweder vollständig, als Untermenge der tatsächlich im Dokument verwendeten Zeichen oder aber überhaupt nicht eingebettet werden. Soll ein Dokument zuverlässig darstellbar sein, unabhängig davon, ob auf der Zielplattform die verwendeten Schriften installiert sind, müssen mindestens die tatsächlich verwendeten Zeichen eingebettet werden.
Zeile 70: Zeile 70:
 
=== Drucken im Batchbetrieb von der Kommandozeile ===
 
=== Drucken im Batchbetrieb von der Kommandozeile ===
  
Gedruckt wird meist innerhalb der [[Grafische Benutzeroberfläche|grafischen Benutzeroberfläche]] eines [[Dateibetrachter|Betrachters]] mit '''File ▸ Print…'''. Acrobat Reader und Foxit Reader haben die Kommandozeilenoption '''/t &lt;Datei&gt; &lt;Druckername&gt;''' in den neueren Versionen teils entfernt (September 2015). In Acrobat kann man nur noch auf den Default-Drucker drucken, wohingegen bei Foxit der Drucker zwar wählbar ist, aber Foxit das Anwendungsfenster öffnet und nach dem Druck nicht mehr schließt (der Nutzer muss es von Hand schließen).
+
Gedruckt wird meist innerhalb der [[Wikipedia:Grafische Benutzeroberfläche|grafischen Benutzeroberfläche]] eines [[Wikipedia:Dateibetrachter|Betrachters]] mit '''File ▸ Print…'''. Acrobat Reader und Foxit Reader haben die Kommandozeilenoption '''/t &lt;Datei&gt; &lt;Druckername&gt;''' in den neueren Versionen teils entfernt (September 2015). In Acrobat kann man nur noch auf den Default-Drucker drucken, wohingegen bei Foxit der Drucker zwar wählbar ist, aber Foxit das Anwendungsfenster öffnet und nach dem Druck nicht mehr schließt (der Nutzer muss es von Hand schließen).
  
 
==== Linux ====
 
==== Linux ====
  
Über [[Common Unix Printing System|CUPS]]:
+
Über [[Wikipedia:Common Unix Printing System|CUPS]]:
  
 
<pre>
 
<pre>
Zeile 82: Zeile 82:
 
==== Windows ====
 
==== Windows ====
  
Das Batch-Drucken ist mit [[Ghostscript]] möglich.<ref name="Ghostscript Kommandozeile">{{Webarchiv |url=http://www.ghostscript.com/doc/9.16/Use.htm |wayback=20150913065420 |text=ghostscript.com}}</ref> Ghostscript installiert sich mit Hilfe eines Installers unter '''c:\Programme\gs\gs&lt;Version&gt;\'''. Im Unterverzeichnis '''bin\''' befinden sich ausführbare Dateien. Beispiel mit dem DOS-Fenster in Windows 7:
+
Das Batch-Drucken ist mit [[Wikipedia:Ghostscript|Ghostscript]] möglich.<ref name="Ghostscript Kommandozeile">{{Webarchiv |url=http://www.ghostscript.com/doc/9.16/Use.htm |wayback=20150913065420 |text=ghostscript.com}}</ref> Ghostscript installiert sich mit Hilfe eines Installers unter '''c:\Programme\gs\gs&lt;Version&gt;\'''. Im Unterverzeichnis '''bin\''' befinden sich ausführbare Dateien. Beispiel mit dem DOS-Fenster in Windows 7:
  
 
<pre>
 
<pre>
Zeile 104: Zeile 104:
  
 
=== Serialisierung und Kompression ===
 
=== Serialisierung und Kompression ===
PDF wurde im Laufe seiner Entwicklung mehrfach auf spezielle Anforderungen für die Verwendung im [[Internet]] angepasst. So musste ein Dokument ursprünglich vollständig verfügbar sein, um dargestellt werden zu können. Inzwischen ist es möglich, PDF-Dokumente zu [[Serialisierung|serialisieren]], so dass Teile davon bereits während des Ladevorgangs dargestellt werden können. Ab Version 1.5 der PDF-[[Spezifikation]] können mehrere Objekte in einem PDF zusammengefasst und dann komprimiert werden, was insbesondere bei den für die Dokumentstruktur erforderlichen zahlreichen kleinen Objekten zu einer deutlich besseren Kompression führt (Bilddaten oder die eigentliche Beschreibung einer Seite konnten schon immer komprimiert werden).
+
PDF wurde im Laufe seiner Entwicklung mehrfach auf spezielle Anforderungen für die Verwendung im [[Wikipedia:Internet|Internet]] angepasst. So musste ein Dokument ursprünglich vollständig verfügbar sein, um dargestellt werden zu können. Inzwischen ist es möglich, PDF-Dokumente zu [[Wikipedia:Serialisierung|serialisieren]], so dass Teile davon bereits während des Ladevorgangs dargestellt werden können. Ab Version 1.5 der PDF-[[Wikipedia:Spezifikation|Spezifikation]] können mehrere Objekte in einem PDF zusammengefasst und dann komprimiert werden, was insbesondere bei den für die Dokumentstruktur erforderlichen zahlreichen kleinen Objekten zu einer deutlich besseren Kompression führt (Bilddaten oder die eigentliche Beschreibung einer Seite konnten schon immer komprimiert werden).
  
Bei der Archivierung gedruckter Dokumente als PDF-Dateien wird ein gemischter Ansatz bevorzugt, um sowohl das Originaldokument weitestgehend zu erhalten als auch Durchsuchbarkeit zu gewährleisten. Durch geschickte Kombination der von PDF prinzipiell unterstützten Bildkompressionsverfahren wird eine sehr starke Kompression erreicht (typischerweise 1:200), indem Hintergrund (typischerweise flächige Strukturen und Farbverläufe) und Text (scharfe Ränder, dafür nur wenige Farben) mit verschiedenen, dafür speziell geeigneten Verfahren komprimiert und anschließend übereinandergelegt werden. Der eigentliche Text wird per [[Texterkennung|OCR]]-Verfahren extrahiert und unsichtbar eingebettet.
+
Bei der Archivierung gedruckter Dokumente als PDF-Dateien wird ein gemischter Ansatz bevorzugt, um sowohl das Originaldokument weitestgehend zu erhalten als auch Durchsuchbarkeit zu gewährleisten. Durch geschickte Kombination der von PDF prinzipiell unterstützten Bildkompressionsverfahren wird eine sehr starke Kompression erreicht (typischerweise 1:200), indem Hintergrund (typischerweise flächige Strukturen und Farbverläufe) und Text (scharfe Ränder, dafür nur wenige Farben) mit verschiedenen, dafür speziell geeigneten Verfahren komprimiert und anschließend übereinandergelegt werden. Der eigentliche Text wird per [[Wikipedia:Texterkennung|OCR]]-Verfahren extrahiert und unsichtbar eingebettet.
  
 
=== Navigation am Bildschirm ===
 
=== Navigation am Bildschirm ===
<!--aus [[Seitenbeschreibungssprache#Geschichte]], Überarbeitungen bitte auch dort, evtl. dort kürzen-->
+
<!--aus [[Wikipedia:Seitenbeschreibungssprache#Geschichte|Seitenbeschreibungssprache]], Überarbeitungen bitte auch dort, evtl. dort kürzen-->
Im Gegensatz zu früheren [[Seitenbeschreibungssprache]]n wie PostScript ist die „Vorschau“ am Bildschirm nicht mehr nur ein Hilfsmittel, um Probeausdrucke zu vermeiden, sondern bietet komfortable Funktionen, die im Ausdruck nicht möglich sind: bei Querverweisen und Literaturangaben muss man nicht zum Ziel ''blättern'', sondern kann durch Klicken auf den Verweis direkt auf die Zielseite springen. Navigation innerhalb des Dokuments wird auch durch Seitenicons oder Anzeige von Gliederungsbäumen (dem Inhaltsverzeichnis entsprechend) erleichtert. Klickt man auf externe Links, so wird das Zieldokument im [[Webbrowser]] angezeigt. Diese Funktionen müssen allerdings durch die Erzeugungssoftware von den Verfassern „eingebaut“ (etwa mit [[LaTeX]] und dem LaTeX-Erweiterungspaket hyperref<ref>[[Comprehensive TeX Archive Network]]: [http://ctan.org/pkg/hyperref Paket hyperref], abgerufen am 2. Januar 2018.</ref>, vgl. [[#TeX/DVI]]) und vom [[#PDF in Betriebssystemen|Betrachter]] implementiert sein.
+
Im Gegensatz zu früheren [[Wikipedia:Seitenbeschreibungssprache|Seitenbeschreibungssprache]]n wie PostScript ist die „Vorschau“ am Bildschirm nicht mehr nur ein Hilfsmittel, um Probeausdrucke zu vermeiden, sondern bietet komfortable Funktionen, die im Ausdruck nicht möglich sind: bei Querverweisen und Literaturangaben muss man nicht zum Ziel ''blättern'', sondern kann durch Klicken auf den Verweis direkt auf die Zielseite springen. Navigation innerhalb des Dokuments wird auch durch Seitenicons oder Anzeige von Gliederungsbäumen (dem Inhaltsverzeichnis entsprechend) erleichtert. Klickt man auf externe Links, so wird das Zieldokument im [[Wikipedia:Webbrowser|Webbrowser]] angezeigt. Diese Funktionen müssen allerdings durch die Erzeugungssoftware von den Verfassern „eingebaut“ (etwa mit [[Wikipedia:LaTeX|LaTeX]] und dem LaTeX-Erweiterungspaket hyperref<ref>[[Wikipedia:Comprehensive TeX Archive Network|Comprehensive TeX Archive Network]]: [http://ctan.org/pkg/hyperref Paket hyperref], abgerufen am 2. Januar 2018.</ref>, vgl. [[#TeX/DVI]]) und vom [[#PDF in Betriebssystemen|Betrachter]] implementiert sein.
  
 
== Standard-Schriftarten ==
 
== Standard-Schriftarten ==
14 Schriftarten (''standard 14 fonts'') sind in PDF-Readern standardmäßig verfügbar und müssen (außer bei [[PDF/A]]- und [[PDF/X]]-Dokumenten) daher nicht separat in das PDF-Dokument eingebettet werden:<ref>{{Webarchiv |url=http://wwwimages.adobe.com/www.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/pdf_reference_1-7.pdf |wayback=20150706064658 |text=PDF Reference (Sixth Edition, version 1.7) – 5.5.1 Standard Type 1 Fonts}} (PDF, 31&nbsp;MB, 1.310 S.)</ref>
+
14 Schriftarten (''standard 14 fonts'') sind in PDF-Readern standardmäßig verfügbar und müssen (außer bei [[Wikipedia:PDF/A|PDF/A]]- und [[PDF/X]]-Dokumenten) daher nicht separat in das PDF-Dokument eingebettet werden:<ref>{{Webarchiv |url=http://wwwimages.adobe.com/www.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/pdf_reference_1-7.pdf |wayback=20150706064658 |text=PDF Reference (Sixth Edition, version 1.7) – 5.5.1 Standard Type 1 Fonts}} (PDF, 31&nbsp;MB, 1.310 S.)</ref>
* [[Courier (Schriftart)|Courier]] (in den Varianten Standard, fett, kursiv, fett-kursiv)
+
* [[Wikipedia:Courier (Schriftart)|Courier]] (in den Varianten Standard, fett, kursiv, fett-kursiv)
* [[Helvetica (Schriftart)|Helvetica]] (in den Varianten Standard, fett, kursiv, fett-kursiv)
+
* [[Wikipedia:Helvetica (Schriftart)|Helvetica]] (in den Varianten Standard, fett, kursiv, fett-kursiv)
* [[Symbol (Schriftart)|Symbol]]
+
* [[Wikipedia:Symbol (Schriftart)|Symbol]]
 
* [[Times (Schriftart)|Times New Roman]] (in den Varianten Standard, fett, kursiv, fett-kursiv)
 
* [[Times (Schriftart)|Times New Roman]] (in den Varianten Standard, fett, kursiv, fett-kursiv)
* [[Unicodeblock Dingbats|Zapf Dingbats]]
+
* [[Wikipedia:Unicodeblock Dingbats|Zapf Dingbats]]
  
 
== PDF in Betriebssystemen ==
 
== PDF in Betriebssystemen ==
Mit dem [[Betriebssystem]] [[macOS]] von [[Apple]] wurde erstmals PDF als Standardformat für die Bildschirmausgabe wie auch die Druckausgabe verwendet. Die PDF-Erzeugung kann aus jedem Programm heraus erfolgen, das einen Druckdialog besitzt. Da PDF auch zur Erzeugung der Druckdaten verwendet wird, ist es möglich, [[PostScript]] auch auf Nicht-Postscript-Druckern auszugeben. Man kann nahezu alle Dokumenttypen, die gedruckt werden können, in PDF konvertieren. Diese Möglichkeit besteht auch unter GNU/Linux, dort wird, z.&nbsp;B. im Druckdialog der Desktopumgebung Gnome, nativ die Option der PDF-Erzeugung angeboten.
+
Mit dem [[Wikipedia:Betriebssystem|Betriebssystem]] [[Wikipedia:macOS|macOS]] von [[Wikipedia:Apple|Apple]] wurde erstmals PDF als Standardformat für die Bildschirmausgabe wie auch die Druckausgabe verwendet. Die PDF-Erzeugung kann aus jedem Programm heraus erfolgen, das einen Druckdialog besitzt. Da PDF auch zur Erzeugung der Druckdaten verwendet wird, ist es möglich, [[Wikipedia:PostScript|PostScript]] auch auf Nicht-Postscript-Druckern auszugeben. Man kann nahezu alle Dokumenttypen, die gedruckt werden können, in PDF konvertieren. Diese Möglichkeit besteht auch unter GNU/Linux, dort wird, z.&nbsp;B. im Druckdialog der Desktopumgebung Gnome, nativ die Option der PDF-Erzeugung angeboten.
  
Unter [[Microsoft Windows|Windows]], [[Mac OS Classic]] und macOS, [[GNU|GNU/Linux]] und den Unix-Betriebssystemen [[Solaris (Betriebssystem)|Solaris]], HP/UX und AIX gibt es den kostenlosen Adobe Reader / Acrobat Reader als PDF-[[Dateibetrachter|Betrachter]]. Unter [[eComStation]] gibt es den integrierten Betrachter Lucide.
+
Unter [[Wikipedia:Microsoft Windows|Windows]], [[Wikipedia:Mac OS Classic|Mac OS Classic]] und macOS, [[Wikipedia:GNU|GNU/Linux]] und den Unix-Betriebssystemen [[Wikipedia:Solaris (Betriebssystem)|Solaris]], HP/UX und AIX gibt es den kostenlosen Adobe Reader / Acrobat Reader als PDF-[[Wikipedia:Dateibetrachter|Betrachter]]. Unter [[Wikipedia:eComStation|eComStation]] gibt es den integrierten Betrachter Lucide.
Seit [[Windows 8]] besitzt nun auch Windows einen integrierten PDF-Betrachter.<ref>[https://www.netzwelt.de/news/91211-windows-8-app-neue-windows-reader.html netzwelt.de]</ref> [[Windows 10]] wurde von Microsoft zusätzlich mit einem PDF-Drucker ausgerüstet.<ref>[http://www.giga.de/downloads/windows-10/tipps/windows-10-pdf-erstellen-so-geht-s giga.de]</ref>
+
Seit [[Wikipedia:Windows 8|Windows 8]] besitzt nun auch Windows einen integrierten PDF-Betrachter.<ref>[https://www.netzwelt.de/news/91211-windows-8-app-neue-windows-reader.html netzwelt.de]</ref> [[Wikipedia:Windows 10|Windows 10]] wurde von Microsoft zusätzlich mit einem PDF-Drucker ausgerüstet.<ref>[http://www.giga.de/downloads/windows-10/tipps/windows-10-pdf-erstellen-so-geht-s giga.de]</ref>
  
Für unixbasierte Systeme gibt es zusätzlich das Programm [[Xpdf]], das auf die grundlegendsten Funktionen (Anzeige auf Bildschirm, Durchsuchen des Dokuments, Ausdrucken) reduziert ist, sowie einige weitere Programme ([[Okular (Software)|Okular]] und [[Evince]]), die an ihre Desktopumgebung angepasst sind. Diese Open-Source-Programme eignen sich auch, um vermeintliche „Sicherheitsmerkmale“ von PDF-Dokumenten zu umgehen – so ist es teilweise möglich, Dokumente auszudrucken, obwohl der Autor dem Betrachter des Dokuments diese Möglichkeit eigentlich verwehren wollte.
+
Für unixbasierte Systeme gibt es zusätzlich das Programm [[Wikipedia:Xpdf|Xpdf]], das auf die grundlegendsten Funktionen (Anzeige auf Bildschirm, Durchsuchen des Dokuments, Ausdrucken) reduziert ist, sowie einige weitere Programme ([[Wikipedia:Okular (Software)|Okular]] und [[Wikipedia:Evince|Evince]]), die an ihre Desktopumgebung angepasst sind. Diese Open-Source-Programme eignen sich auch, um vermeintliche „Sicherheitsmerkmale“ von PDF-Dokumenten zu umgehen – so ist es teilweise möglich, Dokumente auszudrucken, obwohl der Autor dem Betrachter des Dokuments diese Möglichkeit eigentlich verwehren wollte.
  
 
{{Siehe auch|Liste von PDF-Software|Display PostScript}}
 
{{Siehe auch|Liste von PDF-Software|Display PostScript}}
Zeile 132: Zeile 132:
 
== Angaben der Seitengeometrie ==
 
== Angaben der Seitengeometrie ==
 
[[Datei:PDF BOX 01.svg|mini|Die verschiedenen Boxen im PDF]]
 
[[Datei:PDF BOX 01.svg|mini|Die verschiedenen Boxen im PDF]]
Angaben zur Seitengeometrie in einem PDF-Dokument sind vor allem in der [[Druckwesen|Druckindustrie]] sehr wichtig. Sie beschreiben, in welchem Bereich einer Seite sich derjenige Inhalt befindet, der dem beschnittenen Endformat entspricht und wo ein weiterverarbeitendes Programm (beispielsweise zum [[Ausschießen]], also dem Montieren von Seiten auf einem Druckbogen) mit einer [[Beschnittzugabe]] rechnen kann.
+
Angaben zur Seitengeometrie in einem PDF-Dokument sind vor allem in der [[Wikipedia:Druckwesen|Druckindustrie]] sehr wichtig. Sie beschreiben, in welchem Bereich einer Seite sich derjenige Inhalt befindet, der dem beschnittenen Endformat entspricht und wo ein weiterverarbeitendes Programm (beispielsweise zum [[Wikipedia:Ausschießen|Ausschießen]], also dem Montieren von Seiten auf einem Druckbogen) mit einer [[Wikipedia:Beschnittzugabe|Beschnittzugabe]] rechnen kann.
 
Moderne DTP-Programme legen diese Information beim Direktexport nach PDF im PDF mit ab. Werden PDFs über PostScript ausgegeben, sind die entsprechenden Angaben meist nicht enthalten. Adobe Acrobat Distiller ist für die PostScript-Ausgabe aus bestimmten Programmen in der Lage, den Nettoseitenbereich aus den Beschnittmarken abzuleiten, sofern diese mit ausgegeben wurden.
 
Moderne DTP-Programme legen diese Information beim Direktexport nach PDF im PDF mit ab. Werden PDFs über PostScript ausgegeben, sind die entsprechenden Angaben meist nicht enthalten. Adobe Acrobat Distiller ist für die PostScript-Ausgabe aus bestimmten Programmen in der Lage, den Nettoseitenbereich aus den Beschnittmarken abzuleiten, sofern diese mit ausgegeben wurden.
  
Zeile 148: Zeile 148:
  
 
=== ArtBox (Objektrahmen) ===
 
=== ArtBox (Objektrahmen) ===
Die ArtBox (auch ''Bounding Box'' genannt) beschreibt den Seitenausschnitt, der beim Platzieren der PDF-Seite in einem anderen Programm verwendet werden soll; vergleichbar mit der Größenangabe für das Importieren einer [[Encapsulated PostScript|EPS]]-Datei.
+
Die ArtBox (auch ''Bounding Box'' genannt) beschreibt den Seitenausschnitt, der beim Platzieren der PDF-Seite in einem anderen Programm verwendet werden soll; vergleichbar mit der Größenangabe für das Importieren einer [[Wikipedia:Encapsulated PostScript|EPS]]-Datei.
  
 
== Formularprozesse ==
 
== Formularprozesse ==
Zeile 159: Zeile 159:
 
== Konvertierung anderer Formate zu PDF ==
 
== Konvertierung anderer Formate zu PDF ==
 
=== XML ===
 
=== XML ===
PDF-Dokumente können aus [[Extensible Markup Language|XML]]-Daten in zwei Schritten erstellt werden:
+
PDF-Dokumente können aus [[Wikipedia:Extensible Markup Language|XML]]-Daten in zwei Schritten erstellt werden:
* Transformation mit Hilfe eines [[XSL Transformation|XSLT]]-Stylesheets in das [[Extensible Stylesheet Language – Formatting Objects|XSL-FO]]-Format
+
* Transformation mit Hilfe eines [[Wikipedia:XSL Transformation|XSLT]]-Stylesheets in das [[Wikipedia:Extensible Stylesheet Language – Formatting Objects|XSL-FO]]-Format
* Ein PDF-Prozessor (zum Beispiel [[Apache Formatting Objects Processor|Apache FOP]], Altsoft [[Xml2PDF]]) erzeugt daraus das fertige PDF-Dokument.
+
* Ein PDF-Prozessor (zum Beispiel [[Wikipedia:Apache Formatting Objects Processor|Apache FOP]], Altsoft [[Xml2PDF]]) erzeugt daraus das fertige PDF-Dokument.
  
Ein leicht nachzuvollziehendes Beispiel ist die Transformation/Formatierung von invitation.xml<ref>{{Internetquelle |autor=Stefan Mintert |url=http://www.linkwerk.com/pub/xml/invitation/ |titel=invitation.xml – Transform a single source XML file to several output formats |werk=Website der Linkwerk GmbH |sprache=en |abruf=2010-11-03}}</ref> in PDF (das Beispiel zeigt auch die Transformation in [[Extensible Hypertext Markup Language|XHTML]] und [[WordprocessingML|WordML]]).
+
Ein leicht nachzuvollziehendes Beispiel ist die Transformation/Formatierung von invitation.xml<ref>{{Internetquelle |autor=Stefan Mintert |url=http://www.linkwerk.com/pub/xml/invitation/ |titel=invitation.xml – Transform a single source XML file to several output formats |werk=Website der Linkwerk GmbH |sprache=en |abruf=2010-11-03}}</ref> in PDF (das Beispiel zeigt auch die Transformation in [[Wikipedia:Extensible Hypertext Markup Language|XHTML]] und [[Wikipedia:WordprocessingML|WordML]]).
  
 
=== HTML ===
 
=== HTML ===
Aus einer [[Hypertext Markup Language|HTML]]-Datei können PDF-Dokumente mit dem Programm HTMLDOC<ref>{{Internetquelle |autor= |url=https://www.msweet.org/projects.php?Z1 |titel=HTMLDOC Open Source Home Page |werk= |hrsg=Michael R Sweet |datum=2017-01-16 |sprache=en |abruf=2017-01-16 |archiv-url=https://web.archive.org/web/20160221152113/http://msweet.org/projects.php?Z1 |archiv-datum=2016-02-21 |offline=1}}</ref> erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolenschnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z.&nbsp;B. zur On-the-fly-Generierung von PDF-Dokumenten, geeignet.
+
Aus einer [[Wikipedia:Hypertext Markup Language|HTML]]-Datei können PDF-Dokumente mit dem Programm HTMLDOC<ref>{{Internetquelle |autor= |url=https://www.msweet.org/projects.php?Z1 |titel=HTMLDOC Open Source Home Page |werk= |hrsg=Michael R Sweet |datum=2017-01-16 |sprache=en |abruf=2017-01-16 |archiv-url=https://web.archive.org/web/20160221152113/http://msweet.org/projects.php?Z1 |archiv-datum=2016-02-21 |offline=1}}</ref> erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolenschnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z.&nbsp;B. zur On-the-fly-Generierung von PDF-Dokumenten, geeignet.
  
Ein [[Perl (Programmiersprache)|Perl]]-Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur [[Kommandozeile]].
+
Ein [[Wikipedia:Perl (Programmiersprache)|Perl]]-Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur [[Wikipedia:Kommandozeile|Kommandozeile]].
  
Das Programm wkhtmltopdf<ref>{{Internetquelle |url=http://code.google.com/p/wkhtmltopdf/ |titel=wkhtmltopdf |hrsg=Open Source Project |sprache=en |abruf=2011-12-30}}</ref> ermöglicht die Generierung von mehreren PDF-Dokumenten gleichzeitig, ggf. inklusive Inhaltsverzeichnis. Durch die Verwendung des Webkit-Browser-Pakets<ref>{{Internetquelle |url=http://www.webkit.org/ |titel=Webkit Open Source Projekt |hrsg=Open Source Project |sprache=en |abruf=2011-12-30}}</ref> werden qualitativ sehr hochwertige Dokumente, z.&nbsp;B. zur Dokumentation kompletter Websites, erzeugt.<ref>{{Internetquelle |url=http://web2pdf.innovate.de/websitedoc/online_website_pdf_converter_mit_inhaltsverzeichnis |titel=Website als PDF mit Inhaltsverzeichnis |hrsg=Innovate Webdoc Services |abruf=2011-12-30}}</ref> wkhtmltopdf ist ein Konsolenprogramm und kann ggf. auch über das [[Perl (Programmiersprache)|Perl]]-Modul WKHTMLTOPDF bedient werden.
+
Das Programm wkhtmltopdf<ref>{{Internetquelle |url=http://code.google.com/p/wkhtmltopdf/ |titel=wkhtmltopdf |hrsg=Open Source Project |sprache=en |abruf=2011-12-30}}</ref> ermöglicht die Generierung von mehreren PDF-Dokumenten gleichzeitig, ggf. inklusive Inhaltsverzeichnis. Durch die Verwendung des Webkit-Browser-Pakets<ref>{{Internetquelle |url=http://www.webkit.org/ |titel=Webkit Open Source Projekt |hrsg=Open Source Project |sprache=en |abruf=2011-12-30}}</ref> werden qualitativ sehr hochwertige Dokumente, z.&nbsp;B. zur Dokumentation kompletter Websites, erzeugt.<ref>{{Internetquelle |url=http://web2pdf.innovate.de/websitedoc/online_website_pdf_converter_mit_inhaltsverzeichnis |titel=Website als PDF mit Inhaltsverzeichnis |hrsg=Innovate Webdoc Services |abruf=2011-12-30}}</ref> wkhtmltopdf ist ein Konsolenprogramm und kann ggf. auch über das [[Wikipedia:Perl (Programmiersprache)|Perl]]-Modul WKHTMLTOPDF bedient werden.
  
Auch [[PDF.js]] wandelt PDF-Dateien (temporär) in HTML-Code um, um die Anzeige dieser im Browser zu ermöglichen.
+
Auch [[Wikipedia:PDF.js|PDF.js]] wandelt PDF-Dateien (temporär) in HTML-Code um, um die Anzeige dieser im Browser zu ermöglichen.
  
 
=== TeX/DVI ===
 
=== TeX/DVI ===
* Aus [[Device independent file format|DVI]]-Dateien (das Format wurde 1979 entworfen), die von den Satzprogrammen [[TeX]] und [[groff]] (u.&nbsp;a.) erzeugt werden, können auf verschiedene Weisen PDF-Dateien erzeugt werden:
+
* Aus [[Wikipedia:Device independent file format|DVI]]-Dateien (das Format wurde 1979 entworfen), die von den Satzprogrammen [[Wikipedia:TeX|TeX]] und [[Wikipedia:groff|groff]] (u.&nbsp;a.) erzeugt werden, können auf verschiedene Weisen PDF-Dateien erzeugt werden:
*# Man erzeugt aus der <code>.dvi</code>-Datei mithilfe des [[Gerätetreiber]]s [http://ctan.org/pkg/dvips dvips] eine PostScript-Datei (<code>.ps</code>) und aus dieser mit dem ''[[#Erzeugung und Umwandlung|Adobe Distiller]]'' oder dem [[Ghostscript]]-Teilprogramm ps2pdf<ref>[http://ghostscript.com/doc/current/Ps2pdf.htm ps2pdf: PostScript-to-PDF converter] auf [[ghostscript]].com</ref><!--TODO: auf der folgenden Seite steht nicht, was mit ps2pdf gemeint ist--><ref>[http://tug.org/PSTricks/main.cgi?file=pdf/pdfoutput PStricks-Seite über PDF-Export] unter tug.org.</ref> ein <code>.pdf</code> – kurz <code>dvi→ps→pdf</code>.
+
*# Man erzeugt aus der <code>.dvi</code>-Datei mithilfe des [[Wikipedia:Gerätetreiber|Gerätetreiber]]s [http://ctan.org/pkg/dvips dvips] eine PostScript-Datei (<code>.ps</code>) und aus dieser mit dem ''[[#Erzeugung und Umwandlung|Adobe Distiller]]'' oder dem [[Wikipedia:Ghostscript|Ghostscript]]-Teilprogramm ps2pdf<ref>[http://ghostscript.com/doc/current/Ps2pdf.htm ps2pdf: PostScript-to-PDF converter] auf [[Wikipedia:ghostscript|ghostscript]].com</ref><!--TODO: auf der folgenden Seite steht nicht, was mit ps2pdf gemeint ist--><ref>[http://tug.org/PSTricks/main.cgi?file=pdf/pdfoutput PStricks-Seite über PDF-Export] unter tug.org.</ref> ein <code>.pdf</code> – kurz <code>dvi→ps→pdf</code>.
 
*# Eine „partielle Abkürzung“ dieser Methode stellen Programme wie [http://ctan.org/pkg/dvipdfm dvipdfm] oder [http://ctan.org/pkg/dvipdfmx dvipdfmx] dar, die DVI „direkt“ in PDF umwandeln.
 
*# Eine „partielle Abkürzung“ dieser Methode stellen Programme wie [http://ctan.org/pkg/dvipdfm dvipdfm] oder [http://ctan.org/pkg/dvipdfmx dvipdfmx] dar, die DVI „direkt“ in PDF umwandeln.
* [[pdfTeX]] und [[LuaTeX]] sind Weiterentwicklungen von [[TeX]], die „direkt“, ohne das Zwischenformat DVI, PDF-Dateien erzeugen. Diese Erweiterungen von TeX erlangten zu Beginn des 21. Jahrhunderts Bedeutung.
+
* [[Wikipedia:pdfTeX|pdfTeX]] und [[Wikipedia:LuaTeX|LuaTeX]] sind Weiterentwicklungen von [[Wikipedia:TeX|TeX]], die „direkt“, ohne das Zwischenformat DVI, PDF-Dateien erzeugen. Diese Erweiterungen von TeX erlangten zu Beginn des 21. Jahrhunderts Bedeutung.
Vielen TeX-Nutzern genügen die angegebenen Alternativen zur zuerst genannten Methode <code>dvi→ps→pdf</code>. Andere TeX-Nutzer betten jedoch PostScript in einem Maße in den Quellcode ein, dass diese Methoden versagen. Dies trifft vor allem zu, wenn das TeX-Paket [[PSTricks]] verwendet wird. Die Zusatzpakete pst-pdf, auto-pst-pdf und pdftricks bieten in diesem Fall Erleichterungen. Insgesamt verbleiben jedoch Fälle, in denen die „traditionelle“ Methode <code>dvi→ps→pdf</code> unersetzbar ist. Eine weitere Alternative bietet aber
+
Vielen TeX-Nutzern genügen die angegebenen Alternativen zur zuerst genannten Methode <code>dvi→ps→pdf</code>. Andere TeX-Nutzer betten jedoch PostScript in einem Maße in den Quellcode ein, dass diese Methoden versagen. Dies trifft vor allem zu, wenn das TeX-Paket [[Wikipedia:PSTricks|PSTricks]] verwendet wird. Die Zusatzpakete pst-pdf, auto-pst-pdf und pdftricks bieten in diesem Fall Erleichterungen. Insgesamt verbleiben jedoch Fälle, in denen die „traditionelle“ Methode <code>dvi→ps→pdf</code> unersetzbar ist. Eine weitere Alternative bietet aber
* [[XeTeX]], das nach pdfTeX und etwas früher als LuaTeX erschien. Es erzeugt ein Zwischenformat XDV und daraus (vom Anwender kaum bemerkt) mit dem Treiber xdvipdfmx PDF.<ref>[http://ctan.org/pkg/xetex xetex] auf CTAN.</ref> Dadurch soll PostScript im Dokumentquellcode vollständig verarbeitet werden.<ref>[http://tex.stackexchange.com/questions/8413 Am höchsten bewertete Antwort] von [http://ctan.org/author/voss Herbert Voß] zu Frage 8413 auf tex.stackexchange.com.</ref><ref>[http://tex.stackexchange.com/questions/19966 Antwort von „egreg“] [http://ctan.org/author/gregorio (Enrico Gregorio)] zu Frage 19966 auf tex.stackexchange.com.</ref> Für die Verwendung von PStricks wird noch ein Paket [http://ctan.org/pkg/xetex-pstricks xetex-pstricks] angeboten.
+
* [[Wikipedia:XeTeX|XeTeX]], das nach pdfTeX und etwas früher als LuaTeX erschien. Es erzeugt ein Zwischenformat XDV und daraus (vom Anwender kaum bemerkt) mit dem Treiber xdvipdfmx PDF.<ref>[http://ctan.org/pkg/xetex xetex] auf CTAN.</ref> Dadurch soll PostScript im Dokumentquellcode vollständig verarbeitet werden.<ref>[http://tex.stackexchange.com/questions/8413 Am höchsten bewertete Antwort] von [http://ctan.org/author/voss Herbert Voß] zu Frage 8413 auf tex.stackexchange.com.</ref><ref>[http://tex.stackexchange.com/questions/19966 Antwort von „egreg“] [http://ctan.org/author/gregorio (Enrico Gregorio)] zu Frage 19966 auf tex.stackexchange.com.</ref> Für die Verwendung von PStricks wird noch ein Paket [http://ctan.org/pkg/xetex-pstricks xetex-pstricks] angeboten.
  
 
=== 3D-Daten ===
 
=== 3D-Daten ===
 
[[Datei:MENISCAS 180 CAD-Modell.pdf|mini|Beispiel für eine 3D-PDF-Datei]]
 
[[Datei:MENISCAS 180 CAD-Modell.pdf|mini|Beispiel für eine 3D-PDF-Datei]]
3D-PDF-Dokumente sind PDF-Dokumente, die entweder ein [[Universal 3D|U3D]]-Flächenmodell oder ein BREP/Flächenmodell [[PRC (Datenformat)|PRC]]<ref>{{Webarchiv |url=http://livedocs.adobe.com/acrobat_sdk/9/Acrobat9_HTMLHelp/API_References/PRCReference/PRC_Format_Specification/index.html |wayback=20081202034541 |text=PRC Format Specification}} bei Adobe</ref> enthalten. Sie dienen vorwiegend der Visualisierung von [[CAD]]-Daten, kommen aber auch zunehmend in wissenschaftlichen Veröffentlichungen zur Anwendung.<ref>{{Literatur |Autor=Axel Newe |Titel=Enriching scientific publications with interactive 3D PDF: an integrated toolbox for creating ready-to-publish figures |Sammelwerk=PeerJ Computer Science |Band=2 |Datum=2016-06-20 |ISSN=2376-5992 |Online=https://peerj.com/articles/cs-64 |Abruf=2016-06-28 |DOI=10.7717/peerj-cs.64}}</ref>
+
3D-PDF-Dokumente sind PDF-Dokumente, die entweder ein [[Wikipedia:Universal 3D|U3D]]-Flächenmodell oder ein BREP/Flächenmodell [[Wikipedia:PRC (Datenformat)|PRC]]<ref>{{Webarchiv |url=http://livedocs.adobe.com/acrobat_sdk/9/Acrobat9_HTMLHelp/API_References/PRCReference/PRC_Format_Specification/index.html |wayback=20081202034541 |text=PRC Format Specification}} bei Adobe</ref> enthalten. Sie dienen vorwiegend der Visualisierung von [[Wikipedia:CAD|CAD]]-Daten, kommen aber auch zunehmend in wissenschaftlichen Veröffentlichungen zur Anwendung.<ref>{{Literatur |Autor=Axel Newe |Titel=Enriching scientific publications with interactive 3D PDF: an integrated toolbox for creating ready-to-publish figures |Sammelwerk=PeerJ Computer Science |Band=2 |Datum=2016-06-20 |ISSN=2376-5992 |Online=https://peerj.com/articles/cs-64 |Abruf=2016-06-28 |DOI=10.7717/peerj-cs.64}}</ref>
  
Der kostenlose [[Adobe Reader]] kann ab der Version 8.1 beide Formate anzeigen, animieren, schneiden und messen.
+
Der kostenlose [[Wikipedia:Adobe Reader|Adobe Reader]] kann ab der Version 8.1 beide Formate anzeigen, animieren, schneiden und messen.
Mit Acrobat 3D V7 ließen sich 3D-Daten aus 40 CAD-Formaten in 3D-PDF-Dateien konvertieren; jedoch hat 2010 [[Adobe Inc.|Adobe]] Entwicklung, Vertrieb und Support der 3D-PDF-Konverter-Technologie an Tech Soft 3D<ref>{{Webarchiv |url=http://www.techsoft3d.com/our-products/acrobat-pro-bundle |wayback=20120511024743 |text=Acrobat Pro Bundle}} bei Tech Soft 3D</ref> und die PROSTEP AG<ref>[http://www.pdfgenerator3d.com/ PDF Generator 3D] der PROSTEP AG</ref> übergeben. Ab Acrobat X<ref>[http://www.adobe.com/de/products/acrobatpro.html Acrobat X Pro] bei Adobe</ref> ist die Konvertierung nur noch als kostenpflichtiges 3D-PDF-Converter-Plugin<ref>[http://www.tetra4d.com/3D-PDF 3D PDF Converter-Plug-in] bei Tetra 4D</ref> des Unternehmens Tetra 4D verfügbar.
+
Mit Acrobat 3D V7 ließen sich 3D-Daten aus 40 CAD-Formaten in 3D-PDF-Dateien konvertieren; jedoch hat 2010 [[Wikipedia:Adobe Inc.|Adobe]] Entwicklung, Vertrieb und Support der 3D-PDF-Konverter-Technologie an Tech Soft 3D<ref>{{Webarchiv |url=http://www.techsoft3d.com/our-products/acrobat-pro-bundle |wayback=20120511024743 |text=Acrobat Pro Bundle}} bei Tech Soft 3D</ref> und die PROSTEP AG<ref>[http://www.pdfgenerator3d.com/ PDF Generator 3D] der PROSTEP AG</ref> übergeben. Ab Acrobat X<ref>[http://www.adobe.com/de/products/acrobatpro.html Acrobat X Pro] bei Adobe</ref> ist die Konvertierung nur noch als kostenpflichtiges 3D-PDF-Converter-Plugin<ref>[http://www.tetra4d.com/3D-PDF 3D PDF Converter-Plug-in] bei Tetra 4D</ref> des Unternehmens Tetra 4D verfügbar.
  
Einige CAD-Programmen wie [[Allplan]] oder [[SolidWorks]]<ref>{{Internetquelle |autor=DassaultSystemes Solidworks |url=http://help.solidworks.com/2019/English/SolidWorks/sldworks/r_3dpdf_export_options_sys_option.htm |titel=official help-documentation |werk= |hrsg= |datum= |sprache=en |abruf=2019-06-27}}</ref> haben einen 3D-PDF-Export; Allplan bietet auch einen 3D-PDF-Import.<ref>[https://www.allplan.com/de/system/datenaustauschformate/ allplan.com: Datenaustauschformate]</ref>
+
Einige CAD-Programmen wie [[Wikipedia:Allplan|Allplan]] oder [[Wikipedia:SolidWorks|SolidWorks]]<ref>{{Internetquelle |autor=DassaultSystemes Solidworks |url=http://help.solidworks.com/2019/English/SolidWorks/sldworks/r_3dpdf_export_options_sys_option.htm |titel=official help-documentation |werk= |hrsg= |datum= |sprache=en |abruf=2019-06-27}}</ref> haben einen 3D-PDF-Export; Allplan bietet auch einen 3D-PDF-Import.<ref>[https://www.allplan.com/de/system/datenaustauschformate/ allplan.com: Datenaustauschformate]</ref>
 
Auch Werkzeuge wie Deep Exploration von SAP,<ref>{{Webarchiv |url=http://www.righthemisphere.com/products/client-products/deep-exploration-cad-edition |archive-is=20120907 |text=Deep Exploration}} von Right Hemisphere, seit 2012 SAP</ref> Pages3D von QuadriSpace<ref>[http://www.quadrispace.com/solutions/pdf/index.htm Pages3D] bei QuadriSpace</ref> und 3DVIA Composer von Dassault Systèmes<ref>{{Webarchiv |url=http://www.3ds.com/de/products/3dvia/3dvia-composer/ |archive-is=20130525 |text=3DVIA Composer}} bei Dassault Systèmes</ref> können 3D-CAD-Modelle als 3D-PDF abspeichern.
 
Auch Werkzeuge wie Deep Exploration von SAP,<ref>{{Webarchiv |url=http://www.righthemisphere.com/products/client-products/deep-exploration-cad-edition |archive-is=20120907 |text=Deep Exploration}} von Right Hemisphere, seit 2012 SAP</ref> Pages3D von QuadriSpace<ref>[http://www.quadrispace.com/solutions/pdf/index.htm Pages3D] bei QuadriSpace</ref> und 3DVIA Composer von Dassault Systèmes<ref>{{Webarchiv |url=http://www.3ds.com/de/products/3dvia/3dvia-composer/ |archive-is=20130525 |text=3DVIA Composer}} bei Dassault Systèmes</ref> können 3D-CAD-Modelle als 3D-PDF abspeichern.
  
Zeile 196: Zeile 196:
 
=== Videoformate ===
 
=== Videoformate ===
 
[[Datei:3DPDF Acrobat9 PlusDF.pdf|mini|Kombination von SWF und 3D Daten in einer 3D PDF]]
 
[[Datei:3DPDF Acrobat9 PlusDF.pdf|mini|Kombination von SWF und 3D Daten in einer 3D PDF]]
Ab Acrobat 9 lassen sich diverse in [[Adobe Flash#SWF-Dateiformat|Shockwave Flash (SWF)]] konvertierte Videoformate in Adobe PDF einbetten. Dadurch können Videos, Animationen und Anwendungen auf vielen Plattformen genutzt werden. Aufgrund der Adobe-Flash-Unterstützung in Adobe Reader ab Version 9 ist kein zusätzlicher Player für die Wiedergabe erforderlich. Seit dem letzten Patch von Adobe Acrobat und Adobe Reader 9 hat Adobe bei 3D PDF das Standardverhalten geändert, unter anderem wurde der Flashplayer aus Adobe Acrobat 9 und Adobe Reader 9 entfernt – Flashinhalte greifen auf den Flashplayer im Betriebssystem zu. Adobe Acrobat X und Adobe Reader X sind nicht betroffen, da dort fast keine Angriffe erfolgen. 3D-Daten, SWF-Funktionen und SWF-Videoformate können auch kombiniert werden; so ist es möglich, Teilflächen des Modells mit SWF-Videos und Funktionen zu belegen.
+
Ab Acrobat 9 lassen sich diverse in [[Wikipedia:Adobe Flash#SWF-Dateiformat|Shockwave Flash (SWF)]] konvertierte Videoformate in Adobe PDF einbetten. Dadurch können Videos, Animationen und Anwendungen auf vielen Plattformen genutzt werden. Aufgrund der Adobe-Flash-Unterstützung in Adobe Reader ab Version 9 ist kein zusätzlicher Player für die Wiedergabe erforderlich. Seit dem letzten Patch von Adobe Acrobat und Adobe Reader 9 hat Adobe bei 3D PDF das Standardverhalten geändert, unter anderem wurde der Flashplayer aus Adobe Acrobat 9 und Adobe Reader 9 entfernt – Flashinhalte greifen auf den Flashplayer im Betriebssystem zu. Adobe Acrobat X und Adobe Reader X sind nicht betroffen, da dort fast keine Angriffe erfolgen. 3D-Daten, SWF-Funktionen und SWF-Videoformate können auch kombiniert werden; so ist es möglich, Teilflächen des Modells mit SWF-Videos und Funktionen zu belegen.
  
 
=== Dateien aus Büroanwendungen ===
 
=== Dateien aus Büroanwendungen ===
Viele aktuelle Programmpakete wie [[Apple iWork]], [[Microsoft Office]], [[LibreOffice]], [[Apache OpenOffice|OpenOffice.org]] und [[Softmaker]] Office bieten einen PDF-Export an.
+
Viele aktuelle Programmpakete wie [[Wikipedia:Apple iWork|Apple iWork]], [[Wikipedia:Microsoft Office|Microsoft Office]], [[Wikipedia:LibreOffice|LibreOffice]], [[Wikipedia:Apache OpenOffice|OpenOffice.org]] und [[Wikipedia:Softmaker|Softmaker]] Office bieten einen PDF-Export an.
 
{{Absatz}}
 
{{Absatz}}
 
== Versionen von PDF ==
 
== Versionen von PDF ==
Zeile 211: Zeile 211:
 
| 1994 || 1.1 || 2 || externe Querverweise, Einbettung von Multimedia-Dateien in mittlerweile obsoleten Sound- und Video-Formaten, Dokumente können durchsucht werden, 40-Bit-Verschlüsselung
 
| 1994 || 1.1 || 2 || externe Querverweise, Einbettung von Multimedia-Dateien in mittlerweile obsoleten Sound- und Video-Formaten, Dokumente können durchsucht werden, 40-Bit-Verschlüsselung
 
|-
 
|-
| 1996 || 1.2 || 3 || Möglichkeit der Verwendung des [[CMYK-Farbmodell]]s, direktes Öffnen im Browserfenster durch Implementierung von Browser-Erweiterungen (sog. PlugIns), Zugänglichkeits-Plugin für Blinde für den Acrobat Reader 3, interaktive Elemente wie Checkboxen und Radiobuttons sind möglich
+
| 1996 || 1.2 || 3 || Möglichkeit der Verwendung des [[Wikipedia:CMYK-Farbmodell|CMYK-Farbmodell]]s, direktes Öffnen im Browserfenster durch Implementierung von Browser-Erweiterungen (sog. PlugIns), Zugänglichkeits-Plugin für Blinde für den Acrobat Reader 3, interaktive Elemente wie Checkboxen und Radiobuttons sind möglich
 
|-
 
|-
| 1999 || 1.3 || 4 || Unterstützung asiatischer Schriften, verbessertes Accessibility Plugin für den Acrobat Reader, weiterhin 40-Bit-Verschlüsselung, digitale Signaturen, [[JavaScript]]-Elemente möglich
+
| 1999 || 1.3 || 4 || Unterstützung asiatischer Schriften, verbessertes Accessibility Plugin für den Acrobat Reader, weiterhin 40-Bit-Verschlüsselung, digitale Signaturen, [[Wikipedia:JavaScript|JavaScript]]-Elemente möglich
 
|-
 
|-
| 2001 || 1.4 || 5 || Wegfall des Zugänglichkeits-Plugin, dafür Unterstützung von MSAA (Microsoft Active Accessibility) durch den Acrobat Reader, [[RC4]]-Verschlüsselung mit 40–128 Bit, Beschreibung des logischen Dokumentaufbaus mit Tags
+
| 2001 || 1.4 || 5 || Wegfall des Zugänglichkeits-Plugin, dafür Unterstützung von MSAA (Microsoft Active Accessibility) durch den Acrobat Reader, [[Wikipedia:RC4|RC4]]-Verschlüsselung mit 40–128 Bit, Beschreibung des logischen Dokumentaufbaus mit Tags
 
|-
 
|-
| 2003 || 1.5 || 6 || Einbettung von Bildern im Format [[JPEG 2000]], Filmen im Format [[MPEG]] und Audiodateien im Format [[MP3]] möglich, Public Key-Verschlüsselung [[PKCS#7]]; Leseprogramm heißt ab jetzt Adobe Reader, keine Unterstützung mehr für DOS-basierte Windows-Versionen (Windows 95, 98, ME)
+
| 2003 || 1.5 || 6 || Einbettung von Bildern im Format [[Wikipedia:JPEG 2000|JPEG 2000]], Filmen im Format [[Wikipedia:MPEG|MPEG]] und Audiodateien im Format [[Wikipedia:MP3|MP3]] möglich, Public Key-Verschlüsselung [[Wikipedia:PKCS#7|PKCS]]; Leseprogramm heißt ab jetzt Adobe Reader, keine Unterstützung mehr für DOS-basierte Windows-Versionen (Windows 95, 98, ME)
 
|-
 
|-
| 2004 || 1.6 || 7 || Unterstützung für das [[Universal 3D|Universal-3D]]-Dateiformat, Einbettung von [[OpenType]]-Fonts, Unterstützung für XFA 2.2 Rich-Text-Elemente und Attribute, [[Advanced Encryption Standard|AES]]-Verschlüsselung, PKCS#7-Verschlüsselung mit [[SHA256]], [[Digital Signature Algorithm|DSA]] bis zu 4096 Bit, unzugängliche PDF-Dokumente können mit Tags versehen werden, bessere Unterstützung für mehrspaltige Dokumente, Formularfelder können mit Hilfe der Sprachausgabefunktionen vorgelesen werden, PDF-Creator mit Ausgabehilfeassistent: unterstützt beim Optimieren für Screenreader und Bildschirmvergrößerungsprogramme
+
| 2004 || 1.6 || 7 || Unterstützung für das [[Wikipedia:Universal 3D|Universal-3D]]-Dateiformat, Einbettung von [[Wikipedia:OpenType|OpenType]]-Fonts, Unterstützung für XFA 2.2 Rich-Text-Elemente und Attribute, [[Wikipedia:Advanced Encryption Standard|AES]]-Verschlüsselung, PKCS#7-Verschlüsselung mit [[Wikipedia:SHA256|SHA256]], [[Wikipedia:Digital Signature Algorithm|DSA]] bis zu 4096 Bit, unzugängliche PDF-Dokumente können mit Tags versehen werden, bessere Unterstützung für mehrspaltige Dokumente, Formularfelder können mit Hilfe der Sprachausgabefunktionen vorgelesen werden, PDF-Creator mit Ausgabehilfeassistent: unterstützt beim Optimieren für Screenreader und Bildschirmvergrößerungsprogramme
 
|-
 
|-
| 2006 || 1.7 || 8 || weitere Verbesserung der 3D-Darstellungsoptionen, stärkere Verschlüsselungsalgorithmen (PKCS#7 mit SHA384, SHA512 und [[RIPEMD-160]], 256-Bit AES)
+
| 2006 || 1.7 || 8 || weitere Verbesserung der 3D-Darstellungsoptionen, stärkere Verschlüsselungsalgorithmen (PKCS#7 mit SHA384, SHA512 und [[Wikipedia:RIPEMD-160|RIPEMD-160]], 256-Bit AES)
 
|-
 
|-
 
| 2008 || 1.7 || 9 || weitere Verbesserung
 
| 2008 || 1.7 || 9 || weitere Verbesserung
Zeile 229: Zeile 229:
 
| 2012 || 1.7 || XI || weitere Verbesserung
 
| 2012 || 1.7 || XI || weitere Verbesserung
 
|-
 
|-
| 2017 || 2.0 || DC || Unterstützung für das [[PRC (Datenformat)|PRC]]-Dateiformat, 3D-Messwerkzeuge, verbesserte Sicherheitsfunktionen<ref name="PDF2.0NextLevel">{{Internetquelle |url=https://blogs.adobe.com/conversations/2017/08/taking-documents-to-the-next-level-with-pdf-2-0.html |titel=Taking Documents to the Next Level with PDF 2.0 |hrsg=Adobe |sprache=en |abruf=2017-09-11}}</ref>
+
| 2017 || 2.0 || DC || Unterstützung für das [[Wikipedia:PRC (Datenformat)|PRC]]-Dateiformat, 3D-Messwerkzeuge, verbesserte Sicherheitsfunktionen<ref name="PDF2.0NextLevel">{{Internetquelle |url=https://blogs.adobe.com/conversations/2017/08/taking-documents-to-the-next-level-with-pdf-2-0.html |titel=Taking Documents to the Next Level with PDF 2.0 |hrsg=Adobe |sprache=en |abruf=2017-09-11}}</ref>
 
|}
 
|}
  
Zeile 257: Zeile 257:
 
| 15930-8 || 2008 || PDF/X-5 || 1.6 || siehe PDF/X
 
| 15930-8 || 2008 || PDF/X-5 || 1.6 || siehe PDF/X
 
|-
 
|-
| 19005-1 || 2005 || [[PDF/A|PDF/A-1]] || 1.4 || Format für die [[elektronische Archivierung]]
+
| 19005-1 || 2005 || [[Wikipedia:PDF/A|PDF/A-1]] || 1.4 || Format für die [[Wikipedia:elektronische Archivierung|elektronische Archivierung]]
 
|-
 
|-
 
| 19005-1 || 2007 || PDF/A-1 || 1.4 || Korrektur PDF/A-1
 
| 19005-1 || 2007 || PDF/A-1 || 1.4 || Korrektur PDF/A-1
 
|-
 
|-
| 19005-2 || 2011 || [[PDF/A|PDF/A-2]] || 1.7 || siehe PDF/A-1
+
| 19005-2 || 2011 || [[Wikipedia:PDF/A|PDF/A-2]] || 1.7 || siehe PDF/A-1
 
|-
 
|-
| 19005-3 || 2012 || [[PDF/A|PDF/A-3]] || 1.7 || siehe PDF/A-1
+
| 19005-3 || 2012 || [[Wikipedia:PDF/A|PDF/A-3]] || 1.7 || siehe PDF/A-1
 
|-
 
|-
| 24517 || 2008 || [[PDF/E]] || 1.6 || Format für technische Dokumente aus den Bereichen Ingenieurwesen, Architektur und Geo-Informationssysteme (PDF Engineering)
+
| 24517 || 2008 || [[Wikipedia:PDF/E|PDF/E]] || 1.6 || Format für technische Dokumente aus den Bereichen Ingenieurwesen, Architektur und Geo-Informationssysteme (PDF Engineering)
 
|-
 
|-
 
| – || 2008 || PDF/H || || Format für Dokumente im Gesundheitswesen (PDF Healthcare)
 
| – || 2008 || PDF/H || || Format für Dokumente im Gesundheitswesen (PDF Healthcare)
 
|-
 
|-
| 14289 || 2008 || [[PDF/UA]] || 1.7 || Richtlinien zum Aufbau eines barrierefreien Dokuments im Format PDF (Universal Accessability)
+
| 14289 || 2008 || [[Wikipedia:PDF/UA|PDF/UA]] || 1.7 || Richtlinien zum Aufbau eines barrierefreien Dokuments im Format PDF (Universal Accessability)
 
|-
 
|-
| 16612-2 || 2010 || [[PDF/VT]] || 1.6 || Format für den Einsatz im hochvolumigen und Transaktionsdruck (PDF Variable and Transactional Printing)
+
| 16612-2 || 2010 || [[Wikipedia:PDF/VT|PDF/VT]] || 1.6 || Format für den Einsatz im hochvolumigen und Transaktionsdruck (PDF Variable and Transactional Printing)
 
|-
 
|-
 
| 32000-1 || 2008 || PDF 1.7 || 1.7 ||
 
| 32000-1 || 2008 || PDF 1.7 || 1.7 ||
Zeile 280: Zeile 280:
 
== Literatur ==
 
== Literatur ==
 
* Philipp Mayr: ''Das Dateiformat PDF im Web – eine statistische Erhebung.'' In: ''NFD – Nachrichten für Dokumentation.'' Jg. 53, 2002, S. 475–481.
 
* Philipp Mayr: ''Das Dateiformat PDF im Web – eine statistische Erhebung.'' In: ''NFD – Nachrichten für Dokumentation.'' Jg. 53, 2002, S. 475–481.
* Thomas Merz, [[Olaf Drümmer]]: ''Die PostScript- & PDF-Bibel.'' 2. Auflage. Kopublikation PDFlib GmbH/dpunkt Verlag, 2002, ISBN 3-935320-01-9.<br />{{Webarchiv |url=http://www.pdflib.com/fileadmin/pdflib/pdf/Bibel/PostScript-PDF-Bibel.zip |wayback=20130302190856 |text=''Die PostScript- & PDF-Bibel''}} von PDFLib<!-- Downloadseite: {{Webarchiv | url=http://www.pdflib.com/developer/technical-documentation/books/postscript-pdf-bibel/ | wayback=20130302190856 | text=}} (ebenfalls Webarchiv) -->
+
* Thomas Merz, [[Wikipedia:Olaf Drümmer|Olaf Drümmer]]: ''Die PostScript- & PDF-Bibel.'' 2. Auflage. Kopublikation PDFlib GmbH/dpunkt Verlag, 2002, ISBN 3-935320-01-9.<br />{{Webarchiv |url=http://www.pdflib.com/fileadmin/pdflib/pdf/Bibel/PostScript-PDF-Bibel.zip |wayback=20130302190856 |text=''Die PostScript- & PDF-Bibel''}} von PDFLib<!-- Downloadseite: {{Webarchiv | url=http://www.pdflib.com/developer/technical-documentation/books/postscript-pdf-bibel/ | wayback=20130302190856 | text=}} (ebenfalls Webarchiv) -->
 
* Betsy A. Fanning: [http://www.dpconline.org/docs/reports/dpctw08-02.pdf ''Technology Watch Report, Preserving the Data Explosion: Using PDF''] (PDF; 136&nbsp;kB), Digital Preservation Coalition, April 2008.
 
* Betsy A. Fanning: [http://www.dpconline.org/docs/reports/dpctw08-02.pdf ''Technology Watch Report, Preserving the Data Explosion: Using PDF''] (PDF; 136&nbsp;kB), Digital Preservation Coalition, April 2008.
 
* Ralf Benzmüller, Karsten Tellmann: ''PDF: Potentially Dangerous Files, Angriffs- und Abwehrmechanismen bei PDF-Dateien.'' <kes>, Nr. 1, Februar 2010, S. 61–65; ähnlich bei [http://www.security-zone.info/redaktion_10/R_Benzmueller.pdf security-zone.info] (PDF; 3,1&nbsp;MB).
 
* Ralf Benzmüller, Karsten Tellmann: ''PDF: Potentially Dangerous Files, Angriffs- und Abwehrmechanismen bei PDF-Dateien.'' <kes>, Nr. 1, Februar 2010, S. 61–65; ähnlich bei [http://www.security-zone.info/redaktion_10/R_Benzmueller.pdf security-zone.info] (PDF; 3,1&nbsp;MB).
Zeile 292: Zeile 292:
 
* [http://www.adobe.com/devnet/pdf/pdf_reference.html PDF-Spezifikationen] bei Adobe Systems (englisch)
 
* [http://www.adobe.com/devnet/pdf/pdf_reference.html PDF-Spezifikationen] bei Adobe Systems (englisch)
 
* [http://www.cs.cmu.edu/~dst/Adobe/Gallery/ds-defcon2/ds-defcon.html Technische Betrachtung der PDF-Dateiverschlüsselung]
 
* [http://www.cs.cmu.edu/~dst/Adobe/Gallery/ds-defcon2/ds-defcon.html Technische Betrachtung der PDF-Dateiverschlüsselung]
* [https://www.heise.de/newsticker/meldung/Langzeitarchivierung-PDF-A-als-ISO-Standard-130375.html ISO 19005-1 stützt sich auf das Portable Document Format] Meldung auf [[heise online]]
+
* [https://www.heise.de/newsticker/meldung/Langzeitarchivierung-PDF-A-als-ISO-Standard-130375.html ISO 19005-1 stützt sich auf das Portable Document Format] Meldung auf [[Wikipedia:heise online|heise online]]
 
* [http://www.data2type.de/xml-xslt-xslfo/xsl-fo PDF mit dem W3C-Standard XSL-FO erzeugen]
 
* [http://www.data2type.de/xml-xslt-xslfo/xsl-fo PDF mit dem W3C-Standard XSL-FO erzeugen]
 
* {{Internetquelle |autor=Peter Zschunke, Ben Schwan |url=https://www.heise.de/newsticker/meldung/PDF-wird-20-Jahre-alt-1883567.html |titel=PDF wird 20 Jahre alt |hrsg=heise online |abruf=2013-10-17 |kommentar=Zum Wesen und Werdegang von PDF anlässlich des 20 Jahrestages}}
 
* {{Internetquelle |autor=Peter Zschunke, Ben Schwan |url=https://www.heise.de/newsticker/meldung/PDF-wird-20-Jahre-alt-1883567.html |titel=PDF wird 20 Jahre alt |hrsg=heise online |abruf=2013-10-17 |kommentar=Zum Wesen und Werdegang von PDF anlässlich des 20 Jahrestages}}

Aktuelle Version vom 21. September 2021, 20:29 Uhr

Das Portable Document Format (kurz PDF; deutsch: (trans)portables Dokumentenformat) ist ein plattformunabhängiges Dateiformat, das 1993 vom Unternehmen Adobe Inc. entwickelt und veröffentlicht wurde und aktuell von der PDF Association weiterentwickelt wird.

Ziel war, ein Dateiformat für elektronische Schriftstücke zu schaffen, sodass diese unabhängig vom ursprünglichen Anwendungsprogramm, vom Betriebssystem oder von der Hardwareplattform originalgetreu wiedergegeben werden können. Das Ziel wurde erreicht und findet seinen Niederschlag in der ISO-Normenserie 32000 (ISO 15930 für PDF/X).

Hierzu griff man wesentlich auf die Funktionsweise des PostScript-Formats zurück. Ein Leser einer PDF-Datei soll das Schriftstück immer in der Form betrachten und ausdrucken können, die der Autor festgelegt hat. Die typischen Konvertierungsprobleme (wie veränderter Seitenumbruch oder falsche Schriftarten) beim Austausch eines Schriftstückes zwischen verschiedenen Programmen entfallen dadurch.

Neben Text, Bildern und Grafik kann eine PDF-Datei auch Hilfen enthalten, die die Navigation innerhalb des Schriftstückes erleichtern. Dazu gehören zum Beispiel anklickbare Inhaltsverzeichnisse und miniaturisierte Seitenvorschauen.

Übersicht

Grundlagen und Software

Aus Texten, Bildern und Grafiken – gemischt oder einzeln – lassen sich mit entsprechenden Programmen PDF-Dokumente und -Dateien erzeugen (z. B. mit freien Programmen wie dem PDFCreator und Büropaketen LibreOffice/OpenOffice.org, kostenpflichtigen wie Adobe Acrobat oder einfach über den Druckdialog) und mit entsprechenden Leseprogrammen darstellen (z. B. Evince, Ghostscript, Okular, Adobe Reader, Foxit, Vorschau). Der Ersteller einer PDF-Datei kann diese in vielfältiger Weise vor ungewolltem Gebrauch schützen, indem er die Sicherungsmechanismen von PDF aktiviert. Durch Verschlüsselung soll der Zugriff Unbefugter verhindert werden. Je nach Bedarf kann bereits das Öffnen der Datei ein Passwort erfordern, oder das Kopieren von Inhalten aus der Datei oder das Ausdrucken wird nicht zugelassen. Die dafür in PDF implementierten Schutzmechanismen sind jedoch nicht zuverlässig; insbesondere sind einfachere Formen der Verschlüsselung leicht zu überwinden.

In der Startphase war der Adobe Reader kostenpflichtig. Erst die kostenfreie Weitergabe der Software ermöglichte die Verbreitung des Formats im heutigen Ausmaß. PDF war lange Zeit ein kommerzielles (proprietäres), aber offengelegtes Dateiformat, das im PDF Reference Manual von Adobe dokumentiert ist. Anfang 2007 hatte Adobe es in den Standardisierungsprozess der ISO eingebracht und mit der Veröffentlichung am 1. Juli 2008 ist PDF in Version 1.7 als ISO 32000-1:2008 ein Offener Standard.

Bestimmte Methoden beim Umgang mit PDF wurden zur Erleichterung des Datenaustausches in der Druckvorstufe (als PDF/X) schon vorher und zur Langzeitarchivierung von PDF-Dateien (als PDF/A-1 in ISO 19005-1:2005) von der ISO genormt.

Erzeugung und Umwandlung

PDF ist eine vektorbasierte Seitenbeschreibungssprache, die die freie Skalierbarkeit der Darstellung erlaubt. PDF-Dateien beschreiben das mit der Erstellungsanwendung erzeugte Layout in einer vom Drucker und von Voreinstellungen unabhängigen Form proportional, und daher so originalgetreu, wie es prinzipiell möglich ist. Hierin unterscheidet sich das PDF wesentlich von fortgeschrittenen Beschreibungs- und Auszeichnungssprachen wie SGML oder HTML, wenn es um die Forderung nach optimaler Layout-Treue geht. Um eine Darstellung auch auf Ausgabegeräten mit kleiner Anzeigefläche – wie beispielsweise PDAs oder Mobiltelefonen – zu optimieren, können in einem PDF Auszeichnungen (ähnlich HTML-Tags) eingelagert werden, die ein Umbrechen der Seiteninhalte – dann zwangsläufig unter Einschränkung der Layout-Treue – ermöglichen. Solche Auszeichnungen ermöglichen es zudem einem Vorleseprogramm, sehbehinderten Nutzern das Dokument vorzulesen und erleichtern das Konvertieren des Inhalts in andere Formate.

Eine häufig verwendete Anwendung zur Erzeugung von PDF-Dateien ist Adobe Acrobat Distiller, das aus PostScript-Dateien PDFs erstellt. Acrobat Distiller ist als Desktopprodukt für Windows und Mac OS verfügbar. Serverversionen sowie der kostenlose Adobe Reader existieren auch für andere Plattformen. Mit Hilfe der freien Software Wine läuft Acrobat Distiller auch unter Linux. Diverse Office- und DTP-Programme anderer Hersteller bieten einen direkten PDF-Export an und sind auf einer Reihe von Plattformen verfügbar. Mit inzwischen zahlreichen Werkzeugen und Programmierbibliotheken lassen sich auf verschiedene Weise mit unterschiedlicher Spezialisierung PDF-Dateien erstellen, die Erzeugung von PDF-Dateien ist nahezu auf jeder Plattform möglich.

Adobe räumt Entwicklern teilweise das Recht ein, eigene Anwendungen zur Generierung und Bearbeitung von PDF-Dokumenten zu entwickeln, behält sich aber das Copyright über die Spezifikationen vor.[1] PDF als Seitenbeschreibungssprache kann als Weiterentwicklung des Grafikmodells von PostScript angesehen werden, das ebenfalls offengelegt ist. Ende Februar 2007 hat Adobe angekündigt, die PDF-Spezifikation in der Version 1.7 in die ISO-Normierung einzubringen und arbeitet dafür mit dem amerikanischen Branchenverband AIIM zusammen, der das Sekretariat des ISO-Komitees TC 171 innehat. Adobe drohte Microsoft bei Integration des offenen Standards PDF mit kartellrechtlichen Klagen.

Weitere Erzeugungsmethoden werden unter Konvertierung anderer Formate zu PDF behandelt.

Verwendung und Eigenschaften

Generelle Eigenschaften

Eine PDF-Datei kann Dokumente einschließlich aller Farben, Raster- und Vektorgrafiken, sowie Schrifttypen präzise wiedergeben. Eine der Stärken von PDF ist es, dass es für alle gängigen Plattformen Anzeigeprogramme gibt, so dass eine plattformunabhängige Darstellung des Inhaltes möglich ist.

Eine nachträgliche Bearbeitung von PDF-Dateien gestaltet sich schwierig. Es gibt jedoch verschiedene Programme, mit denen man einzelne Seiten ausschneiden und bestimmte Inhalte verändern kann. Ab der Microsoft-Word-Version 2013 können PDF-Dateien in Word-Dateien direkt im Programm umgewandelt werden.[2]

Umfang von Dokumenten

Größenvergleich: Europakarte und eine PDF-Dokumentenseite mit der theoretisch maximal möglichen Seitengröße von 381 km × 381 km

PDF-Dokumente können mehrere hunderttausend Seiten umfassen. Dabei ist die Seitengröße durch das Format selbst nicht begrenzt. In Adobe Acrobat gibt es jedoch durch die Implementierung bedingte Grenzen:

  • bis Version 3 auf 45 Zoll × 45 Zoll (1,143 m × 1,143 m)
  • bis Version 6 auf 200 Zoll × 200 Zoll (5,08 m × 5,08 m)
  • ab Version 7 auf 15.000.000 Zoll × 15.000.000 Zoll (381 km × 381 km)

Speicherung von Informationen im Dokument

In PDF-Dateien werden alle Informationen als nummerierte Objekte abgespeichert. Objekte sind beispielsweise Schriftinformationen, Zeichenbreiten, verwendete Zeichen-Encodings (Mac/PC …), Seitenbeschreibung, Parameter für Decoder, Crop-Boxes, einzelne Lesezeichen, Farbdefinitionen, Seitenreihenfolgen, Bitmaps, Formulare, Sprungmarken und alles andere, was in PDF-Dateien gespeichert werden kann. Eine hundertseitige PDF-Datei kann ohne Weiteres 10.000 Objekte enthalten.

PDF basiert auf dem gleichen Grafikmodell wie die Seitenbeschreibungssprache PostScript, erlaubt jedoch gegenüber dieser einige zusätzliche Funktionen – insbesondere interaktive Elemente wie Lesezeichen, Kommentare, Formularfelder und deren Programmierung mit JavaScript sind möglich. Auch das Grafikmodell für die Seiteninhalte wurde gegenüber PostScript um Funktionen wie Transparenz oder optionalen oder schaltbaren Inhalt (in der Acrobat-Bedienungsoberfläche als Ebenen bezeichnet) oder die Unterstützung von ICC-Profilen und OpenType-Schriften erweitert.

Schriften (mit Ausnahme von Pixelschriften) und Vektorgrafiken können beliebig ohne Qualitätsverlust vergrößert werden. Große Netzwerkpläne und Datenmodelle lassen sich unter diesen Voraussetzungen verlustfrei auf einer PDF-Seite unterbringen.

Aus PDF-Dokumenten lassen sich Textpassagen, Tabellen und Grafiken (auch Ausschnitte davon) leicht in anderen Anwendungsprogrammen durch Kopieren und Einfügen der jeweiligen Elemente weiterverarbeiten, falls der Ersteller des Dokumentes es zugelassen hat. Text kann nicht nur zur Weiterverarbeitung in anderen Anwendungen, sondern auch zum Durchsuchen oder zur Verwendung mit anderen Ausgabemedien, wie Screenreadern, extrahiert werden. Durch die Textsuche im einzelnen Dokument oder die Volltextrecherche innerhalb einer PDF-Dokumentensammlung lassen sich Detailinhalte sehr einfach auffinden. Das funktioniert selbst dann, wenn der Text grafisch verzerrt, etwa in Kreis- oder Kurvenform, dargestellt ist.

Sicherheit von Dokumenten

Eine Besonderheit von PDF ist der optionale Dokumentenschutz mit 40- oder 128-Bit-Verschlüsselung. Durch Vergabe eines Benutzerpasswortes ist es so möglich, das Dokument nur einem beschränkten Personenkreis zugänglich zu machen. Weiterhin kann der Autor mit einem separaten Besitzerpasswort gezielt die Rechtevergabe des betreffenden Dokuments festlegen. So kann verhindert werden, dass Benutzer das Dokument abändern, ausdrucken oder Teilinhalte kopieren können. Auch ohne Kenntnis des Besitzerpasswortes lassen sich diese Rechteeinschränkungen jedoch mithilfe diverser Werkzeuge insbesondere dann leicht entfernen, wenn zwar ein Besitzerpasswort verwendet wird, das Öffnen des Dokuments jedoch kein Passwort erfordert (das bedeutet, dass kein Benutzerpasswort gesetzt ist). Die mit der Verschlüsselung verbundenen Nutzungseinschränkungen lassen sich durch Speichern von Screenshots als Bitmaps und darauf folgende optische Texterkennung leicht umgehen.

Durch entsprechende Werkzeuge lassen sich auch Rechte vergeben, die es ermöglichen, PDF-Dokumente mit Notizen, Kommentaren und Dateianhängen zu versehen oder Formulareinträge abzuspeichern. Ursprünglich konnten diese Merkmale nur mit Adobe Acrobat genutzt werden, ab Version 7 ist es jedoch auch mit dem kostenlosen Adobe Reader möglich, Notizen und Kommentare hinzuzufügen und interaktive Formularfelder auszufüllen, sofern das entsprechende Dokument vom Verfasser mit den notwendigen Berechtigungen versehen wurde.

Mittlerweile existieren auch DRM-geschützte PDF-Dateien. Diese sind unter anderem mit Adobe Digital Editions lesbar.

Sicherheitslücken durch menschliches Versagen

PDF-Dateien können mitunter unbeabsichtigt vertrauliche Informationen enthalten, die zwar nicht unmittelbar sichtbar sind, aber durch Textsuche gefunden werden können. Einerseits können Informationen durch Objekte verdeckt sein oder sich außerhalb des Seitenanzeigebereichs befinden, andererseits kann ein PDF Metadaten enthalten, die nur beim Aufruf entsprechender Dialoge angezeigt werden und gelegentlich unbemerkt bleiben. Insbesondere beim „Schwärzen“ von Textpassagen ist es nicht ausreichend, die jeweilige Textpassage abzudecken, sondern sie muss vollständig aus dem PDF entfernt werden. Es ist nicht immer einfach, ungewollte Informationen in einem PDF zu vermeiden, insbesondere dann nicht, wenn man nicht ausschließlich selbst das PDF (sowie das Dokument, aus dem es generiert wurde) erstellt und bearbeitet hat. Es ist wichtig, dass beim Schwärzen von Textpassagen ein Werkzeug eingesetzt wird, das die betreffenden Inhalte vollständig entfernt. Genauso wichtig ist das Prüfen der Metadaten (in Acrobat zu finden über Datei/Eigenschaften). Acrobat Professional 8 bietet hier weitgehende Unterstützung, insbesondere durch eine spezielle Funktion zum Entfernen versteckter Informationen.

Fallbeispiele:

  • Eine Datei, die den Tod des italienischen Agenten Nicola Calipari behandelte, der im März 2005 die Journalistin Giuliana Sgrena aus irakischer Geiselhaft befreite. US-Soldaten erschossen ihn dabei kurz nach dieser Aktion. Der veröffentlichte Bericht war zensiert. Doch fanden sich in der veröffentlichten Datei die redaktionellen Überarbeitungen durch Kopieren des Textes und Abspeichern in eine neue Datei.
  • Das Weiße Haus in Washington veröffentlichte George W. Bushs Rede zum „Plan für den Sieg im Irak“. Die Dateiangaben legten den Ghostwriter offen, nämlich Peter Feaver, Professor für Politikwissenschaft von der Duke-Universität in North Carolina, der seit Juni 2005 das National Security Council berät.
  • Nach dem Attentat auf den Fahrzeugkonvoi des libanesischen Politikers Rafiq Hariri fanden sich in einer öffentlich publizierten PDF der UNO die vorher gelöschten Verweise auf Namen syrischer Funktionsträger, die im Verdacht standen, für das Attentat verantwortlich zu sein (siehe Mehlis-Bericht).
  • 2007 gelangten im Rahmen der Formel-1-Spionageaffäre vertrauliche Daten über den Wagen der Scuderia Ferrari an die Öffentlichkeit, nachdem dessen zentrale technische Werte in einem PDF-Dokument, das als Beweismittel diente, lediglich mit einem schwarzen Balken versehen wurden, der Text jedoch weiterhin vorhanden und extrahierbar war.

Bearbeiten von Dokumenten

PDF wurde als ein Austauschformat für fertiggestellte Dokumente konzipiert. Inzwischen gibt es eine Reihe von Programmen und Erweiterungen für Adobe Acrobat, mit denen sich PDF-Dateien bearbeiten lassen. Das Format ist jedoch nicht mit Dateiformaten von Textverarbeitungsprogrammen oder Grafikprogrammen vergleichbar und eignet sich, abgesehen von der Notiz- und Kommentarfunktion, nur begrenzt zur Weiterverarbeitung von Dokumenten. Es ist allerdings innerhalb gewisser Grenzen möglich, beispielsweise Tippfehler zu entfernen. Vorteile im Desktop-Publishing sind für Grafiker und Designer die Einbindung aller Elemente für die Druckerstellung.

PDF-Dokumente können abhängig vom Einzelfall sowohl größer als auch kleiner als die Dateien der Ursprungsanwendung sein. Die Größe eines Dokuments hängt von der Art der enthaltenen Daten, von der Effizienz des Erstellungsprogramms und davon ab, ob Schriften eingebettet wurden. Schriften können entweder vollständig, als Untermenge der tatsächlich im Dokument verwendeten Zeichen oder aber überhaupt nicht eingebettet werden. Soll ein Dokument zuverlässig darstellbar sein, unabhängig davon, ob auf der Zielplattform die verwendeten Schriften installiert sind, müssen mindestens die tatsächlich verwendeten Zeichen eingebettet werden.

Drucken im Batchbetrieb von der Kommandozeile

Gedruckt wird meist innerhalb der grafischen Benutzeroberfläche eines Betrachters mit File ▸ Print…. Acrobat Reader und Foxit Reader haben die Kommandozeilenoption /t <Datei> <Druckername> in den neueren Versionen teils entfernt (September 2015). In Acrobat kann man nur noch auf den Default-Drucker drucken, wohingegen bei Foxit der Drucker zwar wählbar ist, aber Foxit das Anwendungsfenster öffnet und nach dem Druck nicht mehr schließt (der Nutzer muss es von Hand schließen).

Linux

Über CUPS:

lpr -P <Druckername> "datei.pdf"

Windows

Das Batch-Drucken ist mit Ghostscript möglich.[3] Ghostscript installiert sich mit Hilfe eines Installers unter c:\Programme\gs\gs<Version>\. Im Unterverzeichnis bin\ befinden sich ausführbare Dateien. Beispiel mit dem DOS-Fenster in Windows 7:

C:\Program Files\gs\gs9.16\bin>gswin64c.exe \
  -dNOPAGEPROMPT \
  -dNOPROMPT \
  -dNOPAUSE \
  -dBATCH \
  [-dDEVICEWIDTHPOINTS=<Number of American points for the paper size>] \
  [-dDEVICEHEIGHTPOINTS=<Number of American points for the paper size>] \
  -sOutputFile="%printer%\\<server>\<printer name>" \
  -sDEVICE=mswinpr2 \
  <myfile.pdf>

gswin64c.exe ist die 64-bit Version ohne separates Fenster mit interaktivem Modus auf der Kommandozeile.

Dabei schalten die dNO-Optionen den interaktiven Modus aus. Die -dDEVICE-Optionen können genutzt werden, falls der Drucker ein ungewöhnliches Papierformat verwendet. -sOutputFile gibt den Namen des Druckers an. -sDEVICE bezieht sich auf ein internes Modul von Ghostscript, wobei mswinpr2 eine Defaulteinstellung ist. Zum Schluss erwartet die Kommandozeile die zu druckende Datei (kann fehlschlagen bei anderer Reihenfolge). Während des Druckens erscheint ein Abbrechen-Dialog, der sich selbst schließt (mit -dNoCancel abstellbar).

Ghostscript für Windows zeigt die PDF-Datei auch in einem eigenen grafischen Fenster an, falls keine Kommandozeilenparameter vorliegen. Diese Anzeige zeigt Pixel und Treppeneffekte. Hingegen ist die Qualität der gedruckten Dokumente deutlich besser.

Serialisierung und Kompression

PDF wurde im Laufe seiner Entwicklung mehrfach auf spezielle Anforderungen für die Verwendung im Internet angepasst. So musste ein Dokument ursprünglich vollständig verfügbar sein, um dargestellt werden zu können. Inzwischen ist es möglich, PDF-Dokumente zu serialisieren, so dass Teile davon bereits während des Ladevorgangs dargestellt werden können. Ab Version 1.5 der PDF-Spezifikation können mehrere Objekte in einem PDF zusammengefasst und dann komprimiert werden, was insbesondere bei den für die Dokumentstruktur erforderlichen zahlreichen kleinen Objekten zu einer deutlich besseren Kompression führt (Bilddaten oder die eigentliche Beschreibung einer Seite konnten schon immer komprimiert werden).

Bei der Archivierung gedruckter Dokumente als PDF-Dateien wird ein gemischter Ansatz bevorzugt, um sowohl das Originaldokument weitestgehend zu erhalten als auch Durchsuchbarkeit zu gewährleisten. Durch geschickte Kombination der von PDF prinzipiell unterstützten Bildkompressionsverfahren wird eine sehr starke Kompression erreicht (typischerweise 1:200), indem Hintergrund (typischerweise flächige Strukturen und Farbverläufe) und Text (scharfe Ränder, dafür nur wenige Farben) mit verschiedenen, dafür speziell geeigneten Verfahren komprimiert und anschließend übereinandergelegt werden. Der eigentliche Text wird per OCR-Verfahren extrahiert und unsichtbar eingebettet.

Navigation am Bildschirm

Im Gegensatz zu früheren Seitenbeschreibungssprachen wie PostScript ist die „Vorschau“ am Bildschirm nicht mehr nur ein Hilfsmittel, um Probeausdrucke zu vermeiden, sondern bietet komfortable Funktionen, die im Ausdruck nicht möglich sind: bei Querverweisen und Literaturangaben muss man nicht zum Ziel blättern, sondern kann durch Klicken auf den Verweis direkt auf die Zielseite springen. Navigation innerhalb des Dokuments wird auch durch Seitenicons oder Anzeige von Gliederungsbäumen (dem Inhaltsverzeichnis entsprechend) erleichtert. Klickt man auf externe Links, so wird das Zieldokument im Webbrowser angezeigt. Diese Funktionen müssen allerdings durch die Erzeugungssoftware von den Verfassern „eingebaut“ (etwa mit LaTeX und dem LaTeX-Erweiterungspaket hyperref[4], vgl. #TeX/DVI) und vom Betrachter implementiert sein.

Standard-Schriftarten

14 Schriftarten (standard 14 fonts) sind in PDF-Readern standardmäßig verfügbar und müssen (außer bei PDF/A- und PDF/X-Dokumenten) daher nicht separat in das PDF-Dokument eingebettet werden:[5]

PDF in Betriebssystemen

Mit dem Betriebssystem macOS von Apple wurde erstmals PDF als Standardformat für die Bildschirmausgabe wie auch die Druckausgabe verwendet. Die PDF-Erzeugung kann aus jedem Programm heraus erfolgen, das einen Druckdialog besitzt. Da PDF auch zur Erzeugung der Druckdaten verwendet wird, ist es möglich, PostScript auch auf Nicht-Postscript-Druckern auszugeben. Man kann nahezu alle Dokumenttypen, die gedruckt werden können, in PDF konvertieren. Diese Möglichkeit besteht auch unter GNU/Linux, dort wird, z. B. im Druckdialog der Desktopumgebung Gnome, nativ die Option der PDF-Erzeugung angeboten.

Unter Windows, Mac OS Classic und macOS, GNU/Linux und den Unix-Betriebssystemen Solaris, HP/UX und AIX gibt es den kostenlosen Adobe Reader / Acrobat Reader als PDF-Betrachter. Unter eComStation gibt es den integrierten Betrachter Lucide. Seit Windows 8 besitzt nun auch Windows einen integrierten PDF-Betrachter.[6] Windows 10 wurde von Microsoft zusätzlich mit einem PDF-Drucker ausgerüstet.[7]

Für unixbasierte Systeme gibt es zusätzlich das Programm Xpdf, das auf die grundlegendsten Funktionen (Anzeige auf Bildschirm, Durchsuchen des Dokuments, Ausdrucken) reduziert ist, sowie einige weitere Programme (Okular und Evince), die an ihre Desktopumgebung angepasst sind. Diese Open-Source-Programme eignen sich auch, um vermeintliche „Sicherheitsmerkmale“ von PDF-Dokumenten zu umgehen – so ist es teilweise möglich, Dokumente auszudrucken, obwohl der Autor dem Betrachter des Dokuments diese Möglichkeit eigentlich verwehren wollte.

Angaben der Seitengeometrie

Die verschiedenen Boxen im PDF

Angaben zur Seitengeometrie in einem PDF-Dokument sind vor allem in der Druckindustrie sehr wichtig. Sie beschreiben, in welchem Bereich einer Seite sich derjenige Inhalt befindet, der dem beschnittenen Endformat entspricht und wo ein weiterverarbeitendes Programm (beispielsweise zum Ausschießen, also dem Montieren von Seiten auf einem Druckbogen) mit einer Beschnittzugabe rechnen kann. Moderne DTP-Programme legen diese Information beim Direktexport nach PDF im PDF mit ab. Werden PDFs über PostScript ausgegeben, sind die entsprechenden Angaben meist nicht enthalten. Adobe Acrobat Distiller ist für die PostScript-Ausgabe aus bestimmten Programmen in der Lage, den Nettoseitenbereich aus den Beschnittmarken abzuleiten, sofern diese mit ausgegeben wurden.

MediaBox (Medienrahmen)

Sie definiert die Größe des Ausgabemediums des PDF-Dokumentes. Das Dokument ist noch nicht beschnitten und enthält in der Regel die im PDF-Generator eingestellte PostScript-Seitengröße. Die MediaBox muss immer die größte aller Boxen sein, da sie alle anderen Boxen mit einschließen muss, und es ist die einzige Box, die in einem PDF stets enthalten sein muss.

CropBox (Beschnittrahmen)

Die CropBox (teilweise als Maskenrahmen bezeichnet) beschreibt den Bereich einer PDF-Seite, der auf dem Bildschirm bzw. dem Drucker ausgegeben werden soll. Voreingestellt sind die Werte der MediaBox.

BleedBox (Anschnittrahmen)

Eine BleedBox beinhaltet Informationen über die Anschnittrahmen, die die Größe des Endformates zuzüglich des vorgesehenen Beschnitts (Überfüller) definiert. In der Druckindustrie wird ein Beschnitt in der Regel von 3 bis 5 mm pro Seite benötigt. Ein Anwendungsbeispiel sind Bilder, die im Anschnitt (also direkt am Seitenrand) liegen bzw. abfallende Bilder, die am Seitenrand beschnitten werden. Für eine A4-Seite, die an eine Druckerei geliefert werden soll, ergibt sich bei einem Beschnitt von 3 mm somit für die BleedBox eine Breite von 210 mm + 6 mm und eine Länge von 297 mm + 6 mm, also 216 mm × 303 mm. Voreingestellt sind die Werte der CropBox.

TrimBox (Endformatrahmen)

Die TrimBox ist das Endformat des Dokumentes ohne Beschnitt.

ArtBox (Objektrahmen)

Die ArtBox (auch Bounding Box genannt) beschreibt den Seitenausschnitt, der beim Platzieren der PDF-Seite in einem anderen Programm verwendet werden soll; vergleichbar mit der Größenangabe für das Importieren einer EPS-Datei.

Formularprozesse

PDF-Dokumente können für Formularprozesse neben Text und grafischen Elementen interaktive Formularelemente enthalten. Komplette Formulare lassen sich somit in einem PDF-Dokument bündeln; die im Dokument erfassten Daten können über verschiedene Wege zum Herausgeber des Formulars zurückgesendet werden.

  • Drucken und ausfüllen: Das per Hand ausgefüllte Formular kann auf herkömmlichen Wegen per Post oder Fax versendet werden.
  • Ausfüllen und Drucken: Das elektronisch ausgefüllte Dokument kann ausgedruckt und auf herkömmlichen Wegen versendet werden.
  • Ausfüllen und über eine HTTP-Verbindung senden: Das elektronisch ausgefüllte Formular kann elektronisch über den Webbrowser oder aus Adobe Acrobat heraus versendet werden.
  • Ausfüllen und das elektronisch ausgefüllte Formular per E-Mail versenden.

Konvertierung anderer Formate zu PDF

XML

PDF-Dokumente können aus XML-Daten in zwei Schritten erstellt werden:

  • Transformation mit Hilfe eines XSLT-Stylesheets in das XSL-FO-Format
  • Ein PDF-Prozessor (zum Beispiel Apache FOP, Altsoft Xml2PDF) erzeugt daraus das fertige PDF-Dokument.

Ein leicht nachzuvollziehendes Beispiel ist die Transformation/Formatierung von invitation.xml[8] in PDF (das Beispiel zeigt auch die Transformation in XHTML und WordML).

HTML

Aus einer HTML-Datei können PDF-Dokumente mit dem Programm HTMLDOC[9] erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolenschnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z. B. zur On-the-fly-Generierung von PDF-Dokumenten, geeignet.

Ein Perl-Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur Kommandozeile.

Das Programm wkhtmltopdf[10] ermöglicht die Generierung von mehreren PDF-Dokumenten gleichzeitig, ggf. inklusive Inhaltsverzeichnis. Durch die Verwendung des Webkit-Browser-Pakets[11] werden qualitativ sehr hochwertige Dokumente, z. B. zur Dokumentation kompletter Websites, erzeugt.[12] wkhtmltopdf ist ein Konsolenprogramm und kann ggf. auch über das Perl-Modul WKHTMLTOPDF bedient werden.

Auch PDF.js wandelt PDF-Dateien (temporär) in HTML-Code um, um die Anzeige dieser im Browser zu ermöglichen.

TeX/DVI

  • Aus DVI-Dateien (das Format wurde 1979 entworfen), die von den Satzprogrammen TeX und groff (u. a.) erzeugt werden, können auf verschiedene Weisen PDF-Dateien erzeugt werden:
    1. Man erzeugt aus der .dvi-Datei mithilfe des Gerätetreibers dvips eine PostScript-Datei (.ps) und aus dieser mit dem Adobe Distiller oder dem Ghostscript-Teilprogramm ps2pdf[13][14] ein .pdf – kurz dvi→ps→pdf.
    2. Eine „partielle Abkürzung“ dieser Methode stellen Programme wie dvipdfm oder dvipdfmx dar, die DVI „direkt“ in PDF umwandeln.
  • pdfTeX und LuaTeX sind Weiterentwicklungen von TeX, die „direkt“, ohne das Zwischenformat DVI, PDF-Dateien erzeugen. Diese Erweiterungen von TeX erlangten zu Beginn des 21. Jahrhunderts Bedeutung.

Vielen TeX-Nutzern genügen die angegebenen Alternativen zur zuerst genannten Methode dvi→ps→pdf. Andere TeX-Nutzer betten jedoch PostScript in einem Maße in den Quellcode ein, dass diese Methoden versagen. Dies trifft vor allem zu, wenn das TeX-Paket PSTricks verwendet wird. Die Zusatzpakete pst-pdf, auto-pst-pdf und pdftricks bieten in diesem Fall Erleichterungen. Insgesamt verbleiben jedoch Fälle, in denen die „traditionelle“ Methode dvi→ps→pdf unersetzbar ist. Eine weitere Alternative bietet aber

  • XeTeX, das nach pdfTeX und etwas früher als LuaTeX erschien. Es erzeugt ein Zwischenformat XDV und daraus (vom Anwender kaum bemerkt) mit dem Treiber xdvipdfmx PDF.[15] Dadurch soll PostScript im Dokumentquellcode vollständig verarbeitet werden.[16][17] Für die Verwendung von PStricks wird noch ein Paket xetex-pstricks angeboten.

3D-Daten

Beispiel für eine 3D-PDF-Datei

3D-PDF-Dokumente sind PDF-Dokumente, die entweder ein U3D-Flächenmodell oder ein BREP/Flächenmodell PRC[18] enthalten. Sie dienen vorwiegend der Visualisierung von CAD-Daten, kommen aber auch zunehmend in wissenschaftlichen Veröffentlichungen zur Anwendung.[19]

Der kostenlose Adobe Reader kann ab der Version 8.1 beide Formate anzeigen, animieren, schneiden und messen. Mit Acrobat 3D V7 ließen sich 3D-Daten aus 40 CAD-Formaten in 3D-PDF-Dateien konvertieren; jedoch hat 2010 Adobe Entwicklung, Vertrieb und Support der 3D-PDF-Konverter-Technologie an Tech Soft 3D[20] und die PROSTEP AG[21] übergeben. Ab Acrobat X[22] ist die Konvertierung nur noch als kostenpflichtiges 3D-PDF-Converter-Plugin[23] des Unternehmens Tetra 4D verfügbar.

Einige CAD-Programmen wie Allplan oder SolidWorks[24] haben einen 3D-PDF-Export; Allplan bietet auch einen 3D-PDF-Import.[25] Auch Werkzeuge wie Deep Exploration von SAP,[26] Pages3D von QuadriSpace[27] und 3DVIA Composer von Dassault Systèmes[28] können 3D-CAD-Modelle als 3D-PDF abspeichern.

Neben den 3D-Daten als Visualisierung können auch andere relevanten Informationen zu einem CAD-Modell in ein PDF eingefügt werden. So können beispielsweise für die Herstellung eines Blechteils[29] die Daten des fertigen Modells als 3D-Visualisierung gezeigt werden.

Videoformate

Kombination von SWF und 3D Daten in einer 3D PDF

Ab Acrobat 9 lassen sich diverse in Shockwave Flash (SWF) konvertierte Videoformate in Adobe PDF einbetten. Dadurch können Videos, Animationen und Anwendungen auf vielen Plattformen genutzt werden. Aufgrund der Adobe-Flash-Unterstützung in Adobe Reader ab Version 9 ist kein zusätzlicher Player für die Wiedergabe erforderlich. Seit dem letzten Patch von Adobe Acrobat und Adobe Reader 9 hat Adobe bei 3D PDF das Standardverhalten geändert, unter anderem wurde der Flashplayer aus Adobe Acrobat 9 und Adobe Reader 9 entfernt – Flashinhalte greifen auf den Flashplayer im Betriebssystem zu. Adobe Acrobat X und Adobe Reader X sind nicht betroffen, da dort fast keine Angriffe erfolgen. 3D-Daten, SWF-Funktionen und SWF-Videoformate können auch kombiniert werden; so ist es möglich, Teilflächen des Modells mit SWF-Videos und Funktionen zu belegen.

Dateien aus Büroanwendungen

Viele aktuelle Programmpakete wie Apple iWork, Microsoft Office, LibreOffice, OpenOffice.org und Softmaker Office bieten einen PDF-Export an.

Versionen von PDF

Jahr PDF-Version Adobe-Version Charakteristika
1993 1.0/PDF 1 optisch attraktive Textdarstellung, Einbettung von Lesezeichen und dateiinternen Querverweisen, Reader heißt Carousel
1994 1.1 2 externe Querverweise, Einbettung von Multimedia-Dateien in mittlerweile obsoleten Sound- und Video-Formaten, Dokumente können durchsucht werden, 40-Bit-Verschlüsselung
1996 1.2 3 Möglichkeit der Verwendung des CMYK-Farbmodells, direktes Öffnen im Browserfenster durch Implementierung von Browser-Erweiterungen (sog. PlugIns), Zugänglichkeits-Plugin für Blinde für den Acrobat Reader 3, interaktive Elemente wie Checkboxen und Radiobuttons sind möglich
1999 1.3 4 Unterstützung asiatischer Schriften, verbessertes Accessibility Plugin für den Acrobat Reader, weiterhin 40-Bit-Verschlüsselung, digitale Signaturen, JavaScript-Elemente möglich
2001 1.4 5 Wegfall des Zugänglichkeits-Plugin, dafür Unterstützung von MSAA (Microsoft Active Accessibility) durch den Acrobat Reader, RC4-Verschlüsselung mit 40–128 Bit, Beschreibung des logischen Dokumentaufbaus mit Tags
2003 1.5 6 Einbettung von Bildern im Format JPEG 2000, Filmen im Format MPEG und Audiodateien im Format MP3 möglich, Public Key-Verschlüsselung PKCS; Leseprogramm heißt ab jetzt Adobe Reader, keine Unterstützung mehr für DOS-basierte Windows-Versionen (Windows 95, 98, ME)
2004 1.6 7 Unterstützung für das Universal-3D-Dateiformat, Einbettung von OpenType-Fonts, Unterstützung für XFA 2.2 Rich-Text-Elemente und Attribute, AES-Verschlüsselung, PKCS#7-Verschlüsselung mit SHA256, DSA bis zu 4096 Bit, unzugängliche PDF-Dokumente können mit Tags versehen werden, bessere Unterstützung für mehrspaltige Dokumente, Formularfelder können mit Hilfe der Sprachausgabefunktionen vorgelesen werden, PDF-Creator mit Ausgabehilfeassistent: unterstützt beim Optimieren für Screenreader und Bildschirmvergrößerungsprogramme
2006 1.7 8 weitere Verbesserung der 3D-Darstellungsoptionen, stärkere Verschlüsselungsalgorithmen (PKCS#7 mit SHA384, SHA512 und RIPEMD-160, 256-Bit AES)
2008 1.7 9 weitere Verbesserung
2010 1.7 X weitere Verbesserung
2012 1.7 XI weitere Verbesserung
2017 2.0 DC Unterstützung für das PRC-Dateiformat, 3D-Messwerkzeuge, verbesserte Sicherheitsfunktionen[30]

Normen und Standards

In verschiedenen Gremien der ISO werden seit dem Jahr 1997 Normen auf der Grundlage von PDF erarbeitet und verabschiedet. Dabei werden, basierend auf bestimmten PDF-Versionen, Mindestanforderungen sowie Einschränkungen definiert. Adobe Systems hat in diesem Zusammenhang den betreffenden Gremien der ISO das Recht übertragen, die jeweils nötigen Spezifikationen zeitlich unbegrenzt zum Herunterladen bereitzustellen.

Diese Normen entsprechen in grober Näherung als Basis den unterschiedlichen Versionen von PDF:

ISO Jahr Typ Version Bezeichnung / Bemerkung
15930 2001 PDF/X 1.3 Format für die Übermittlung von Druckvorlagen
15930-1 2001 PDF/X-1a 1.3 siehe PDF/X
15930-5 2003 PDF/X-2 1.4 siehe PDF/X
15930-4 2003 PDF/X-1a 1.4 siehe PDF/X
15930-3 2002 PDF/X-3 1.3 siehe PDF/X
15930-6 2003 PDF/X-3 1.4 siehe PDF/X
15930-7 2008 PDF/X-4 1.6 siehe PDF/X
15930-8 2008 PDF/X-5 1.6 siehe PDF/X
19005-1 2005 PDF/A-1 1.4 Format für die elektronische Archivierung
19005-1 2007 PDF/A-1 1.4 Korrektur PDF/A-1
19005-2 2011 PDF/A-2 1.7 siehe PDF/A-1
19005-3 2012 PDF/A-3 1.7 siehe PDF/A-1
24517 2008 PDF/E 1.6 Format für technische Dokumente aus den Bereichen Ingenieurwesen, Architektur und Geo-Informationssysteme (PDF Engineering)
2008 PDF/H Format für Dokumente im Gesundheitswesen (PDF Healthcare)
14289 2008 PDF/UA 1.7 Richtlinien zum Aufbau eines barrierefreien Dokuments im Format PDF (Universal Accessability)
16612-2 2010 PDF/VT 1.6 Format für den Einsatz im hochvolumigen und Transaktionsdruck (PDF Variable and Transactional Printing)
32000-1 2008 PDF 1.7 1.7
32000-2 2017 PDF 2.0 2.0 [31]

Literatur

  • Philipp Mayr: Das Dateiformat PDF im Web – eine statistische Erhebung. In: NFD – Nachrichten für Dokumentation. Jg. 53, 2002, S. 475–481.
  • Thomas Merz, Olaf Drümmer: Die PostScript- & PDF-Bibel. 2. Auflage. Kopublikation PDFlib GmbH/dpunkt Verlag, 2002, ISBN 3-935320-01-9.
    Die PostScript- & PDF-Bibel (Memento vom 2. März 2013 im Internet Archive) von PDFLib
  • Betsy A. Fanning: Technology Watch Report, Preserving the Data Explosion: Using PDF (PDF; 136 kB), Digital Preservation Coalition, April 2008.
  • Ralf Benzmüller, Karsten Tellmann: PDF: Potentially Dangerous Files, Angriffs- und Abwehrmechanismen bei PDF-Dateien. <kes>, Nr. 1, Februar 2010, S. 61–65; ähnlich bei security-zone.info (PDF; 3,1 MB).
  • Hans Peter Schneeberger: PDF in der Druckvorstufe 1. Auflage. Rheinwerk Verlag, 2014, ISBN 978-3-8362-1750-7.

Weblinks

 Commons: Portable Document Format – Sammlung von Bildern, Videos und Audiodateien
Wiktionary: PDF – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr: PDF Reference, fifth Edition, Section 1.5 Intellectual Property. (PDF, 8,1 MB) (Nicht mehr online verfügbar.) Adobe Systems Incorporated, November 2004, S. 7, archiviert vom Original am 16. Juni 2015; abgerufen am 3. November 2010 (english).
  2. Wiki von Ubuntuusers.de – Artikel PDF
  3. ghostscript.com (Memento vom 13. September 2015 im Internet Archive)
  4. Comprehensive TeX Archive Network: Paket hyperref, abgerufen am 2. Januar 2018.
  5. PDF Reference (Sixth Edition, version 1.7) – 5.5.1 Standard Type 1 Fonts (Memento vom 6. Juli 2015 im Internet Archive) (PDF, 31 MB, 1.310 S.)
  6. netzwelt.de
  7. giga.de
  8. Stefan Mintert: invitation.xml – Transform a single source XML file to several output formats. In: Website der Linkwerk GmbH. Abgerufen am 3. November 2010 (english).
  9. HTMLDOC Open Source Home Page. (Nicht mehr online verfügbar.) Michael R Sweet, 16. Januar 2017, archiviert vom Original am 21. Februar 2016; abgerufen am 16. Januar 2017 (english).
  10. wkhtmltopdf. Open Source Project, abgerufen am 30. Dezember 2011 (english).
  11. Webkit Open Source Projekt. Open Source Project, abgerufen am 30. Dezember 2011 (english).
  12. Website als PDF mit Inhaltsverzeichnis. Innovate Webdoc Services, abgerufen am 30. Dezember 2011.
  13. ps2pdf: PostScript-to-PDF converter auf ghostscript.com
  14. PStricks-Seite über PDF-Export unter tug.org.
  15. xetex auf CTAN.
  16. Am höchsten bewertete Antwort von Herbert Voß zu Frage 8413 auf tex.stackexchange.com.
  17. Antwort von „egreg“ (Enrico Gregorio) zu Frage 19966 auf tex.stackexchange.com.
  18. PRC Format Specification (Memento vom 2. Dezember 2008 im Internet Archive) bei Adobe
  19. Axel Newe: Enriching scientific publications with interactive 3D PDF: an integrated toolbox for creating ready-to-publish figures. In: PeerJ Computer Science. Band 2, 20. Juni 2016, ISSN 2376-5992, doi:10.7717/peerj-cs.64 (peerj.com [abgerufen am 28. Juni 2016]).
  20. Acrobat Pro Bundle (Memento vom 11. Mai 2012 im Internet Archive) bei Tech Soft 3D
  21. PDF Generator 3D der PROSTEP AG
  22. Acrobat X Pro bei Adobe
  23. 3D PDF Converter-Plug-in bei Tetra 4D
  24. DassaultSystemes Solidworks: official help-documentation. Abgerufen am 27. Juni 2019 (english).
  25. allplan.com: Datenaustauschformate
  26. Deep Exploration (Memento vom 7. September 2012 im Webarchiv archive.today) von Right Hemisphere, seit 2012 SAP
  27. Pages3D bei QuadriSpace
  28. 3DVIA Composer (Memento vom 25. Mai 2013 im Webarchiv archive.today) bei Dassault Systèmes
  29. 3D-PDF Beispiel bei UNITEC Informationssysteme
  30. Taking Documents to the Next Level with PDF 2.0. Adobe, abgerufen am 11. September 2017 (english).
  31. ISO 32000-2:2017. ISO Org, abgerufen am 11. September 2017 (english).