PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren)

Video ansehen

Kurzfassung? Sehen Sie das Video. Für den vollen Kontext: Artikel lesen.

Video-Seite öffnen →

Viele Organisationen haben Hunderte (oder Tausende) PDFs auf ihrer Website, die nicht den Anforderungen von PDF/UA (ISO 14289) entsprechen. Das klingt nach einem technischen Detail, betrifft in der Praxis aber unmittelbar gesetzliche Anforderungen an Barrierefreiheit – und die Nutzbarkeit Ihrer Informationen für alle (Screenreader, Tastaturnavigation, Wiederverwendung von Text). In diesem Beitrag erfahren Sie:

was PDF/UA genau ist und warum bestehende PDFs häufig scheitern,
wie europäische Vorgaben zur digitalen Barrierefreiheit auf PDFs wirken,
und wie Elk Solutions das automatisiert löst: analysieren → klassifizieren → rekonstruieren → regenerieren → mit veraPDF validieren.

1) Warum Ihre aktuellen PDFs oft „nicht barrierefrei“ sind

Ein PDF kann visuell perfekt aussehen und dennoch nicht barrierefrei sein. Typische Ursachen:

Keine Tags (Tagged PDF) → Screenreader erkennen nicht, was Überschriften, Absätze, Listen und Tabellen sind.
Falsche Lesereihenfolge → mehrspaltige Layouts, Textboxen, Fußnoten, Kopf-/Fußzeilen geraten durcheinander.
Bilder ohne Alternativtext → wichtige Informationen fehlen für assistive Technologien.
Tabellen ohne Header/Scope → Beziehungen zwischen Zeilen-/Spaltenüberschriften und Zellen sind unklar.
Unzuverlässige Textextraktion → Fonts/Encodings haben kein korrektes Unicode-Mapping.
Dokumentsprache fehlt → Screenreader können nicht korrekt zwischen Sprachen wechseln.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 1

2) Ist das in Europa eine gesetzliche Pflicht?

Europa schreibt in der Regel nicht „PDF/UA“ als verpflichtendes Dateiformat vor, wohl aber die Barrierefreiheit digitaler Informationen.

Öffentlicher Sektor: Web Accessibility Directive (EU 2016/2102)

Für Websites und Apps von öffentlichen Stellen gilt eine Barrierefreiheitspflicht (einschließlich der veröffentlichten Dokumente). Die Richtlinie verweist für die technische Umsetzung auf einen europäischen Standard: EN 301 549.
Quellen: Richtlinie (EU) 2016/2102 und EN 301 549.

Breiter (abhängig vom Anwendungsbereich): European Accessibility Act (EU 2019/882)

Der European Accessibility Act erweitert Barrierefreiheitsanforderungen auf eine Reihe von Produkten und Dienstleistungen (mit nationaler Umsetzung) und gilt ab 28. Juni 2025.

https://eur-lex.europa.eu/eli/dir/2019/882/oj/eng

Praktische Konsequenz: Wenn Sie PDFs als Teil Ihrer digitalen Dienstleistungen oder Ihrer öffentlichen Informationsbereitstellung veröffentlichen, sollten Sie davon ausgehen, dass sie barrierefrei sein müssen. PDF/UA ist die am häufigsten genutzte Norm, um „barrierefreies PDF“ konkret zu machen, weil sie exakt definiert, was ein PDF für assistive Technologien benötigt.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 2

3) Was ist PDF/UA genau?

PDF/UA (Universal Accessibility) ist die ISO-Norm ISO 14289-1 für barrierefreie PDFs.

Ziel ist, dass ein PDF:

semantisch ist (Überschriften, Absätze, Listen, Tabellen, Abbildungen),
Navigation unterstützt (Lesereihenfolge, ggf. Lesezeichen),
Text zuverlässig extrahierbar ist (Unicode-Mapping),
und die richtigen „Accessibility Hooks“ enthält (z. B. Alternativtexte, Dokumentsprache, Tabellenüberschriften).

Nützliche Einstiegsquellen:

ISO 14289-1:2014: https://www.iso.org/standard/64599.html
PDF Association Überblick: https://pdfa.org/resource/iso-14289-pdfua/

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 3

4) Warum eine schnelle „Konvertierung“ oft nicht funktioniert

Viele Tools versprechen „Make accessible“ oder „Auto-tag“. In der Praxis scheitert das häufig, weil:

das Quell-PDF keine Semantik enthält (das Tool muss raten),
Tabellen/Spalten/Fußzeilen falsch interpretiert werden,
und „Tags, die technisch existieren“ noch nicht bedeuten, dass der Inhalt logisch korrekt ist.

Darum ist unser Ansatz anders: Wir rekonstruieren das Dokument explizit auf Basis eines Inhaltsmodells pro Dokumenttyp.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 4

5) Die automatisierte Lösung von Elk Solutions

Unsere Pipeline ist für Skalierung gebaut: Hunderte bis Zehntausende PDFs – meist mit einer begrenzten Anzahl an Vorlagen („Dokumenttypen“), aber sehr hohen Stückzahlen.

Schritt 1 — Analyse: Was steckt wirklich in diesem PDF?

Wir starten mit einer technischen und semantischen Analyse, z. B.:

gibt es eine Textebene (ja/nein),
sind Tags/Strukturbaum vorhanden (ja/nein und Qualität),
Lesereihenfolge und Artifacts (Kopf-/Fußzeilen),
Fonts/Encodings und Risiken beim Unicode-Mapping,
Erkennung von Tabellen/Abbildungen,
Dokumenteigenschaften (Titel, Sprache),
und ein erster veraPDF-Precheck für PDF/UA (wo scheitert es?).

Output: ein Diagnosebericht pro Dokument + eine konsolidierte Übersicht.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 5

Schritt 2 — Klassifizierung: Aufteilen in Dokumenttypen

Auf großen Websites wiederholt sich vieles: dieselbe Vorlage (Beschluss, Formular, Broschüre) erscheint hunderte Male.

Wir clustern Dokumente u. a. nach:

Seitengeometrie und Rändern,
typografischem Profil (Schriftfamilien + Größen),
Kopf-/Fußzeilenmustern,
Vorhandensein von Tabellen/Listen,
erkennbaren Überschriften („Artikel“, „Anlage“, „Inhalt“),
Layoutmerkmalen (Spalten, Sidebars).

Ziel: eine kleine Anzahl Dokumenttypen, auf die wir gezielte Rekonstruktionsregeln anwenden.

Schritt 3 — Extraktion: Text, Fonts und Bilder

Pro Dokumenttyp extrahieren wir:

Text: mit Positionen, Font-IDs, Stilsignalen und (wo möglich) Unicode-Mapping.
Fonts: Einbettungsstatus und (falls nötig) Ersatzstrategie.
Bilder: Raster + Vektor, Auflösung und Kontext (Bildunterschrift/Abbildungsreferenz).

Wichtig: Wir extrahieren nicht „flach“, sondern erhalten Layout- und Semantiksignale (Spalten, Einzüge, Tabellenlinien, Listenmarker).

Schritt 4 — Logische Struktur wiederherstellen (Tagged PDF)

Das ist der Kern der Barrierefreiheit.

Wir rekonstruieren u. a.:

Überschriftenhierarchie (H1/H2/H3) anhand Typografie + Mustererkennung.
Absatzstruktur (Blöcke, Weißraum, Einzüge).
Listen (Aufzählungen/Nummerierung) mit korrekter Verschachtelung.
Tabellen (Zeilen/Spalten/Header) inkl. Header-Zuordnung und Scope.
Abbildung + Bildunterschrift-Beziehungen inkl. Alt-Text-Policy (automatisch wo möglich, sonst Workflow).
Lesereihenfolge (besonders bei mehrspaltigen/komplexen Layouts).
Sprache und Titel (Dokumentsprache und Dokumenttitel in Metadaten).

Ergebnis: ein Strukturbaum, der inhaltlich stimmt und technisch validierbar ist.

Schritt 5 — Regenerierung: Ein neues PDF erzeugen, das PDF/UA-proof ist

Statt „in-place zu patchen“ generieren wir das PDF neu – mit PDF/UA-Anforderungen als Ausgangspunkt.

Wir stellen u. a. sicher:

Korrektes Tagging + Marked-Content-Mapping.
Zuverlässiges Unicode-Mapping für Text (Suchen/Kopieren/Screenreader).
Korrekte Behandlung von Artifacts (Kopf-/Fußzeilen, Seitenzahlen wo sinnvoll).
Bilder mit Alternativtext (automatisch oder via Review-Flow).
Tabellen mit korrekten Headers und Beziehungen.
Dokumenteigenschaften: Titel, Sprache und konsistente Metadaten.

Optional: Wenn Sie zusätzlich Archivierungs-Compliance benötigen (z. B. interne Akten-/Aufbewahrungsregeln), können wir auch eine PDF/A-Variante erzeugen, die Tagging unterstützt (z. B. „-a“-Konformität in späteren PDF/A-Versionen). Wenn Ihr Hauptziel jedoch Barrierefreiheit ist, ist PDF/UA das richtige Ziel.

Schritt 6 — Validierung: Prüfung mit veraPDF (PDF/UA)

Nach der Regenerierung validieren wir automatisch mit veraPDF.

veraPDF unterstützt PDF/UA-Validierungsprofile und führt maschinenprüfbare Checks aus (bei PDF/UA sind manche Anforderungen naturgemäß „Human Check“, z. B. die Qualität von Alternativtexten).

Wir liefern:

Pass/Fail pro Dokument,
einen maschinenlesbaren Report (JSON/XML),
und einen lesbaren Bericht mit konkreten Fehlerstellen.

6) Was bringt das?

Nachweisbare Dokument-Barrierefreiheit (PDF/UA als konkrete Norm).
Deutlich geringere Sanierungskosten als manuelles Retagging.
Skalierbar: Dokumenttyp-Regeln einmal definieren → tausende Dokumente beheben.
Audit-Trail: Sie können belegen, was geprüft wurde und wie.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 6

7) Praktische Einführung in Ihrer Organisation

Typischer Ablauf:

Inventarisierung: Crawl Ihrer Website(s) oder Ingest via DAM/CMS/DMS.
Baseline: Analyse + Clustering + erste Reports.
Pilot: 2–5 Dokumenttypen Ende-zu-Ende automatisieren.
Skalierung: Batch-Verarbeitung + Monitoring neuer Uploads.
Governance: Integration in Ihren Publishing-Workflow (CI/CD, CMS-Hooks, DMS-Export).

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 7

8) FAQ

„Reicht PDF/UA für WCAG/EN 301 549?“

PDF/UA ist die PDF-spezifische Umsetzung von Barrierefreiheit. EN 301 549 referenziert Anforderungen für Dokumente, die mit WCAG in Einklang stehen. In Audits sieht man deshalb oft: EN 301 549 als Rahmen + PDF/UA als technische Norm für PDFs.

„Unterstützen Sie auch OCR für Scans?“

Ja – aber Barrierefreiheit erfordert zusätzlich Strukturerkennung (Überschriften, Tabellen, Lesereihenfolge). Das lässt sich weitgehend automatisieren, hängt aber von Scanqualität und Dokumentkomplexität ab.

„Wie gehen Sie mit Alternativtext um?“

Wir unterstützen:

automatische Alternativtexte (wo sicher und zuverlässig),
Human-in-the-loop Review für kritische Abbildungen,
und Policies pro Dokumenttyp (z. B. dekorative Bilder als Artifacts).

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 8

9) Möchten Sie wissen, wie Ihre Website abschneidet?

Wir können:

einen schnellen Scan durchführen (Stichprobe oder kompletter Bestand),
Dokumenttypen identifizieren,
und einen konkreten Plan für die Migration zu PDF/UA liefern – inklusive automatisierter Absicherung im Prozess.

Senden Sie uns eine PDF-Sammlung oder eine Sitemap, dann zeigen wir Ihnen, was möglich ist.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 9

Quellen

Directive (EU) 2016/2102 (Web Accessibility Directive)
https://eur-lex.europa.eu/eli/dir/2016/2102/oj/eng
EN 301 549 v3.2.1 (2021-03)
https://www.etsi.org/deliver/etsi_en/301500_301599/301549/03.02.01_60/en_301549v030201p.pdf
Directive (EU) 2019/882 (European Accessibility Act)
https://eur-lex.europa.eu/eli/dir/2019/882/oj/eng
ISO 14289-1:2014 (PDF/UA-1)
https://www.iso.org/standard/64599.html
PDF Association: ISO 14289 (PDF/UA)
https://pdfa.org/resource/iso-14289-pdfua/
veraPDF (PDF/A & PDF/UA validator)
https://verapdf.org/
https://docs.verapdf.org/validation/

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 10