PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren)

Video ansehen

Kurzfassung? Sehen Sie das Video. Für den vollen Kontext: Artikel lesen.

Video-Seite öffnen →

Viele Organisationen haben Hunderte (oder Tausende) PDFs auf ihrer Website, die nicht den Anforderungen von PDF/UA (ISO 14289) entsprechen. Das klingt nach einem technischen Detail, betrifft in der Praxis aber unmittelbar gesetzliche Anforderungen an Barrierefreiheit – und die Nutzbarkeit Ihrer Informationen für alle (Screenreader, Tastaturnavigation, Wiederverwendung von Text). In diesem Beitrag erfahren Sie:

  • was PDF/UA genau ist und warum bestehende PDFs häufig scheitern,
  • wie europäische Vorgaben zur digitalen Barrierefreiheit auf PDFs wirken,
  • und wie Elk Solutions das automatisiert löst: analysieren → klassifizieren → rekonstruieren → regenerieren → mit veraPDF validieren.

1) Warum Ihre aktuellen PDFs oft „nicht barrierefrei“ sind

Ein PDF kann visuell perfekt aussehen und dennoch nicht barrierefrei sein. Typische Ursachen:

  • Keine Tags (Tagged PDF) → Screenreader erkennen nicht, was Überschriften, Absätze, Listen und Tabellen sind.
  • Falsche Lesereihenfolge → mehrspaltige Layouts, Textboxen, Fußnoten, Kopf-/Fußzeilen geraten durcheinander.
  • Bilder ohne Alternativtext → wichtige Informationen fehlen für assistive Technologien.
  • Tabellen ohne Header/Scope → Beziehungen zwischen Zeilen-/Spaltenüberschriften und Zellen sind unklar.
  • Unzuverlässige Textextraktion → Fonts/Encodings haben kein korrektes Unicode-Mapping.
  • Dokumentsprache fehlt → Screenreader können nicht korrekt zwischen Sprachen wechseln.
PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 1

2) Ist das in Europa eine gesetzliche Pflicht?

Europa schreibt in der Regel nicht „PDF/UA“ als verpflichtendes Dateiformat vor, wohl aber die Barrierefreiheit digitaler Informationen.

Öffentlicher Sektor: Web Accessibility Directive (EU 2016/2102)

Für Websites und Apps von öffentlichen Stellen gilt eine Barrierefreiheitspflicht (einschließlich der veröffentlichten Dokumente). Die Richtlinie verweist für die technische Umsetzung auf einen europäischen Standard: EN 301 549.
Quellen: Richtlinie (EU) 2016/2102 und EN 301 549.

Breiter (abhängig vom Anwendungsbereich): European Accessibility Act (EU 2019/882)

Der European Accessibility Act erweitert Barrierefreiheitsanforderungen auf eine Reihe von Produkten und Dienstleistungen (mit nationaler Umsetzung) und gilt ab 28. Juni 2025.

Praktische Konsequenz: Wenn Sie PDFs als Teil Ihrer digitalen Dienstleistungen oder Ihrer öffentlichen Informationsbereitstellung veröffentlichen, sollten Sie davon ausgehen, dass sie barrierefrei sein müssen. PDF/UA ist die am häufigsten genutzte Norm, um „barrierefreies PDF“ konkret zu machen, weil sie exakt definiert, was ein PDF für assistive Technologien benötigt.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 2

3) Was ist PDF/UA genau?

PDF/UA (Universal Accessibility) ist die ISO-Norm ISO 14289-1 für barrierefreie PDFs.

Ziel ist, dass ein PDF:

  • semantisch ist (Überschriften, Absätze, Listen, Tabellen, Abbildungen),
  • Navigation unterstützt (Lesereihenfolge, ggf. Lesezeichen),
  • Text zuverlässig extrahierbar ist (Unicode-Mapping),
  • und die richtigen „Accessibility Hooks“ enthält (z. B. Alternativtexte, Dokumentsprache, Tabellenüberschriften).

Nützliche Einstiegsquellen:

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 3

4) Warum eine schnelle „Konvertierung“ oft nicht funktioniert

Viele Tools versprechen „Make accessible“ oder „Auto-tag“. In der Praxis scheitert das häufig, weil:

  • das Quell-PDF keine Semantik enthält (das Tool muss raten),
  • Tabellen/Spalten/Fußzeilen falsch interpretiert werden,
  • und „Tags, die technisch existieren“ noch nicht bedeuten, dass der Inhalt logisch korrekt ist.

Darum ist unser Ansatz anders: Wir rekonstruieren das Dokument explizit auf Basis eines Inhaltsmodells pro Dokumenttyp.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 4

5) Die automatisierte Lösung von Elk Solutions

Unsere Pipeline ist für Skalierung gebaut: Hunderte bis Zehntausende PDFs – meist mit einer begrenzten Anzahl an Vorlagen („Dokumenttypen“), aber sehr hohen Stückzahlen.

Schritt 1 — Analyse: Was steckt wirklich in diesem PDF?

Wir starten mit einer technischen und semantischen Analyse, z. B.:

  • gibt es eine Textebene (ja/nein),
  • sind Tags/Strukturbaum vorhanden (ja/nein und Qualität),
  • Lesereihenfolge und Artifacts (Kopf-/Fußzeilen),
  • Fonts/Encodings und Risiken beim Unicode-Mapping,
  • Erkennung von Tabellen/Abbildungen,
  • Dokumenteigenschaften (Titel, Sprache),
  • und ein erster veraPDF-Precheck für PDF/UA (wo scheitert es?).

Output: ein Diagnosebericht pro Dokument + eine konsolidierte Übersicht.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 5

Schritt 2 — Klassifizierung: Aufteilen in Dokumenttypen

Auf großen Websites wiederholt sich vieles: dieselbe Vorlage (Beschluss, Formular, Broschüre) erscheint hunderte Male.

Wir clustern Dokumente u. a. nach:

  • Seitengeometrie und Rändern,
  • typografischem Profil (Schriftfamilien + Größen),
  • Kopf-/Fußzeilenmustern,
  • Vorhandensein von Tabellen/Listen,
  • erkennbaren Überschriften („Artikel“, „Anlage“, „Inhalt“),
  • Layoutmerkmalen (Spalten, Sidebars).

Ziel: eine kleine Anzahl Dokumenttypen, auf die wir gezielte Rekonstruktionsregeln anwenden.


Schritt 3 — Extraktion: Text, Fonts und Bilder

Pro Dokumenttyp extrahieren wir:

  • Text: mit Positionen, Font-IDs, Stilsignalen und (wo möglich) Unicode-Mapping.
  • Fonts: Einbettungsstatus und (falls nötig) Ersatzstrategie.
  • Bilder: Raster + Vektor, Auflösung und Kontext (Bildunterschrift/Abbildungsreferenz).

Wichtig: Wir extrahieren nicht „flach“, sondern erhalten Layout- und Semantiksignale (Spalten, Einzüge, Tabellenlinien, Listenmarker).


Schritt 4 — Logische Struktur wiederherstellen (Tagged PDF)

Das ist der Kern der Barrierefreiheit.

Wir rekonstruieren u. a.:

  • Überschriftenhierarchie (H1/H2/H3) anhand Typografie + Mustererkennung.
  • Absatzstruktur (Blöcke, Weißraum, Einzüge).
  • Listen (Aufzählungen/Nummerierung) mit korrekter Verschachtelung.
  • Tabellen (Zeilen/Spalten/Header) inkl. Header-Zuordnung und Scope.
  • Abbildung + Bildunterschrift-Beziehungen inkl. Alt-Text-Policy (automatisch wo möglich, sonst Workflow).
  • Lesereihenfolge (besonders bei mehrspaltigen/komplexen Layouts).
  • Sprache und Titel (Dokumentsprache und Dokumenttitel in Metadaten).

Ergebnis: ein Strukturbaum, der inhaltlich stimmt und technisch validierbar ist.


Schritt 5 — Regenerierung: Ein neues PDF erzeugen, das PDF/UA-proof ist

Statt „in-place zu patchen“ generieren wir das PDF neu – mit PDF/UA-Anforderungen als Ausgangspunkt.

Wir stellen u. a. sicher:

  • Korrektes Tagging + Marked-Content-Mapping.
  • Zuverlässiges Unicode-Mapping für Text (Suchen/Kopieren/Screenreader).
  • Korrekte Behandlung von Artifacts (Kopf-/Fußzeilen, Seitenzahlen wo sinnvoll).
  • Bilder mit Alternativtext (automatisch oder via Review-Flow).
  • Tabellen mit korrekten Headers und Beziehungen.
  • Dokumenteigenschaften: Titel, Sprache und konsistente Metadaten.

Optional: Wenn Sie zusätzlich Archivierungs-Compliance benötigen (z. B. interne Akten-/Aufbewahrungsregeln), können wir auch eine PDF/A-Variante erzeugen, die Tagging unterstützt (z. B. „-a“-Konformität in späteren PDF/A-Versionen). Wenn Ihr Hauptziel jedoch Barrierefreiheit ist, ist PDF/UA das richtige Ziel.


Schritt 6 — Validierung: Prüfung mit veraPDF (PDF/UA)

Nach der Regenerierung validieren wir automatisch mit veraPDF.

veraPDF unterstützt PDF/UA-Validierungsprofile und führt maschinenprüfbare Checks aus (bei PDF/UA sind manche Anforderungen naturgemäß „Human Check“, z. B. die Qualität von Alternativtexten).

Wir liefern:

  • Pass/Fail pro Dokument,
  • einen maschinenlesbaren Report (JSON/XML),
  • und einen lesbaren Bericht mit konkreten Fehlerstellen.

6) Was bringt das?

  • Nachweisbare Dokument-Barrierefreiheit (PDF/UA als konkrete Norm).
  • Deutlich geringere Sanierungskosten als manuelles Retagging.
  • Skalierbar: Dokumenttyp-Regeln einmal definieren → tausende Dokumente beheben.
  • Audit-Trail: Sie können belegen, was geprüft wurde und wie.
PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 6

7) Praktische Einführung in Ihrer Organisation

Typischer Ablauf:

  1. Inventarisierung: Crawl Ihrer Website(s) oder Ingest via DAM/CMS/DMS.
  2. Baseline: Analyse + Clustering + erste Reports.
  3. Pilot: 2–5 Dokumenttypen Ende-zu-Ende automatisieren.
  4. Skalierung: Batch-Verarbeitung + Monitoring neuer Uploads.
  5. Governance: Integration in Ihren Publishing-Workflow (CI/CD, CMS-Hooks, DMS-Export).
PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 7

8) FAQ

„Reicht PDF/UA für WCAG/EN 301 549?“

PDF/UA ist die PDF-spezifische Umsetzung von Barrierefreiheit. EN 301 549 referenziert Anforderungen für Dokumente, die mit WCAG in Einklang stehen. In Audits sieht man deshalb oft: EN 301 549 als Rahmen + PDF/UA als technische Norm für PDFs.

„Unterstützen Sie auch OCR für Scans?“

Ja – aber Barrierefreiheit erfordert zusätzlich Strukturerkennung (Überschriften, Tabellen, Lesereihenfolge). Das lässt sich weitgehend automatisieren, hängt aber von Scanqualität und Dokumentkomplexität ab.

„Wie gehen Sie mit Alternativtext um?“

Wir unterstützen:

  • automatische Alternativtexte (wo sicher und zuverlässig),
  • Human-in-the-loop Review für kritische Abbildungen,
  • und Policies pro Dokumenttyp (z. B. dekorative Bilder als Artifacts).
PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 8

9) Möchten Sie wissen, wie Ihre Website abschneidet?

Wir können:

  • einen schnellen Scan durchführen (Stichprobe oder kompletter Bestand),
  • Dokumenttypen identifizieren,
  • und einen konkreten Plan für die Migration zu PDF/UA liefern – inklusive automatisierter Absicherung im Prozess.

Senden Sie uns eine PDF-Sammlung oder eine Sitemap, dann zeigen wir Ihnen, was möglich ist.

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 9

Quellen

PDF/UA-konforme PDFs auf Ihrer Website: warum es schiefgeht (und wie Sie es automatisieren) - afbeelding 10

Möchten Sie mehr erfahren?

Kontaktieren Sie uns, um zu besprechen, was das für Ihre Organisation bedeuten könnte.

Kontakt aufnehmen