Separate-File Indexing

Definition und Abgrenzung

Separate-File Indexing (SFI) ist die Aufnahme und Sammlung der registerrelevanten Begriffe in einer vom Layout (von der „Quelle des Registers“) getrennt gehaltenen Datei.

Das Gegenteil von SFI ist das Embedded Indexing, bei dem die registerrelevanten Begriffe als sog. Indexmarken in den Layouttext eingebettet werden. Beim Embedded Indexing sind demnach Quelle (Inhalt) und Register in ein und derselben Datei.

Im Grunde wurde jahrhundertelang – seit es Register gibt – immer analog zum SFI gearbeitet: Denn der Umbruch und das System der Register-Karteikarten waren vollständig voneinander getrennt. Erst durch moderne Textverarbeitungs- und Layoutprogramme und vor allem durch das Einbinden der Autoren in den technischen Prozess der Buchentstehung ist Embedded Indexing möglich geworden. Heute kommen beim SFI natürlich keine Karteikarten mehr zum Einsatz, sondern alles geschieht digital.

Das Kennzeichen des SFI ist die separate Datei, in der das Register entsteht. Da nichts eingebettet wird, also keine Indexmarken vorhanden sind, muss der gesamte Inhalt, also alle Begriffe und Seitenzahlen, eingegeben oder aus der Zwischenablage eingefügt werden. Man sagt auch: Der Index wird geschrieben, und der Indexer ist der Autor des Index.

Formate/Programme

Für das SFI werden keine speziellen Programme benötigt. Prinzipiell können Textformate wie .txt (etwa Notepad), .doc oder .docx (Word), .odt (Open Office, Libre Office), Layoutformate wie .indd (InDesign) und .fm (FrameMaker), Tabellenkalkulationsformate wie .xlsx und Datenbankformate wie .fp12 (Filemaker) oder .accdb (Access) zur Erstellung einer separaten Index-Datei verwendet werden. Am komfortabelsten geschieht SFI mit Dedicated Indexing Software, zu der die Programme Cindex (.ucdx) und Sky (.sk7) zählen.

Dedicated-Indexing-Programme können nichts anders als Indexe zu erzeugen. Das aber können sie besonders gut, da in ihnen viele hilfreiche Funktionen eingebaut sind, die Unterstützung bei der Sortierung, Bearbeitung, Formatierung und Ausgabe eines Registers bieten. SFI mit einem solchen Programm kann für sich stehen: Alles was zum Indexing nötig ist, kann mit Dedicated-Indexing-Programmen erledigt werden. Daher spricht man hier auch vom Stand-Alone-Indexing.

Im Unterschied dazu kommen die anderen Formate nicht alleine zurecht: Um mit ihnen SFI machen zu können, sind immer zusätzliche Aktivitäten nötig:

  • Eine Konvertierung in ein weiteres Format (z. B. von .docx nach .xlsx oder umgekehrt).
  • Das Erstellen von Makros (in Word) oder Skripts (in In Design), mit denen Indexing-Funktionalität in die Programme hineingebracht wird, die von Hause aus nicht in ihnen vorhanden ist. (Die kommerziell erhältlichen Indexing-Add-Ins für Word, InDesign und FrameMaker sind beim SFI mit diesen Programmen nur bedingt hilfreich, da sie speziell zur Unterstützung des Embedded Indexing entwickelt worden sind.)
  • Unter Umständen müssen viele Schritte manuell vorgenommen werden, weil man sich als Register-Autor nicht mit Konvertierung und Programmierung auskennt.

SFI mit Textverarbeitungs- und Layoutprogrammen

Manchmal werden Personen – Autoren, Herausgeber, freie Lektoren – gebeten, Register zu erstellen und in digitaler Form abzuliefern, die technisch nur rudimentär ausgestattet sind: Das einzige Programm, das sie beherrschen, ist ein Textverarbeitungsprogramm. Und es kann hinzukommen, dass aus bestimmten Gründen kein Embedded Indexing angewendet werden soll, etwa weil der Text nicht in digitaler Form vorliegt oder weil lediglich eine Aktualisierung eines Index aus der Vorauflage vorgenommen werden soll. Die Indexing-Arbeit kann dann darin bestehen, einen Text durchzugehen, registerrelevante Begriffe zu identifizieren und in eine neue Liste oder in den alten Index einzubauen, die sich in einer vom Text getrennt gehaltenen Word-Datei befinden. Mit anderen Worten: In Word wird SFI betrieben.

Ein solches Sammeln von Registerbegriffen ist in gewisser Hinsicht der manuellen Arbeit mit Registerkarten ähnlich, denn das Sortieren oder besser: Einsortieren muss im Wesentlichen von Hand geschehen. Im Unterschied zum Karteikartenverfahren kann aber im Word-Register immerhin gesucht werden, sodass man relativ schnell an der Stelle ist, an der ein Begriff eingebaut werden soll. Das heißt: SFI mit Word ist auf jeden Fall besser, als mit Karteikarten zu arbeiten. Das Erzeugen eines Indexeintrags geschieht durch Eintippen von Begriff (evtl. neben dem Haupt- auch Unterbegriff oder sogar  Unterunterbegriff) und Seitenzahl. Die gesamte Formatierung von Texthervorhebungen bis zu  Einrückungen und/oder Spiegelstrichen muss der Ersteller des Registers, der Register-Autor, selbst vornehmen, und zwar bei jedem einzelnen Registereintrag, darüber hinaus muss er die Entscheidung fällen, ob ein kompletter neuer Eintrag zu erstellen ist oder evtl. nur bei einem bestehenden Eintrag Seitenzahlen zu ergänzen sind.

So entsteht nach und nach das gesamte Register. Da es sich bereits in einer Word-Datei befindet, kann es direkt an ein Layoutprogramm übergeben werden. Auch daran zeigt sich der immense Vorteil gegenüber dem Karteikartenverfahren: Es fallen keine Erfassungsarbeiten im technischen Betrieb (beim Setzer, Layouter) mehr an.

Mit einem anderen Szenario haben Setzer oder Layouter aber selbst heute nicht selten zu tun: Sie bekommen die von Autoren, Herausgebern oder Lektoren vorgenommenen Registeranstriche auf Papier und erfassen die Begriffe in ein InDesign- oder FrameMaker-Dokument, das zunächst separat vom eigentlichen Textinhalt gehalten wird. Zum Schluss wird die Index-Datei mit der Buchfunktion des Layoutprogramms mit den Inhaltsdateien (meist kapitelweise) zu einer Einheit verbunden. Das Erfassen in einem separaten Dokument ist wesentlich kostengünstiger, als die Begriffe in die einzelnen Layoutdateien einzubetten; hinzu kommt, dass Korrekturen in der separaten Indexdatei wesentlich schneller (und wieder kostengünstiger) auszuführen sind als in den Indexeintragsfenstern der Embedded-Indexing-Methode. Das, was Autoren, Herausgebern oder Lektoren einerseits und Setzer oder Layouter andererseits damit machen, ist aus technischer Sicht nichts anders als SFI!

Der aus meiner Sicht größte Nachteil dieser Verfahren besteht darin, dass Textverarbeitungs- und Layoutprogramme kaum Hilfen zur Bearbeitung von Registern bieten. Vom Suchen und Ersetzen abgesehen, muss im Grunde alles, was an Bearbeitung anfällt, von Hand ausgeführt werden. Das betrifft insbesondere das Finden von Inkonsistenzen – ein Vorgang, der komplett auf Papier geschieht: Das Register wird ausgedruckt und Korrektur gelesen, die Korrekturen werden anschließend in die Datei übertragen. Üblicherweise wird diese Art der Bearbeitung und Korrektur erst in einer späten Phase des Indexing-Projekts vorgenommen, sodass hohe Kosten etwa durch die Übertragung der Korrekturen in das Layoutprogramm entstehen können. Eine gewisse technische Unterstützung im Indexing-Prozess ist nur durch das Erstellen von Word-Makros oder Skripts in den Layoutprogrammen zu erreichen, wozu einige Setzer und Layouter in der Lage sind, Autoren und freie Lektoren in der Regel aber nicht.

Beim  Einsatz von Tabellenkalkulations-, Datenbank- und Dedicated-Indexing-Programmen dagegen können Bearbeitung und Korrekturausführung vor der Übernahme ins Layoutprogramm geschehen. Zur Bearbeitung, insbesondere zum Finden von Inkonsistenzen, lassen sich in diesen Programmen darüber hinaus Selektionsfunktionen nutzen, mit deren Hilfe in kürzerer Zeit deutlich bessere Indexe erzeugt werden können.

SFI mit Excel und mit Datenbankprogrammen

Excel ist ein Tabellenkalkulationsprogramm, seine wesentlichen Merkmale stecken bereits in der Programmbezeichnung:

  • Tabelle und
  • Kalkulieren.

Beide Aspekte lassen sich beim Indexieren ausnutzen.

Will man Excel zum Sammeln von Indexbegriffen verwenden, muss man zunächst umdenken, was die Struktur eines Indexeintrags angeht. Anders als beim oben beschriebenen SFI mit Textverarbeitungs- oder Layoutprogrammen sollte man in Excel bei jedem Eintrag die vollständige Information mitführen. Das heißt, jeder Eintrag bildet eine Zeile der Excel-Tabelle, wobei im ersten Feld der Hauptbegriff steht, im Feld daneben der Untereintrag, daneben der Unteruntereintrag (falls es einen gibt) und daneben schließlich die Seitenzahl. Wenn man eine weitere Fundstelle im Text hat, an der ein bereits vorhandener Begriff erneut auftritt, wird in Excel wieder eine komplette Zeile mit Hauptbegriff, Unterbegriff, Unterunterbegriff und Seitenzahl erzeugt. Im Grunde führt jede Fundstelle zu einem kompletten Eintrag in der Excel-Tabelle. Man verwendet damit Excel wie eine Datenbank, denn Datenbanken zeichnen sich genau dadurch aus, dass in jedem Datensatz die vollständige Information enthalten ist. Nur wenn man so verfährt, kann man in Excel z. B. auf einfache Weise sortieren. Der entscheidende Vorteil von Excel oder Datenbankprogrammen ist, das man mit ihnen Selektionen vornehmen kann. Excel bietet mit den sog. Filtern eine sehr einfach zu handhabende Selektionsfunktion, darüber hinaus lassen sich auch komplexe Selektionen ohne Mühe zusammenstellen. Damit lässt sich der Fokus der Bearbeitung auf Untermengen des Gesamtregisters setzen, was zu einer immensen Qualitätssteigerung gegenüber Embedded Indexing oder SFI per Word/Layoutprogrammen führt. Die Kalkulationsmöglichkeiten von Excel lassen sich nutzen, um z. B. per Textformeln Inkonsistenzen im Register zu finden.

Da sich Autoren, Herausgeber und freie Lektoren heutzutage einigermaßen mit Excel auskennen, können sie das Programm grundsätzlich nach einer kleinen Einweisung zum Indexing einsetzen. Ein gewisses Problem ist die Ausgabe des Index, insbesondere das Zusammenführen von Seitenzahlen bei Einträgen, die mehrere Fundstellen aufweisen. Am einfachsten gelöst werden kann das Problem, indem man den Index als Tabelle in Word einbaut, dann manuell die Seitenzahlen herumhebt und nicht mehr benötigte Zeilen löscht. Ebenfalls manuell zu erledigen wäre das Ersetzen von mehrfach vorhanden Haupteinträgen durch Spiegelstriche. Zum Schluss wird die Tabelle in Text umgewandelt und nicht benötigte Tabulatoren werden per Suchen/Ersetzen gelöscht bzw. in Leerzeichen umgewandelt. Das Verfahren bietet gegenüber SFI mit Word den großen Vorteil, dass sowohl das Sortieren wesentlich vereinfacht wird als auch die Bearbeitung des Index komplett erledigt werden kann, bevor die Daten ausgegeben werden.

Datenbankprogramme wie FileMaker bieten dieselben Möglichkeiten wie Excel, lassen sich aber noch viel stärker eigenen Bedürfnissen anpassen und erhöhen damit den Komfort des SFI.

Wird etwas Programmieraufwand betrieben, kann auch die Ausgabe des Index aus Excel und Datenbankprogrammen automatisiert werden. Üblicherweise kommen dann txt- oder RTF-Dateien heraus, die in Word oder einem Layoutprogramm lediglich in die endgültige Form zu bringen sind.

Professionelle Indexer, die sich evtl. auch ein wenig im Programmieren auskennen, können mit Excel oder Datenbankprogrammen sehr gute Ergebnisse erzielen. Ein großer Vorteil gegenüber allen anderen Verfahren (selbst gegenüber Dedicated Indexing Software) ist die große Flexibilität. So lassen sich zum Beispiel Merkmale mitführen, auf deren Basis unterschiedliche Typen von Registern (Sach-, Personen-, Ortsregister usw.) ausgegeben werden können, es ist möglich, simultan unterschiedliche Locatorangaben (neben Seitenzahlen z.B. Locators, die sich aus Kapitel- oder Absatznummern ergeben) zu verwalten, und es können Register mehrer Titel z.B. verlagsübergreifend zu einem Gesamtregister zusammengeführt werden. Weitere Szenarien sind denkbar.

SFI mit Dedicated Indexing Software

Dedicated-Indexing-Programme wie Cindex oder Sky stellen, wie gesagt, alle Funktionen zur Verfügung, die beim Indexing benötigt werden. Mit ihnen kann erfasst, bearbeitet, sortiert, selektiert und formatiert ausgegeben werden. Meist wird am Ende eine RTF-Datei erzeugt, die zwecks Publikation in ein Textverarbeitungs- oder Layoutprogramm eingeladen werden kann. Es sind dann lediglich einige Anpassungen bei den Format- oder Stilvorlagen vorzunehmen, und das Register ist fertig.

Professionelle Indexer arbeiten üblicherweise mit Dedicated Indexing Software. Spezielle Technik- oder Programmierkenntnisse sind nicht nötig.

Besondere Methoden des Indexing

Neben den beschriebenen Verfahren gibt es noch weitere Methoden, von denen hier zwei vorgestellt werden sollen.

PDF-Indexing

Eine Mischung aus Embedded Indexing, SFI und dem klassischen Anstreichverfahren stellt das Indexing auf Basis von PDF-Dateien dar. Es ist tatsächlich möglich, in PDFs mit den dort vorhandenen Kommentarmöglichkeiten Begriffe anzustreichen und die angestrichenen Begriffe als Liste zu extrahieren (im .txt-Format). Eine solche Liste kann dann nach Excel überführt und dort weiterbearbeitet werden. Schließlich kann das Register aus Excel exportiert und in Word eingeladen werden. Von hier aus lässt es sich direkt publizieren oder es wird zur Publikation an ein Layoutprogramm übergeben. Im Unterschied zum Anstreichen auf Papier bietet die Kommentarfunktion von PDF-Programmen einfache Bearbeitungsmöglichkeiten, darüber hinaus steht in PDFs eine ausgezeichnete Funktion zur Volltextsuche zur Verfügung.

Hybrid-Verfahren

Eine weitere Variante stellen Verfahren dar, bei denen der Inhalt eines Dokuments (im Word- oder InDesign-Format) in ein spezielles Programm wie Index-Manager eingeladen wird. Innerhalb des separat arbeitenden Programms wird der Index erfasst und bearbeitet. Die Besonderheit besteht darin, dass einerseits fast alle Komfort-Funktionen von Stand-Alone-Programmen zur Verfügung stehen, andrerseits beim Bearbeiten automatisch alle Einträge in den Dokumentinhalt eingebettet werden. Zum Schluss wird der komplette Inhalt inklusive der eingebetteten Indexmarken wieder zurück nach Word oder InDesign gespielt. Die formatierte Ausgabe des Registers geschieht mit den Mitteln von Word und InDesign.

Schreibe einen Kommentar

*