Indexing mit Word: Buch ist erschienen

Der zweite Band der Reihe „Walters Textprofi-Bibliothek“ ist am 23. Juli 2020 erschienen.

Das Buch hat 344 Seiten und beschreibt alle interessanten Themen rund um das Indexing mit Word. Ansprechen mehr lesen

Indexing mit Word: Buchankündigung

Mit dem Titel „Indexing mit Word“ wird im Herbst 2019 (wahrscheinlich im November) der zweite Band der Reihe „Walters Textprofi-Bibliothek“ erscheinen.

Neuer voraussichtlicher Erscheinungstermin: 1. Quartal 2020.

Das Buch wird etwa 250 Seiten haben und alle interessanten Themen rund um das Indexing mit Word beschreiben. Ansprechen möchte ich damit

  • Profi-Indexer, die einen Überblick über das Indexing mit Word oder eine detaillierte Beschreibung spezifischer Abläufe und Techniken suchen,
  • Personen, die

mehr lesen

Wiley-Richtlinien zu gutem Indexing

Vorbemerkungen

Diese Richtinien sind 1:1 von der folgenden Wiley-Site übernommen worden:

https://authorservices.wiley.com/author-resources/book-authors/prepare-your-manuscript/indexing.html

Aus meiner Sicht sind es die besten Indexing-Richtlinien in kompakter Form, die zurzeit existieren. Aus diesem Grund sollen Sie hier den Lesern von Indexing-and-more zugänglich gemacht werden. Sie sind in englischer Sprache gehalten. Wer damit Probleme hat, kann z. B . den Google-Übersetzer zu Hilfe nehmen, um eine deutschsprachige (oder anderssprachige) Version zu erhalten.

How

mehr lesen

Indexingtiefe und Aufwandsbetrachtung

Definition

Die Indexingtiefe (manchmal auch kurz Indextiefe genannt) wird gemäß ISO 5127/3a-1981 definiert als

„Der Detailgrad, mit dem der Inhalt eines Buchs im Index wiedergegeben wird“.

Das ist natürlich eine sehr allgemeine Definition. Was ist der Detailgrad der Wiedergabe?

Nach NISO Z39.4 ist die Indexingtiefe

„Das Ergebnis der kombinierten Effekte von erschöpfender und genauer Wiedergabe in einem Index.“

Dabei kann „erschöpfend“ aufgefasst werden als die optimale – in der Regel große – Zahl der Einträge im Index.

Eine „genaue“ Wiedergabe des Buchinhalts im Index liegt vor, wenn

  • nur registerrelevante Begriffe ausgewählt,
  • mehr als eine Indexebene (oder Indexstufe) verwendet
  • überall wo nötig Untereinträge erzeugt und
  • da, wo hilfreich, treffende Begriffszuweisungen vorgenommen

wurden.

Nach diesen Kriterien lässt sich ein Index im Nachhinein, also wenn er veröffentlicht ist, beurteilen, und man kann ihm eine hohe, mittlere oder niedrige (oder auch eine gute, schlechte, optimale usw. ) Indexingtiefe attestieren.

Absprache zur Indexingtiefe

In der Praxis besteht das Problem, dass Indexer im Vorfeld mit Autor, Herausgeber oder Verlag über etwas reden müssen, was der Indexingtiefe gleichkommt. Wurden keine Absprachen hinsichtlich der Indexingtiefe getroffen, kann es später zu Missverständnissen hinsichtlich der Qualität und des Aufwands (sprich: der Kosten) kommen.

Der erste Punkt, der geklärt werden muss, ist die Dichte der Fundstellen, also die Zahl der Fundstellen pro Seite, genauer: pro indexierbarer Seite. Ist die Fundstellendichte klar, ergibt sich zusammen mit dem bekannten oder geplanten Umfang des Werks die Gesamtzahl der Fundstellen, also auch die Zahl der Einträge im Index und letztlich die Zahl der Druckzeilen, die der Index beanspruchen wird (also der Umfang des Index).

Der zweite wichtige Punkt ist die Gliederungs- oder Verschachtelungstiefe (synonym verwendbar) eines Index. Damit ist die Zahl der Ebenen oder Stufen (synonym verwendbar) gemeint, die eingesetzt wird. Es geht also darum, ob man nur mit Haupteinträgen oder auch mit Untereinträgen oder sogar mit Unteruntereinträgen arbeitet. Je tiefer verschachtelt wird, umso genauer kann der Inhalt an einer Fundstelle beschrieben werden, aber umso aufwändiger wird die Indexerstellung und komplexer und schwerer lesbar wird der Index. Darüber hinaus steigt der Platzbedarf des Index mit der Gliederungstiefe.

Indexierbare Seiten

Nicht alle Inhalte eines Werkes sind indexwürdig. Bei den meisten Werken ist es möglich, vollständige Seiten vom Indexieren auszuschließen. So werden z. B. die Seiten mit Literaturlisten üblicherweise nicht indexiert. Das heißt, der Indexer sollte vor Beginn der eigentlichen Arbeit die Seiten auszählen, die indexiert werden sollen, also die Zahl der indexierbaren Seiten bestimmen.

Bei „Seiten“ kann wieder etwas missverständliches gemeint sein: Manuskriptseiten, Fahnenseiten, Umbruchseiten, Druckseiten. Alle diese Seitentypen unterscheiden sich voneinander, teilweise sogar sehr stark. Welche Seiten bei der Berechnung der indexierbaren Seiten genommen werden, hängt davon ab, in welcher Phase des Werkes mit dem Indexing begonnen wird (dass letztlich die Einträge der meisten Indexe auf Druckseiten verweisen, ist ein anderes Thema).

Manuskriptseiten in heutiger Zeit sind als Seiten im jeweiligen Textverarbeitungsprogramm (Word, OpenOffice usw.) zu verstehen, also als Seiten in dem Programm, das der Autor genutzt hat (und nicht mehr als handgeschriebene Seiten). Wenn im Manuskriptstadium mit dem Indexing begonnen wird, erhält der Indexer entweder die Textverarbeitungsdateien oder daraus erzeugte PDF-Dateien (u. U. auch Ausdrucke).

Fahnenseiten im klassischen Sinn gibt es heute so gut wie nicht mehr, denn Fahnen- und Umbruchseiten eines Werkes sind meistens identisch. Unter Fahne kann man aber auch z. B. Umbruchseiten verstehen, bei denen der Text zwar schon umbrochen ist, aber für die Bilder oder Tabellen nur Platzhalter eingebaut sind. Es gibt auch Indexingprojekte, bei denen aus dem Umbruch heraus spezielle Fahnen produziert werden, auf deren Basis der Indexer arbeiten soll. Das kann z. B. sinnvoll sein, wenn Absatznummern anstelle von Seitenzahlen verwendet werden, der Umbruch aber zwei- oder mehrspaltig angelegt ist. Dann ist eine spezielle einspaltige Ausgabe (aus dem Layoutprogramm heraus), in der alle Absätze linear hintereinander angeordnet sind, für den Indexer wesentlich leichter zu verarbeiten, weil die Absatznummern besser gefunden werden können. Der einfachste Weg, um z. B. aus InDesign heraus solche „Linear-Fahnen“ zu erzeugen führt über HTML. Die InDesign-Datei wird im HTML-Format abgespeichert (dadurch werden automatisch alle Spalten, Kästen, Bilder und Tabellen linear angeordnet), und aus der HTML-Datei wird im nächsten Schritt PDF erzeugt. PDF bietet gegenüber HTML den Vorteil, dass man wie gewohnt Kommentare einbauen kann.

Umbruchseiten  werden in der Regel mit den Druckseiten identisch sein. Man kann aber zeitlich unterscheiden: Von Umbruchseiten spricht man, während das Werk im Layoutprogramm bearbeitet wird. Es können dabei mehrere Versionen entstehen. Irgendwann sind alle Korrekturen ausgeführt und die jetzt vorhandenen Umbruchseiten entsprechen den Druckseiten.

Druckseiten sind die Seiten, die gedruckt werden.

Schätzung der Fundstellendichte

Wird bereits im Manuskriptstadium mit dem Indexing begonnen, kann die Fundstellendichte nur auf die indexierbaren Manuskriptseiten (IMS) bezogen werden. Da die Zahl der Manuskriptseiten üblicherweise größer ist als die Zahl der daraus entstehenden Druckseiten (über die man zu diesem Zeitpunkt aber noch nichts weiß), muss man sehr aufpassen, dass man bei der Absprache der Fundstellendichte keinen Fehler begeht. Vergleichbare Werke, die z. B. vom Verlag zu Rate gezogen werden, sind bereits erschienen; eine Fundstellendichte, die daraus abgeleitet wird, bezieht sich also auf die Druckseiten. In solchen Fällen bleibt nichts anders übrig, als für das anstehende Werk einen Umrechnungsfaktor Manuskriptseiten–Druckseiten abzuschätzen. Die Fundstellendichte von Manuskriptseiten wird in der Regel (wesentlich) kleiner sein als die von Druckseiten.

Steigt der Indexer erst in einer späteren Phase in das Projekt ein, dürften bereits Umbruchseiten (oder daraus abgeleitete Fahnenseiten) oder Druckseiten vorliegen. Damit lässt sich dann die Fundstellendichte, also die Zahl der Fundstellen pro indexierbarer Umbruchseite (IUS) oder pro indexierbarer Druckseite (IDS) angeben.

mehr lesen

Walters 1. HT-UT-Regel: Eigenschaften und andere Beifügungen

Eine Übersicht über alle Regeln gibt der separate Beitrag „Walters Regeln zur inhaltlichen Erschließung“.

Im Folgenden wird die erste Regel zum Zusammenspiel von Hauptthema (HT) und Unterthema (UT) vorgestellt.

Eigenschaften

Als Unterthemen (UT) eignen sich immer die Eigenschaften von irgendwas. Dieses „Irgendwas“ sollte natürlich etwas sein, das überhaupt Eigenschaften haben kann, also: ein Gerät, ein Material, eine Methode usw.

Umgekehrt: Eine Eigenschaft eignet sich – von wenigen Ausnahmen abgesehen – nicht als Hauptthema (HT)!

Beispiel:

Dies ist ok:

octahedral complexes, photophysical properties 34

aber diese Variante geht nicht!:

photophysical properties, octahedral complexes 34

Auch dann, wenn es zu weiteren Stoffen/Materialien „photophysical properties“ gäbe und von daher ein Array mit dem HT „photophysical mehr lesen

Walters Regeln zur inhaltlichen Erschließung

Indexing-Regeln lassen sich zu den folgenden Punkten aufstellen:

  • Ablauf der Registererstellung (wie entsteht ein Register?)
  • inhaltliche Erschließung von Publikationen (was kommt auf welche Weise in ein Register?)
  • Editieren eines Registers (Qualitätsverbesserung eines Registers)
  • Sortierung
  • Präsentation eines Registers (Anordnung und Formatierung)

Die ersten drei Punkte sind dabei die eigentlich wichtigen, denn sie werden ausschließlich vom menschlichen Intellekt bestimmt. Die anderen beiden (Sortierung, Präsentation) sind technischer Art und hängen von den verwendeten Programmen und von evtl. vorhandenen Normen ab; sie sind daher viel leichter in den Griff zu bekommen.

Wie ein Register entsteht, was auf welche Weise aufgenommen werden soll und wie sich die Qualität verbessern lässt, sind Punkte, die viel mit Intuition, Assoziation, Wissen und Erfahrung zu tun haben und die sich daher nur schwer vermitteln lassen. Das macht aber auch ihren Reiz aus. Zum Glück lassen sich auch dazu einige Regeln angeben. Genau diese Regeln möchte ich hier vorstellen.

Die inhaltliche Erschließung umfasst alles, was mit den Punkten Thema, Unterthema, Querverweise, Double Postings usw., also dem Bilden von Einträgen und Untereinträgen, zu tun hat und geht bis in den Bereich des Editierens (dem Bearbeiten) eines Index hinein, der sich zentral mit dem Zusammenspiel von Haupt- und Untereinträgen beschäftigt. Zum Editieren kann und muss aber noch mehr gesagt werden, als ich es tue, wenn ich mich wie hier zunächst auf die inhaltliche Erschließung konzentriere. Das heißt, es wird einen separaten Beitrag mit weiteren Regeln zum Editieren geben. Die Bildung von Einträgen und Untereinträgen ist naturgemäß Teil des Ablaufs der Registererstellung, denn die Entscheidungen, die während der Registererstellung vom Indexer getroffen werden müssen, sind zum größten Teil inhaltlicher Art. Viele Aspekte zur Frage, wie ein Register entsteht, können hier nicht behandelt werden, ihnen werden später mehrere separate Beiträge gewidmet.

Die Hauptaufgabe beim Indexieren besteht darin, diejenigen Themen und Unterthemen zu finden, die eine Fundstelle im Text gebührend beschreiben. Bei der Suche nach dem Was, also nach den geeigneten Begriffen und Bezeichnungen können einige Regeln helfen. Die beiden wichtigsten Kriterien, v. a. im Bereich Naturwissenschaft/Technik,  sind

Das Konzept von Metatopics und Local Main Topics, das von Do Mi Stauber, einer amerikanischen Indexerin, stammt, ist für naturwissenschaftlich/technische Texte entscheidend für die Schaffung qualitätsvoller Indexe. Es hilft, schnell und effektiv Entscheidungen hinsichtlich des Was zu fällen. Cutter’s Rule geht schon sehr in Richtung des Wie, hilft auf seine Art aber auch, die passenden inhaltlichen Entscheidungen zu fällen. Ich empfehle daher, sich vor dem Lesen der nachfolgenden Regeln beide Kriterien anzuschauen (die Links dazu sind oben angegeben).

Darauf basierend und aufgrund langjähriger Erfahrung mit dem Indexieren naturwissenchaftlich/technischer Texte habe ich einige Regeln zur inhaltlichen Erschließung aufgestellt, die hier der Reihe nach vorgestellt werden.  Unterteilt sind sie in die beiden Bereiche

  • Bildung von Unterthemen (UT) und
  • Verhältnis von Hauptthema (HT) zu Unterthema

Entsprechend gibt es Walters UT-Regeln und Walters HT-UT-Regeln. Da kein Unterthema ohne ein zugehöriges Hauptthema gebildet werden kann, überlappen sich beide Bereiche an vielen Stellen, aber die Schwerpunkte liegen jeweils etwas anders, wenn man sich einmal ganz auf die UT konzentriert und zum Zweiten das Zusammenspiel von HT und UT näher betrachtet.

Folgende Regeln haben sich herauskristallisiert:

Walters
mehr lesen

Präpositionen und Konjunktionen bei der Bildung von Unterthemen

Präpositionen (Verhältniswörter) und Konjunktionen (Bindewörter) bei Unterthemen können hilfreich sein, um Missverständnisse zu vermeiden.

Empfehlung

Ich empfehle,

  • Präpositionen

mehr lesen

Walters 1. Unterthema(UT)-Regel: Kontextfindung und Hierarchieprinzip

Im Folgenden wird Walters 1. UT-Regel beschrieben. Eine Übersicht über alle Regeln gibt der separate Beitrag „Walters Regeln zur inhaltlichen Erschließung“.

Unterthemen (UT) können im Prinzip nach zwei Kriterien ausgewählt werden:

  1. man kann einen Kontext zum Thema suchen
  2. ein Thema kann zerlegt werden.

Siehe auch Stauber „Facing the Text“, Kapitel „Subheading Function and Types“, insbesondere S.149 ff. Dort wird ein anderes, ebenfalls sehr brauchbares System beschrieben, nach dem Unterthemen eingeteilt und ausgewählt werden können.

Das Kontext-Zerlegungs-Verfahren scheint besonders gut auf stark strukturierte Texte zu passen, wie sie in Naturwissenschaft und Technik häufig vorliegen.

Kontextfindung/integrale Vorgehensweise

Bei der Bildung eines Unterthemas – wenn wir uns über die Indexbegriffe auf einer bestimmten Seite, auf der wir uns gerade befinden, Gedanken machen – gelangen wir oft zu dem Schluss, dass es gut sei, das Hauptthema durch die Angabe des Zusammenhangs, in dem es auf dieser Seite auftritt, näher zu beschreiben. Es soll dann also kein Unterbegriff gefunden werden, sondern der Kontext! Und dieser Kontext soll zu einem Untereintrag im Register werden.

Kennzeichen der Kontextfindung ist, dass wir nach oben schauen, wir haben sozusagen einen integrativen Blick und suchen im Grunde genommen den Oberbegriff zum aktuellen Begriff. Obwohl es hierarchisch gesehen der Oberbegriff ist, fügen wir ihn einfach nur bei, um die Bedeutung des aktuellen Begriffs näher zu bestimmen.

In dem Beispiel

Aminosäuren, essenzielle 554
Aminosäuren, in Mitochondrien 617
Aminosäuren, als Neurotransmitter 207
Aminosäuren, organische Basen in 43
Aminosäuren, Peptidbindungen 50
Aminosäuren, Proteinabbau 561
Aminosäuren, Stoffwechsel 514-515
Aminosäuren, Strukturformeln 49

bildet „Aminosäuren“ das Hauptthema, und als Unterthemen gibt es sowohl Ober- als auch Unterbegriffe: Hierarchisch unterhalb von „Aminosäuren“ stehen „Strukturformeln“ und „essenzielle“. Oberbegriffe zu „Aminosäuren“ sind dagegen: „Peptidbindungen“ (Aminosäuren sind ein Teil dieser Bindungen), „als Neurotransmitter“ (es gibt auch andere Arten von Neurotransmittern), „Stoffwechsel“ (Aminosäuren haben keinen eigenen Stoffwechsel, sondern sind Teil des Stoffwechsels in Zellen) und „Proteinabbau“ (dabei fallen Aminosäuren an).

Kontextmerkmale

Wie kann ich bei einem vorliegenden Array erkennen, welches UT einen Kontext beschreibt? Antwort:

Wenn ich die Konjunktion „und“ (englisch „and“) davor oder dahinter setzen setzen kann, handelt es sich um einen Kontext.

So sind

Aminosäuren, Peptidbindungen und 50
Aminosäuren, Stoffwechsel und 514-515
Aminosäuren, Proteinabbbau und 561

durchaus sinnvolle Einträge; allerdings kann das „und“ weggelassen werden, weil die Einträge auch so nicht missverständlich sind.

Der Versuch, ein „und“ auch bei den anderen gezeigten Unterthemen einzusetzen, scheitert, denn es kommt nichts Sinnvolles dabei heraus:

Aminosäuren, Strukturformeln und 49
Aminosäuren, als Neurotransmitter und 207
Aminosäuren, essenzielle und 554

„Aminosäuren, Strukturformeln und“ hat zwar das Potenzial, einen sinnvollen Eintrag zu liefern, aber an der Fundstelle geht es nicht allgemein um Strukturformeln, zu denen Aminosäuren Beispiele liefern, sondern umgekehrt um Aminosäuren und deren zugehörigen Strukturformeln.  Allenfalls hätte man anstelle der Konjunktion „und“ die Präposition „von“ beifügen können: „Aminosäuren, Strukturformeln von“. Eine solche Beifügung drückt jedoch eine Eigenschaft, nicht einen Kontext (im hier gemeinten Sinn) aus. Ich wollte aber demonstrieren, wie Kontexte zu erkennen sind.

„Aminosäuren, als Neurotransmitter und“ ist ähnlich gelagert. Hier macht natürlich die bereits vorhandene Präposition „als“ deutlich, dass ein „und“ als Beifügung keinen Sinn ergibt. Wenn das „als“ nicht vorhanden wäre, könnte man „und“ ergänzen und erhielte einen auf den ersten Blick sinnvollen Eintrag; allerdings geht es an der Fundstelle nicht um Neurotransmitter an sich, zu denen wieder Aminosäuren nur Beispiele liefern, sondern umgekehrt um Aminosäuren in ihrer Eigenschaft als Neurotransmitter.

„Aminosäuren, essenzielle und“ ist ein sinnloser Eintrag, weil „essenzielle“ Adjektiv zum Substantiv „Aminosäuren“ ist. Ein „und“ hat hier nichts zu suchen.

Die Beispiele zeigen also in der Tat, dass Kontexte daran erkannt werden können, dass sich die Konjunktion „und“ beifügen lässt. Führt diese Beifügung zu keinem sinnvollen Eintrag, liegt kein Kontext vor, sondern eine andere Art von Beifügung. Darauf gehe ich im Beitrag „Walters 1. HT-UT-Regel: Eigenschaften und andere Beifügungen“ näher ein.

Der Fall „Aminosäuren, organische Basen in“ zeigt

ein weiteres mögliches Merkmal eines Kontextes: eine Präposition, in diesem Fall „in“, die hinter das Unterthema gesetzt wurde.

Wichtig bei Präpositionen: Ihre Stellung (vor oder hinter dem UT) entscheidet darüber, ob eine Eigenschaft oder ein Kontext vorliegt. Bei „Aminosäuren, organische Basen in“ wird ausgedrückt, dass es an der Fundstelle um organische Basen geht und hierbei um den Unterfall des Auftretens in Aminosäuren. Mit anderen Worten: Hier wird aus Sicht von „Aminosäuren“ ein Kontext beschrieben. Man hätte das „in“ durch die Konjunktion „und“ ersetzen können, ohne den Sinn wesentlich zu verändern.

Im Index gibt es sowohl noch das Double Posting „organische Basen, in Aminosäuren“ als auch andere Einträge zu „organische Basen“. Der Eintrag „organische Basen, in Aminosäuren“ im (hier nicht gezeigten) Array „organische Basen“ enthält die Präposition „in“ vor dem UT und macht deutlich, dass es sich jetzt (aus Sicht von „organische Basen“) um eine Eigenschaft handelt, nicht um einen Kontext. Genauso gelagert sind im oben gezeigten Beispiel die beiden Fälle

Aminosäuren, in Mitochondrien 617
Aminosäuren, als Neurotransmitter 207

Beide Male wird durch die vorgesetzten Präpositionen „in“ und „als“ deutlich gemacht, dass es um Eigenschaften, nicht um Kontexte geht. Nebenbei bemerkt hätte man in beiden Fällen die Präpositionen nicht hinter das UT setzen können, denn dann wären sinnlose Einträge entstanden:

Sowohl

Aminosäuren, Mitochondrien in 617

als auch

Aminosäuren, Neurotransmitter als 207

ergäben keinen Sinn.

Weiteres zu Konjunktionen und Präpositionen siehe den separaten Beitrag „

Präpositionen und
mehr lesen

Metatopic

Jede Veröffentlichung (also jedes Buch, jeder Zeitschriftenartikel, jede Online-Publikation) hat ein Hauptthema. Das ist das, worum es in der Veröffentlichung geht. In der Indexing-Fachterminologie (meiner Kenntnis nach auf Do Mi Stauber zurückgehend) spricht man vom Metatopic.

Die typischen Kennzeichen des Metatopic sind:

  • Üblicherweise steht das Metatopic im Titel der Veröffentlichung.
  • In seltenen Fällen

mehr lesen

Cutter’s Rule: Spezifität

Unter Indexern weltweit anerkannt als wichtigste Regel beim Zuteilungsindexieren (also beim Verschlagworten von Inhalten) gilt die Regel vom engsten Schlagwort, auch bekannt als Cutter’s Rule, weil Charles Cutter, ein amerikanischer Bibliothekar, als erster bereits 1876 darauf hingewiesen hat:

Beim Indexieren sollte einer Textstelle immer der jeweils engstmögliche Begriff zugewiesen werden. Wie in der mehr lesen