Hallo,
wie Marco ja schon geschrieben hat und wie einige auch bereits vorher wußten, habe ich vor einiger Zeit testweise "Asterix der Gallier" abgetippt, um festzustellen, ob ein solches Vorhaben durchführbar ist und wo die praktischen Schwierigkeiten liegen.
Zunächst ein paar Punkte, von denen ich als Zielvorgabe ausgegangen bin und die ich im Grunde auch für die künftige Tätigkeit voraussetzen möchte:
- Erfaßt werden, wie bei der Comic-Volltextsuche bei jedem Eintrag Filmnummer, Sprecher, Fundstelle und Text
- Bei der Film-Volltextsuche können nicht Seite und Bildnummer angegeben werden. Zum Auffinden der Filmstelle muß die Laufzeit auf der DVD angegeben werden. Und zwar möglichst
sekundengenau!
- Maßgeblich muß dabei der Anfang des jeweiligen Textes sein bzw. der Zeitpunkt, in dem ein geschriebener Text erstmals ins Bild kommt.
- Erfaßt werden alle gesprochenen Texte, alle geschriebenen Texte (außer Vor- und Abspann) und alle gesungenen Texte, wenn sie von Filmfiguren gesungen werden und nicht "aus dem Off". (Der Titelsong "Asterix ist da" aus "Sieg über Cäsar" wäre also nicht zu übernehmen, Obelix' Gesang "Ging Gang Gooley" in "Asterix in Amerika" aber schon).
Nun ein paar Worte zu den Schwierigkeiten, die sich dabei stellen und den Punkten, auf die man achten sollte:
- Es erweist sich als nicht immer einfach, gleichzeitig alle nötigen Informationen (Sprecher, exakte Zeit bei Textbeginn) auf einmal zu erfassen. Es wird also dazu kommen, daß fast jeder Text mindestens 2x hinterienander gehört werden muß, bei vielen Texten auch mehr. Häufiges Vor und Zurückspulen wird nicht ausbleiben, sondern die Regel sein.
- Ich habe mit PowerDVD gearbeitet. Es hat sich erwiesen, daß im Zuge des Spulens die Zeitangaben um bis zu +/- 2 Sekunden variierten. Das scheint leider nicht vermeidlich zu sein. Die Zeitangaben können also nur eine ungefähre Angabe darstellen. Im Zweifel sollte der
frühere Einsatzzeitpunkt erfaßt werden. Denn man soll ja den Text auf jedenfall auch hören, wenn man der Volltextsuche folgend an die angegebene Stelle springt.
- Schwierigkeiten treten auf, wenn schnell gesprochen, genuschelt oder während lauter Musik gesprochen wird oder wenn sich die Sprecher ins Wort fallen und parallel sprechen. Wenn man etwas nicht verstehen kann, ist sehr hilfreich, sich die Szene
mit verringerter Laufgeschwindigkeit anzuhören. Die Stimmen klingen dann seltsam, aber man kann den Text teilweise deutlich besser verstehen.
- Trotzdem wird es nicht ausbleiben, daß einzelne Stellen vielfach angehört werden müssen. Ich habe manche Stellen bestimmt um die 20 Mal hintereinander gehört.
- Es kann sein, daß mal ein Wort wirklich nicht verständlich bleibt oder zwischen 2 Alternativen nicht klar ist, welches Wort gesprochen wurde. Hier
kann manchmal der Sinnzusammenhang eine Hilfe sein. Im Zweifel ist aber natürlich das zu erfassen, was gesprochen wurde, nicht, was sinnvollerweise hätte gesprochen werden sollen.
- Wenn eine Textstelle wirklich nicht verständlich ist, bietet es sich an, hier im Forum um Hilfe von anderen zu Fragen. Diese Möglichkeit hatte ich nicht, aber 4 Ohren hören vieleicht mehr, als zwei.
- Wenn auch das nichts hilft, bleibt nichts übrig, als die Stelle entweder mit einem Auslassungszeichen zu versehen oder das Verstehbare möglichst silbengetru wiederzugeben.
- Man neigt leicht dazu, "äh"s und ähnliche Unterbrechungen zu vernachlässigen. Das sollte nicht passieren, da eine genaue Textwidergabe angezeigt ist und diese dazugehören.
- Manche Personen stottern, was schwer wiederzugeben ist. Die gestotterten Silben sollten dann aus Auffindbarkeits gründen mit Bindestrichen mit dem nachfolgenden ganzen Wort verbunden werden. Läßt man die Bindestriche nämlich weg, würde hinterher das ganze Wort nicht mehr gefunden. (Bsp: "Die Ga-Ga-Gallier" anstatt "Die Gagagallier")
- Man muß gut aufpassen, um neben den Texten und der Zeitanzeige auch eventuelle Texte im Bild zu beachten. Diese sollen ja auch wiedergegeben werden.
- Bei dem Abtippen sollte man sich immer bewußt sein, daß eine Fehlerkorrektir später - anders als bei der Comic-Volltextsuche - kaum mehr erfolgen kann. Rechtsschreibfehler können verbessert werden, Ungenauigkeiten in der Angabe von Stellen oder im Wortlaut werden aber kaum noch jemandem auffallen. Daher sollte man von Anfang an mit größtmöglicher Gewissenhaftigkeit und Genauigkeit arbeiten.

Nun noch einige Vorschläge zur Standardisierung der Texte. Es wäre gut, wenn größtmögliche Homogenität der Texte erreicht werden könnte.
- Wo immer möglich sollten Texte wortlautgetreu widergegeben werden.
- Laute sollten - anders als bei der Comic-Volltextsuche - nicht wiedergegeben werden, also kein Schnarchen, Tiergeräusche oder ähnliches.
- Zwischenstufen sind Gelächter, Schreie, Jubel, allgemeines Gezeter. Diese können zum Textverständnis wichtig sein und sollten der Vollständigkeit halber nicht gänzlich ausgelassen werden. Eine silbengetreue Erfassung ist hier aber nur ausnahmsweise möglich.
- In solchen Fällen sollten diese angedeutet werden, unter möglichst genauer Angabe des allgemeinen Klanges und der Länge des Lachens, Jubelns, etc. (also z.B. Hahahahahahaha Hehehehehe Hohohohohuhuhuhuhihihihihi!). Die genaue Ausgestaltung muß Ermessenssache bleiben.
- Wenn Sprecher aber Sätze mit "mh", ähr", "öh" o.ä. beginnen oder unterbrechen, sollte das dem Text mit vorangestellt werden, um exakt zu bleiben und den richtigen Eindruck vom Text zu vermitteln.
- Manchmal ziehen Sprecher Worte sehr lang, wenn sie schreien oder rufen (z.B. Asterix nach miraculix in "Gallier"). Dies sollte nur durch die Zahl der Ausrufungszeichen (eins, zwei oder drei) verdeutlicht werden, aber
nicht durch Vervielfachung von Vokalen (also "Miraculix!!!" statt "Miraaaculiiix"). Denn die Worte sollen ja über die Suche gefunden werden und ein Suchender wird nur die Grundform eingeben, nicht die Abwandlung mit mehreren Vokalen.
- Ein neuer Text sollte immer beginnen, wenn entweder ein neuer Sprecher das Wort ergreift, ein Szenenwechsel stattfindet oder eine deutliche Zäsur zwischen zwei Textblöcken desselben Sprechers liegt.
- Wenn sich Sprecher gegenseitig unterbrechen, sollte dann ein neuer Eintrag erstellt werden, wenn sich der erste Sprecher unterbrechen läßt. Spricht er weiter, sollte sein Text hingegen ein Eintrag bleiben. Der Text desjenigen, der zu unterbrechen versucht, muß dann ein weiterer, der nach dem Eintrag des ersten Sprechers (aber vor dessen Ende) beginnt, sein.
- Bei geschriebenen Texten (z.B. Gasthausschilder, Standarten) sollten diese erst wieder in einer neuen Szene erneut aufgenommen werden, wobei eine neue Szene hierbei nicht zu voreilig angenommen werden sollte. Nicht jede Bildwechsel stellt eine solche dar.
- Jeder Sprecher sollte mit seinem vollen Namen (ggf. Vor und Zunamen) benannt werden, nicht jedoch mit Deck- oder Tarnnamen, die nur zeitweilig geetragen werden.
- Namen sollten dem Wortlaut nach vergeben werden, wobei bei römischen Namen "k" in der Regel durch "c" zu ersetzen ist. Im Zweifel sollte allerdings auf eine bereits bestehende Benennung in der Comedix-Datenbank zurückgegriffen werden. Abweichungen sollten mit Marco abgeklärt werden, damit innerhalb von Comedix.de keine Uneinheitlichkeiten bzw. Widersprüchlichkeiten auftreten.
So, und nun hoffe ich auf rege Beteiligung und darauf, daß sich durch diese kleine "Einführung" niemand abgeschreckt fühlt. Anfangs fällt das Abtippen von Texten etwas schwer, wenn man sich erstmal hineingefunden hat, geht es aber ganz gut. Also nur keine Scheu.

Die Vorschläge zur Standardisierung können wir natürlich noch diskutieren, die geben ja nur meine Meinung wieder.
Gruß
Erik