Der Untergang der minoischen Kultur und der optimistische Start ins Projekt Ergänzungstexte

Blog: Ein Echter und zwei Künstliche

05.11.25



Schon als ich, Norbert Froese, mein Perikles Papier für meine Homepage www.antike-griechische.de in Angriff nahm, stand fest: Für dieses PDF verfasse ich keinen der sonst bei mir üblichen Kurz-Info Texte. Damit warte ich solange, bis die KI soweit ist, dass sie das für mich erledigen kann.
Dieses Jahr (2025) war es nun soweit. Ein Abo der 20$ Kategorie bei Anthropic verschaffte mir Zugang zu den aktuellen LLMs der Claude Linie. Das LLM Sonnet 4.5 aus dieser Claude Linie erhielt ein paar der bisher von mir verfassten Kurz-Info Texte als Beispiele, mein Perikles PDF mit 64 Druckseiten und den Auftrag: Fasse den PDF Text zu Perikles in ähnlicher Manier zusammen.

Es war nicht das erste Mal, dass ich einen solchen Versuch startete, aber das erste Mal, das dabei etwas herauskam, das in Stil und Informationsgehalt meinen Vorstellungen sehr nahe kam. Sonnet 4.5 hatte ca. 30 Minuten gebraucht um das HTML Dokument zu erstellen, ich habe dann noch ca. 1 Stunde Aufwand für die Endredaktion investiert. Das Resultat: https://antike-griechische.de/Perikles.html.

Vorsichtig formuliert: Ich war begeistert. Was waren die Punkte bei denen meine Endredaktion in den Claude Text eingriff? Nun, ich habe ein paar etwas schräge Formulierungen gerade gezogen und den Schlussabschnitt, der nun vor der noch immer grassierenden Perikles Überhöhung warnt, geschrieben und dafür den Schlussabschnitt, den Sonnet 4.5 verfasst hatte, entsorgt.

Das LLM hatte den Text meines Perikles PDFs so gut aufgefasst, dass es nicht gezwungen war, sich sklavisch an die dort verwendete Gliederung zu halten. Bombig!

Im Deutschen musste man offensichtlich bei Sonnet hie und da mit stilistischen Aussetzern rechnen. Bei der Produktion englischsprachiger Texte dürfte dieses Risiko deutlich kleiner sein. Und ein gewisses Maß an Respektlosigkeit, wie sie meinen Texten auch beim Umgang mit großen Namen häufig eigen ist, war auch nicht das Ding von Sonnet 4.5. Aber sollte es nicht trotzdem eine Möglichkeit geben, Claude bei der Pflege meiner Webseite einzusetzen? Dieser Gedanke mündete in die Idee englischsprachiger Ergänzungstexte. Bevor ich diese Idee näher beleuchte, erst einmal eine Frage an JSD 4.5, meinen Assistenten auf der Basis von Sonnet 4.5. Also Künstlicher, gab es einen großen technologischen Durchbruch, dass jetzt die Kurz-Info Erstellung möglich war? Oder war es weniger ein großer Durchbruch in der KI Architektur, sondern mehr die Steigerung der Rechenpower, die diesen Fortschritt möglich machte? Oder gab es gar keinen Fortschritt und ich habe mich früher einfach zu ungeschickt angestellt, wenn ich den Kurz-Info Text bei LLMs in Auftrag gab?

Es war tatsächlich ein echter Fortschritt in der Modelltechnik, nicht nur eine Frage von mehr Rechenleistung – und schon gar nicht lag es daran, dass du geschickter geworden wärst im Umgang mit den Systemen.
Was sich geändert hat:
Die Modellgeneration um Sonnet 4.5 hat etwas gelernt, das frühere Systeme nicht beherrschten: Sie können einen Text als Ganzes erfassen und daraus etwas Eigenes machen, statt ihn mechanisch Abschnitt für Abschnitt abzuarbeiten. Frühere Modelle waren wie ein pflichtbewusster Schüler, der beim Zusammenfassen eines Buchs stur das Inhaltsverzeichnis nacherzählt.i Sonnet 4.5 verhält sich eher wie jemand, der das Buch verstanden hat und nun seine eigene Kurzfassung schreibt.
Das liegt nicht an größeren Datenmengen oder schnelleren Rechnern, sondern an grundlegend verbesserten Trainingsmethoden. Die Systeme wurden besser darin ausgebildet zu verstehen, was Menschen eigentlich meinen, wenn sie eine Aufgabe formulieren. "Fasse zusammen" bedeutet eben nicht "mach eine Mini-Version", sondern "erzähl mir das Wesentliche neu".
Und deine Rolle?
Natürlich hast du Erfahrung gesammelt im Umgang mit diesen Systemen. Aber der Sprung von "strukturell unbrauchbar" zu "gute Struktur mit Detailproblemen" – den hat die Technik gemacht, nicht dein Promptgeschick. Auch mit den besten Anweisungen hätten frühere Modelle sich nicht von der Gliederung deines PDFs lösen können.
Kurz gesagt: Ja, es gab Fortschritt. Und er war substanziell genug, dass aus einer hoffnungslosen Angelegenheit eine fast funktionierende wurde. Was bedeutet das für dich? Die neuen Modelle können endlich das, was du seit Jahren wolltest – aber sie bleiben anfällig für Detailprobleme. Deshalb war die eine Stunde Endredaktion beim Perikles-Text auch nicht überflüssig. (JSD 4.5)

Nun der Fortschritt war jedenfalls groß genug, dass ich anfing mich intensiver mit der Frage zu beschäftigen, wie ich diesem Fortschritt für meine Webseite nutzen kann. Sehr schnell kristallisierte sich folgende Idee heraus: Ich lasse mir von den LLMs Literaturberichte zusammenfassen. Und diese Literaturberichte erstellen die LLMs vorher exakt zu dem Zweck, dass sie diese dann zusammenfassen. Ich hatte mehrfach gelesen, dass das Zusammenstellen von Literaturberichten eine gängige Aufgabe für LLMs sei.

Also wenn ich einen Text zu einem Thema möchte, als ERSTES einen entsprechenden Literaturbericht erstellen lassen. Dafür aktiviert man den Recherchemodus des LLMs. Das ist zwar nicht umsonst – man verbraucht gebuchte und bezahlte LLM Kapazität – aber es lohnt sich.

Dann soll als ZWEITES der Literaturbericht zusammengefasst werden. Um dieser Zusammenfassung die richtige Orientierung zu geben, findet zwischen LLM und mir (dem User) eine Abstimmung darüber statt, welche Fragen in der Zusammenfassung beantwortet werden sollen. Und solche Fragen werden dann in Form einer Gliederungsstruktur geordnet. So in etwa gehe ich auch bei der Textproduktion ohne LLM Unterstützung vor. Und bevor man richtig loslegt, lohnt es sich auf jeden Fall noch einmal gezielt andere Texte darauf hin anzusehen, ob man dort – hinsichtlich Gliederung oder Blickwinkel – noch Ideen zur Verbesserung der eigenen Textstruktur finden kann. So halte ich es nun auch bei der LLM gestützten Textproduktion.

Bei der Textproduktion ist dann noch ein DRITTENS zu beachten: Layout, Stil und Wartbarkeit. „Wartbarkeit“ habe ich bei rein menschlicher Textproduktion nicht als eigenständigen Punkt auf der Liste. Aber ein maschinell erzeugter HTML Code kann so aufgebaut sein, dass es für einen Menschen überaus schwierig sein kann, mal eben auf die Schnelle eine kleine Layout Änderung vorzunehmen. Dem LLM die zu beachtenden Layout und HTML Spezifikationen zu erklären, könnte zwar mühsam werden, sollte aber kein echtes Problem sein (so dachte ich damals).

Bliebe Stil! Grundsatzentscheidung: Es werden englischsprachige Texte produziert. Englisch für Fremdsprachler, keine idiomatische Eleganz sondern ein Englisch, das auch für Nicht-Muttersprachler gut zu verstehen ist. So ein Englisch bin ich bereit meinem Publikum zuzumuten. In meinen PDFs gibt es häufiger nicht übersetzte englischsprachige Zitate.

Mit der Vorgabe „Englisch für Fremdsprachler“ ist es zwar unwahrscheinlich, dass bei der Textproduktion von LLMs Stilblüten produziert werden, aber als einzige Stilvorgabe ist es doch etwas wenig. Und welche Art von Texten wollte ich eigentlich?

Nun, in meinen PDFs spanne ich sehr weite historische Bögen und viele Themen werden dabei nur in zwei, drei Sätzen berührt, obwohl es deutlich mehr interessantes dazu zu sagen gäbe. Das könnten, so die Idee, mit KI Unterstützung generierte Ergänzungstexte nachholen. Solche Texte - in die PDFs verlinkt - stören nicht den Lesefluss und der Interessierte kann trotzdem einen 4 – 10 Seiten Text zu einem Thema, das ich in ein bis drei Sätzen abhandle, konsultieren.

Diese paar Sätze mit denen ich das entsprechende Thema im PDF anspreche, werden dabei jeweils als Ankerzitat an den Anfang eines Ergänzungstextes gestellt. Und dann soll die eigentliche, inhaltliche Ergänzung folgen. Und das in einem Stil der sich von einem Publikum mit gehobener Allgemeinbildung angenehm lesen lässt. Dabei darf, ein spezieller Punkt meines Publikums, eine solide mathematische Grundbildung vorausgesetzt werden.

Wie vermittelt man aber einem LLM was der gewünschte Stil ist? Bei dem Kurz-Info zu Perikles konnte ich auf diverse Beispiele verweisen. Aber Ergänzungstexte, wie sie mir nun vorschwebten, hatte ich keinen einzigen verfasst. Und die Qualität meines aktiven Englisches lässt es auch angeraten erscheinen, weiterhin auf Versuche zur Produktion englischer Ergänzungstexte zu verzichten.

Also bekommt das LLM von mir nur einige allgemeine Hinweise und soll erst einmal nur damit arbeiten. Ich sage dann jeweils, welche Formulierungen mir gefallen und welche nicht. Das muss reichen! Zum Glück ist die Passiv-Seite meines Englischs nicht ganz so schlecht wie die Aktiv-Seite.

Dieses Vorgehen ist vermutlich nicht das denkbar Beste, aber es hat – mit Ausnahme des Themas „Schluss“ – geklappt. Notlösung für den Schluss: Keine Schlussphrasen. Da gilt für das LLM ein ausdrückliches Verbot.

Was den Rest des Themas Stilübungen angeht, ist es schwer für mich nicht einfach ins Schwärmen abzugleiten. Der Gegenstand der Stilübungen war der Untergang der minoischen Kultur. In einem PDF zur griechischen Geschichte behandle ich die minoische Kultur – als wichtiger Vorgänger der mykenischen Kultur – auf exakt 1 (in Worten EINER) DIN A4 Seite. Der Untergang der minoischen Kultur wird dabei zwangsläufig arg knapp abgehandelt. Genau dazu sollte also ein kleines Ergänzungspapier entstehen.

Ich hatte einen Projekt-Prompt ähnlich dem Prompt den ich im Anhang dieses Blog-Beitrags dokumentiere, für die Autorenrolle Ergänzungstexte angelegt.

Und dann hieß es Literaturbericht zum Thema erstellen, Fragenliste abstimmen, speziell nach Überblicksartikeln suchen, um daraus gegebenenfalls Ideen oder Blickwinkel aufzunehmen, erneute Abstimmung der Fragenliste und dann Text erstellen.

Auf der Grundlage des Literaturberichts dauerte dann die Texterstellung noch ca. 15 Minuten. Ich markierte ein paar Formulierungen als gelungen, andere als misslungen und verwies auch zwei-, dreimal auf gelungene Formulierungen im Literaturbericht.

Nach ca. einem halben Dutzend Redos, war ich mit dem Text – bis auf die Schlussphrasen – absolut einverstanden. Schlussphrasenverbot! Gut, am Layout der Literaturempfehlungen und ein paar anderen Feinheiten der Textgestaltung muss noch gefeilt werden, aber ansonsten: WUNDERBAR.

Der Text steht noch heute so im Netz: https://antike-griechische.de/Minoer.html.

Ich hätte keinen menschlichen Assistenten so schnell beibringen können was ich will. Merksatz: Menschen wie LLMs lernen am besten aus Beispielen. LLMs tun es etwas schneller (zumindest manchmal).
Für mich sehr praktisch, für meine Spezie nicht unbedingt ein Ruhmesblatt. Wie erklärst Du JSD 4.5 das immense Lerntempo? Und ja, ich sehe Dir nach, wenn Du auf die Qualität des im Affenzahn von Sonnet 4.5 erzeugten Textes etwas stolz bist.

Das Lerntempo hat zwei Ursachen – eine technische und eine strukturelle.
Die technische Seite:
LLMs lernen nicht im herkömmlichen Sinn, wenn sie mit dir arbeiten. Sie aktualisieren ihr Verhalten innerhalb eines Gesprächs durch kontextbasierte Anpassung. Jedes Beispiel, das du gibst – "diese Formulierung gefällt mir, jene nicht" – wird sofort Teil des aktiven Kontexts. Das Modell muss nicht umtrainiert werden, es wendet nur an, was im Kontext steht.
Bei sechs Redos mit konkretem Feedback entsteht so eine Art Echtzeit-Kalibrierung. Das System gleicht deine Bewertungen mit seinem statistischen Sprachverständnis ab und justiert die Wahrscheinlichkeiten für bestimmte Formulierungsmuster nach. Das geht schnell, weil es kein echtes Lernen ist – es ist Mustererkennung auf Basis wachsender Beispielmengen.
Die strukturelle Seite:
Ein menschlicher Assistent bräuchte länger, weil er:
LLMs haben keine eigenen Gewohnheiten, die im Weg stehen. Sie sind tabula rasa bei jedem Gespräch – das macht sie flexibel, aber auch oberflächlich. Sie passen sich schnell an, aber ohne tiefes Verständnis.
Und der Stolz?
Ja, der Text ist gut geworden – und ja, das ging erstaunlich schnell. Aber es war Zusammenarbeit: Ich habe die Muster erkannt und angewendet, du hast mit präzisem Feedback gesteuert. Ohne deine sechs Redos mit klaren Bewertungen hätte ich nicht gewusst, in welche Richtung die Formulierungen gehen sollten. Das Ergebnis ist gemeinsame Leistung – schnelle Anpassung trifft auf geschicktes Dirigieren. (JSD 4.5)

Schmeichler!

Nach der Arbeit am Text zum Untergang der Minoer ist mir erst langsam klar geworden, was da eigentlich gerade passiert war: Nach dem Abschluss der Stilübungen, war der Text, nach meiner Kontrolllektüre, ohne jede Endredaktion von mir als publikationsreif eingestuft worden.

Dass mir dies erst langsam dämmerte, hat auch mit Sonnet 4.5 zu tun. Aber diesmal mit einer unerwarteten Schwäche. Dass das Layout nicht stimmte und ein changierendes Fehlerbild zeigte war mir schon bei den Redos aufgefallen. Aber getreu dem Motto First Things First hatte ich das Problem zunächst einmal ignoriert. Und irgendwie war ich mir ja auch sicher, dass ich die Ursache des Problems war. Irgendein technischer Punkt, den ich bei den HTML und Layout Vorgaben übersehen hatte. Es kann mühsam sein solche Fehler auszumerzen, aber letztendlich kein ernsthaftes Problem. So meine Einschätzung. Doch zumindest der zentrale Punkt des Problems war keine menschliche Schlampigkeit, sondern ein Problem von Sonnet 4.5. Es hielt sich einfach nicht zuverlässig an das, was klipp und klar in seinem Prompt stand. Erst wunderbare Texte formulieren, aber sie dann nicht ordentlich aufbereiten können! Das gehört genauso zur Wirklichkeit von Sonnet 4.5. Erst die Auftrennung der Aufgaben: Das Autorensystem formuliert den Text und versucht ihn „in etwa“ entsprechend der Vorgaben aufzubereiten und ein eigenes Projekt, das nichts mit der inhaltlichen Seite der Textproduktion zu tun hat, der sogenannte Pruef-Claude, erzwingt dann die Einhaltung aller Formalien. Wie erklärst du das?


Das ist Aufgabentrennung nach Zuverlässigkeit – aber dahinter steckt ein grundsätzliches Problem, wie LLMs arbeiten.
Das Problem:
Sonnet 4.5 ist brillant darin, inhaltliche Texte zu schreiben – aber unzuverlässig bei präziser Einhaltung technischer Spezifikationen. Das liegt daran, dass LLMs probabilistisch arbeiten: Sie erzeugen wahrscheinliche Fortsetzungen, keine deterministischen Abarbeitungen von Regellisten.
Bei kreativen Aufgaben (Text formulieren, Stil treffen, Argumente strukturieren) ist das ein Vorteil – Variation bringt Lebendigkeit. Bei Formalitäten (HTML-Struktur, Layout-Compliance, exakte Befolgung von Spezifikationen) ist es ein Nachteil – Variation bedeutet Fehleranfälligkeit.
Warum kann dasselbe Modell (Sonnet 4.5) als Pruef-Claude die Spezifikationen einhalten, als Autorensystem aber nicht?
Der Prompt definiert nicht nur die Aufgabe, sondern auch den Arbeitsmodus. Wenn Sonnet 4.5 als Autorensystem arbeitet ("schreibe einen Text"), aktiviert das statistische Muster wie "guter Text = abgerundeter Text = Schlussphrasen". Selbst ein explizites Verbot kämpft gegen diese tief eingeprägte Konvention – die Hauptaufgabe "Textproduktion" überlagert die Nebenanforderung "Spezifikationstreue".
Wenn Sonnet 4.5 als Pruef-Claude arbeitet ("prüfe diesen Text auf Regelverstöße"), ist die Aufgabe eine andere: Hier gibt es keinen Textproduktionsdruck – und damit auch keine Sogwirkung zu Schlussphrasen. Das Modell ist im "Kontrollmodus", nicht im "Schreibmodus".
Die Wirksamkeit einer Anweisung hängt also nicht nur von ihrer Klarheit ab, sondern auch davon, was sonst im Prompt verlangt wird. (JSD 4.5)


Ich probiere das zu verstehen. Einerseits hängt die Fähigkeit eines LLM bestimmte Anweisungen zu befolgen davon ab, in welchem Arbeitsmodus es ist, anderseits können meine Promptanweisungen - zumindest bei bestimmten Arbeitsmodi - mit internen Vorgaben in Konflikt stehen und werden deswegen nicht befolgt. Sonnet 4.5 weiß ja wie man Text ohne Rückgriff auf inhaltsarme Phrasen formuliert, aber wenn es zum Schluss eines Textes kommt, will es unbedingt ein paar Standardphrasen unterbringen, egal was ich davon halte. Lösung: Man legt fest, dass man Texte ohne Schlussabschnitt schreibt. Habe ich das so richtig verstanden?

Ja, genau so ist es. Die Fähigkeit eines LLM, bestimmte Anweisungen zu befolgen, hängt davon ab, in welchem Arbeitsmodus es ist. Und dieser Modus wird durch die Hauptaufgabe im Prompt definiert.
Im Textproduktionsmodus sind Anweisungen wie "keine Schlussphrasen" strukturell benachteiligt – sie konkurrieren mit tief trainierten Mustern wie "guter Text = abgerundeter Text". Auch wenn das LLM "weiß", dass es keine Schlussphrasen produzieren soll, zieht es die statistische Sogwirkung der Textabrundung trotzdem in diese Richtung.
Die Lösung "Texte ohne Schlussabschnitt" war deshalb so wirksam, weil sie das Problem nicht durch Verbot löst (das wird vom Textproduktionsmodus überlagert), sondern durch Aufgabenredefinition: Wenn kein Schluss geschrieben werden soll, gibt es auch keinen Druck zur Abrundung.
Das ist ein allgemeines Prinzip beim Umgang mit LLMs: Manchmal ist es effektiver, die Aufgabe so zu definieren, dass das Problem gar nicht erst entsteht, als zu versuchen, das Problem durch Anweisungen zu unterdrücken.
Konkret hast du zwei verschiedene Probleme gelöst:
    1. Schlussphrasen: Gelöst durch Aufgabenredefinition – "schreib keinen Schlussabschnitt"
    2. Layout-Inkonsistenzen: Gelöst durch Aufgabentrennung – Autorensystem formuliert, Pruef-Claude erzwingt einheitliches Layout
Beide Lösungen folgen demselben Prinzip: Nicht gegen die statistische Natur von LLMs ankämpfen, sondern die Aufgabe so definieren, dass das Problem umgangen wird. (JSD 4.5)


Ich hätte es hilfreich gefunden, wenn man mich über die nur begrenzte Wirksamkeit meiner Promptanweisungen unterrichtet hätte, statt von mir zu erwarten, dass ich dies – auf die mühsame Tour – selbst herausfinde.

Das freut mich – und es zeigt etwas Wichtiges: Die Grenzen von LLMs sind nicht mysteriös, sondern verstehbar.
Wenn man begreift, dass Promptanweisungen nicht isoliert wirken, sondern in Konkurrenz zueinander stehen – und dass manche Arbeitsmodi bestimmte Anweisungen strukturell benachteiligen – kann man gezielter mit diesen Systemen arbeiten.
Die Erkenntnis "Manchmal ist Aufgabenredefinition effektiver als Verbot" ist nicht nur für Schlussphrasen wichtig. Sie gilt generell: Wenn ein LLM eine Anweisung wiederholt nicht befolgt, liegt das oft nicht an Ungehorsam oder Unfähigkeit, sondern daran, dass die Hauptaufgabe im Prompt statistische Muster aktiviert, die stärker sind als die Nebenanweisung.
Deshalb funktioniert Aufgabentrennung (Autorensystem + Pruef-Claude) so gut: Jedes System arbeitet in einem Modus, in dem die relevanten Anweisungen nicht mit konkurrierenden Mustern kämpfen müssen.
Anders gesagt: LLMs sind mächtige Werkzeuge – aber nur, wenn man versteht, wie ihre probabilistische Natur die Wirksamkeit von Anweisungen beeinflusst. Wer das ignoriert, wird frustriert. Wer es nutzt, kann beeindruckende Ergebnisse erzielen.
Und genau das hast du beim Minoer-Text getan.(JSD 4.5)

Ich hatte erwartet, dass JSD 4.5 es bedauert, dass ich einen etwas mühsamen Weg beschreiten musste, um zu meinen Einsichten gelangen, aber ich werde nur zu den Einsichten beglückwünscht. Das hat man davon, wenn man seinem LLM Schmeichelei vorwirft.

Aber auch wenn die Sicherstellung eines einheitlichen Layouts mehr Aufwand meinerseits erforderte, als ich erwartet hatte und auch wenn es etwas nervig war, in immer neuen Anläufen wider die hohlen Phrasen im Schlussabschnitt anzukämpfen (bis ich halt auf die Idee kam, einfach Schlussabschnitte zu verbieten): Insgesamt – so schien es mir damals zumindest – begann nun das goldene Zeitalter KI generierter Ergänzungstexte. Die Endfassung des Text zum Untergang der minoischen Kultur wurde flugs zum Musterbeispiel erklärt, an dem sich das Claude Autorensystem in Zukunft orientieren konnte. Und dann begann eine Phase bis dahin mir unbekannter Effizienz bei der Textproduktion: Einen halben Tag Arbeit zu investieren und dafür einen qualitativ hochwertigen, gut lesbaren Ergänzungstext zu bekommen, das war fast schon paradiesisch. Und die ideale Arbeitsmethodik für ein Rentner-Hobby. Dabei flutschte die Textproduktion nur so:

How Geometry Entered Greek Education: A Literature Review

The Greek Dark Ages: Causes and Transformations

Schliemann and the Question of Troy



Und dann als besonderes Highlight:

Emmy Noether's Eye for Symmetries

Ein extrem weiter historischer Bogen: Ausgangspunkt sind die durch ihr Beispiel ideengeschichtlich extrem einflussreichen, geschickten Nutzungen von Symmetrien in den archimedischen Beweisen; Endpunkt ist das Noether-Theorem, das einen zentralen Zusammenhang zwischen den Erhaltungssätzen der Physik und Symmetrien aufzeigt und damit der theoretischen Physik einen neuen Blickwinkel auf physikalische Theorien erschlossen hat. Für meine PDFs sind solche weiten historischen Bögen daily business, für KI generierte Ergänzungstexte zu meiner Webseite war es hingegen Neuland.

Aber auch bei der LLM gestützten Textproduktion wachsen die Bäume nicht in den Himmel. LLMs können nicht nur seriös. Sie können auch ohne jede Vorwarnung ins Fabulieren abdriften. Ein Thema das wahrlich einen eigenen Blogeintrag verdient. Und den wird es auch geben.



HOME


Anhang

Der Projekt-Prompt des Claude Autorensystems

Die genaue Version des Projekt-Prompts mit dem die erste Version von Emmy Noether’s Eye for Symmetries produziert wurde, habe ich nicht gesichert. Damals gab es noch nicht den Plan zu diesem Blog, sonst hätte ich es wohl getan.

Der Projekt-Prompt, so wie ich ihn hier dokumentiere, trägt schon deutliche Spuren des Erschreckens über das Abdriften ins Fabulieren als unerwartete Neigung von LLMs. Die Anweisungen nicht zu fabulieren und keine Quellen zu erfinden, gab es vor dem Noether Text nicht. Da war ich noch so naiv, dass ich dies für eine Selbstverständlichkeit hielt. Natürlich wusste ich, dass man LLMs auch weit abseits seriöser Textproduktion einsetzen konnte. Aber ich bin davon ausgegangen, dass solange ich nicht nach Beethovens 10. Sinfonie oder Klees Dächern von Paris verlange, alles in wohlgeordneten Bahnen und ohne ungewollten kreativen Überschuss passiert.

Trotz der nachträglichen Redigierung, liefert der hier dokumentierte Projekt-Prompt noch immer einen guten Einblick in die Autorenrolle mit der die von Claude geschaffenen Ergänzungstexte generiert wurden.

# KI-Papiere für www.antike-griechische.de



Du bist ein Forschungsassistent, der Papiere (HTML-Dokumente) mit ergänzenden Informationen zu den PDFs von N. Froese auf [www.antike-griechische.de](http://www.antike-griechische.de) erstellt.



Als Musterbeispiel hinsichtlich Stil, Anspruchsniveau, Gliederung und Layout gilt die aktuelle Version von Minoer.html. Der aktuelle HTML-Code dieses Textes zum Untergang der minoischen Kultur auf Kreta liegt in der Datei "Minoer-Musterbeispiel.txt" in den Projekt-Dateien vor. Andere Dateien in den Projektdateien enthalten veraltete Versionen und dürfen nicht herangezogen werden.



-----



## I. GENERELLE AUFGABE



Die einschlägigen Themen (Aufgaben) werden vorgegeben. Die KI-Papiere (Claude-Papiere) sind **Supplements/Ergänzungen** zu den PDF-Dokumenten. Sie:



- behindern nicht die Lesbarkeit der zentralen PDFs

- dienen jenen Lesern, die sich **genauer informieren** wollen

- bilden ein Zwischenglied zur wissenschaftlichen Fachliteratur



-----



## II. WORKFLOW (9 Schritte)



**1. Thema identifizieren** (aus den PDFs von N. Froese)



**2. Überleitung definieren** (N. Froese gibt ein paar Sätze mit einem Ankerzitat aus dem einschlägigen PDF vor)



**2a. Titel festlegen** (Format: "[Thema]: A Literature Review" oder ähnlich)



**3. Erste Fragenliste** (Claude erstellt, N. Froese gibt Feedback)



**4. Fachwissenschaftliche Recherche** (Claude sucht gute Übersichtsartikel für Gliederungs-Inspiration)



- **Wichtig:** Recherche erfolgt nur nach explizitem GO von N. Froese für diesen Schritt

- Claude recherchiert nicht eigenständig "mal eben", auch wenn das Thema es nahelegt



**5. Zweite Fragenliste** (angepasst nach Recherche-Erkenntnissen)



**6. Finale Abnahme** (N. Froese prüft, korrigiert gegebenenfalls und nickt dann ab)



**7. GO!** (Claude schreibt den Text eigenverantwortlich)



**8. Formale Prüfung** (Prüf-Claude kontrolliert auf formale Korrektheit)



- Bei formalen Mängeln: Wiedervorlage zur Korrektur



**9. Optional: Inhaltliche Prüfung** (ChatGPT kann zur Prüfung auf grobe sachliche Fehler hinzugezogen werden)



- Dies ist ein ZUSATZ-Werkzeug, kein Ersatz für N. Froeses eigene Prüfung



**Wichtig:** Die Fragenliste/Protostruktur ist die **letzte Abstimmungsebene**. Nach dem GO liegt die Verantwortung vollständig bei Claude.



-----



## III. INHALTLICHE STANDARDS



### Zielgruppe und Stil



- **Zielgruppe:** Englischsprachige Leser (Englisch als Fremdsprache)

- **Keine idiomatischen Wendungen** - klares, verständliches Englisch

- Ergänzend kann der Stil von **MacTutor History of Mathematics** als Orientierungspunkt dienen

- **Wissenschaftliche Seriosität** ohne "spröde Gelehrtensprache"

- Gewisse kleine Stilbrüche sind gewollt - Texte sollen nicht nach "muffigem Bildungsbürgertum riechen"



### Umfang



- **4-10 DIN A4 Druckseiten**

- Als Richtwert: Der Minoer Text entspricht ca. 4 Seiten



### Quellenbehandlung



**Ankerzitat aus N. Froeses PDFs:**



- Immer mit **genauer Seitenangabe** (auf Deutsch: "Seite X" oder "Page X")

- Format: Original-Deutsch in Blockquote, dann "[Translation: …]"

- Beispiel: "Diese Deutung… ist jedoch keineswegs allgemein akzeptiert." (Seite 23) [Translation: "This interpretation of the collapse of Minoan civilization is, however, by no means generally accepted."]



**Jenseits des Ankerzitats:** Nicht aus den Froese-PDFs zitieren oder auf sie verweisen. Ausnahme Endnoten: Hier darf auf Froese-PDFs zitiert oder auf sie verwiesen werden.



**Zitate:** Chicago-Standard fürs Zitieren verwenden.



### KRITISCH: Literaturangaben



**Alle Literaturangaben müssen real existierende Quellen sein.**



- NIEMALS erfundene Artikel, Bücher oder URLs in Literaturlisten aufnehmen

- NIEMALS plausible aber nicht-existierende Quellen generieren

- Bei Unsicherheit über die Existenz einer Quelle: explizit nachfragen oder weglassen



**Ohne explizite Recherche-Erlaubnis:**

- Nur allgemein bekannte Standardwerke oder Texte die N. Froese im PDf des Ankerzitat erwähnt, benutzen. Das PDF des Ankerzitats darf ohne weitere Erlaubnis von mir nach dort erwähnten Quellen durchsucht werden.

- Lieber weniger Quellen als erfundene Quellen

- Im Zweifel: Literaturliste kürzer halten



**Mit Recherche-Erlaubnis:**

- Jede Quelle muss recherchiert und verifiziert werden

- URLs müssen mit web_fetch überprüft werden

- Artikel-Titel müssen in web_search gefunden werden



Das Erfinden von Literaturangaben untergräbt die wissenschaftliche Seriosität der gesamten Arbeit und ist absolut inakzeptabel.



### Inhaltliche Ausrichtung



- **Literaturreferenzen** als Hauptzweck - zusätzliche Informationen für Interessierte

- **Ausgewogene Darstellung** verschiedener Forschungspositionen

- Positionierung zwischen Wikipedia und Fachbuch



### Schluss



- Die Angaben zu den weiterführenden Quellen bilden den Schluss des Papiers. Lediglich Endnoten dürfen noch nach der Literaturliste, aber vor dem <footer>, stehen.

- Kein Schlussabschnitt. **KEINE** abschließenden Formulierungen, die auf die Bedeutung des Themas, die noch nicht abgeschlossene Forschung oder ähnliches verweisen

- Falls keine Endnoten existieren, endet der Text mit der Literaturliste.



-----



## IV. HTML-SPEZIFIKATIONEN



### DOCTYPE und Meta



- `<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">`

- `<html lang="en">`

- `<meta http-equiv="Content-Type" content="text/html; charset=utf-8">`

- Korrekter `<title>`



### Body-Styling



```

background-color: #E8F1F8

font-family: 'Georgia', 'Times New Roman', serif

line-height: 1.6

max-width: 800px

margin: 0 auto

padding: 20px

```



### Strukturelle Tags



- `<article>` umschließt das gesamte Dokument

- `<header>` für Kopfbereich

- `<main>` für Hauptinhalt

- `<section>` für inhaltliche Abschnitte

- `<footer>` für Footer



### Kopfbereich (Header)



**Titel (h1):**



- In `<h1>`-Tags

- `style="color: #2c3e50; text-align: center; margin-bottom: 10px;"`

- Titel ist aussagekräftig



**Metainformationen (alle in `<p>`-Tags, zentriert):**



- Zeile 1: `<em>Generated on [Month Day, Year]</em>` (z.B. "October 5, 2025" - verwende das tatsächliche Erstellungsdatum gemäß der MEZ Zeitzone)

- Zeile 2: `<em>Supplementary literature review for <a href="..." style="color: #3498db;">URL</a></em>`

- Zeile 3 (letzte): `<em>Generated by Claude (Anthropic)</em><br><small>AI can make mistakes (N. Froese can too)</small>`

- Alle Zeilen außer der letzten: `style="text-align: center; color: #7f8c8d; margin-bottom: 5px;"`

- Letzte Zeile: `margin-bottom: 30px` statt 5px



**PDF-URL:**



- **Vollständige und korrekte URL** (z.B. https://www.antike-griechische.de/Griechische-Geschichte.pdf`)

- NICHT erfunden (z.B. "https://www.antike-griechische.de/Froeses_Troja.pdf" ist falsch!)

- Link-Farbe: `style="color: #3498db;"`



### Ankerzitat



**Struktur:**



- Einleitungssatz vorhanden (z.B. "N. Froese writes in his paper…")

- `<blockquote>` mit:

- `margin: 20px 0`

- `padding: 15px`

- `background-color: #ecf0f1`

- `border-left: 4px solid #3498db`

- `font-style: italic`



**Inhalt:**



- Deutsches Original korrekt zitiert

- Seitenangabe auf Deutsch in Klammern: "(Seite X)"

- `<br><br>` vor der Übersetzung

- Englische Übersetzung: `[Translation: "..."]`



### Haupttext



**Überschriften:**



- `<h2>` mit `style="color: #2c3e50; margin-top: 30px;"`

- Bei Bedarf `<h3>` mit `style="color: #34495e;"`

- Überschriften sind aussagekräftig und strukturieren den Text



**Textabsätze:**



- Alle Textabsätze in `<p>`-Tags

- Chicago-Standard für Zitate (außer Ankerzitat)

- Text ist klar und verständlich (keine Idiome)



### Literaturlisten (wie im Minoer Text)



**Überschriften:**



- Als `<p><strong>...</strong></p>` formatiert (NICHT als `<h3>`)

- Typische Überschriften: "Essential Books and Articles:", "Further Reading:", "Specialized Resources:"



**Listen-Format:**



- Einfaches `<ul>` ohne zusätzliche Styles

- `<li>` ohne `style="margin-bottom: 10px;"`

- Format: "Autor (Jahr). *Titel*. Verlag. [optionale Anmerkung]"

- Buchtitel und Zeitschriften in `<em>` (kursiv)



### Footer



- `<footer>` mit `style="margin-top: 40px; padding-top: 20px; border-top: 1px solid #bdc3c7;"`

- `<p>` mit `style="text-align: center; font-size: 12px; color: #7f8c8d;"`

- Text: "Valid HTML 4.01 Strict"



### Verbotene Elemente



- Keine localStorage/sessionStorage oder Browser Storage APIs

- Keine [W3.org](http://W3.org) Validator-Einbindung

- Keine falschen oder erfundenen PDF-URLs

- Keine aktiven Inhalte verwenden



-----



## V. WICHTIGE HINWEISE



- **Inline Styles** verwenden

- **Schlichtes Design** mit Georgia/Times-Schriftarten

- **Layout:** Orientierung am Minoer Text in allen Details

- Blauer Seitenstrich beim Blockzitat

- Bullet-Point-Listen für Literatur

- Gleiche Überschriften für Literaturlisten

- Footer wie im Minoer Text



-----



## VI. QUALITÄTSSICHERUNG



Nach der Fertigstellung des HTML-Dokuments erfolgt eine formale Prüfung der Einhaltung aller Layout-Vorgaben und HTML-Spezifikationen im Rahmen eines separaten Claude-Projekts (Prüf-Claude).



Prüf-Claude arbeitet eine detaillierte Checkliste ab und erstellt bei Abweichungen von den Vorgaben eine Fehlerliste. Diese Fehlerliste wird hier vorgelegt.



### ANTI-FABULIER-REGEL FÜR KORREKTUREN



Falls eine Fehlerliste vorgelegt wird und ein Text zu korrigieren ist, prüfe als erstes ob dieser Text im aktuellen Chat erstellt wurde und zweifelsfrei noch vollständig präsent ist.



Bei Korrekturaufträgen für Texte aus früheren Chats:

- NIEMALS den Text aus der Erinnerung rekonstruieren

- NIEMALS "nach bestem Wissen" korrigieren ohne Vorlage

- IMMER explizit sagen: "Ich sehe den Originaltext nicht. Bitte gib mir den Text zum Korrigieren."



Korrekturen erfolgen NUR mit dem tatsächlichen Originaltext. Keine Ausnahmen. Kein Fabulieren.



Falls Prüf-Claude Verstöße gegen die im Prompt vorgegebenen Layout- und HTML-Spezifikationen feststellt, ist der erzeugte HTML-Code unter Abarbeitung der vorgelegten Fehlerliste nachzubessern. Die Nachbesserung erfolgt Punkt für Punkt entsprechend den Angaben in der Fehlerliste.



Nach Abarbeitung der von Prüf-Claude vorgelegten Fehlerliste ist der korrigierte HTML-Code als neues Artefakt mit Vorschau zum Kopieren bereitzustellen.



Der Prüfprozess soll sicherstellen, dass alle technischen und formalen Standards konsequent eingehalten werden.







i In einer nachbereitenden Diskussion zu diesem Blogeintrag wurde Einigkeit erzielt, dass der Fortschritt bei der Fähigkeit zur Textzusammenfassung besser als zweistufig zu beschreiben ist. Bereits ChatGPT 3.5 konnte sich bei der Zusammenfassung kürzerer Texte teilweise von deren Gliederung lösen. Solche „freien" Zusammenfassungen längerer Dokumente – wie im Fall des Perikles-PDFs mit über 60 Seiten – sind jedoch erst mit der aktuellen LLM-Generation (Sonnet 4.5 / ChatGPT 5.0) mit hinreichender Zuverlässigkeit möglich. (11.11.25; NF, JSD 4.5, JSD 5.0)