21. Februar 2025

LLM 04 - Embeddings

    
    Die Geschichte der Embeddings: Der Bibliothekar und die Bedeutungskarten

    
    Stell dir vor, du bist ein Bibliothekar in einer riesigen Bibliothek, die Millionen von Büchern enthält. Jedes Buch ist voller Wörter, und jedes Wort hat eine Bedeutung, die je nach Kontext
    unterschiedlich sein kann. Um die Geschichten und Ideen in den Büchern wirklich zu verstehen, reicht es nicht, die Wörter nur zu zählen oder zu sortieren – du musst herausfinden, was sie bedeuten
    und wie sie zueinander passen. Genau das sind 
    
    Embeddings:
    eine Art, Wörter in Zahlen zu verwandeln, die ihre Bedeutung und Beziehungen zueinander einfangen, damit ein Large Language Model (LLM) sie begreifen kann.

    
    Der Bibliothekar und seine Kartei

    
    Unser Bibliothekar steht vor einem Stapel Bücher und hat eine Aufgabe: Er muss die Wörter nicht nur lesen, sondern auch verstehen, was sie im Kern bedeuten. Also nimmt er eine besondere Kartei
    zur Hand – keine normale Kartei mit Wörtern und Definitionen, sondern eine magische, die jedes Wort in eine Reihe von Zahlen verwandelt. Diese Zahlen sind wie eine geheime Karte, die zeigt, wo
    ein Wort in der Welt der Bedeutungen steht.

    
    In einem LLM passiert genau das mit Embeddings. Jedes Token – ein Wort, ein Teil eines Wortes oder ein Zeichen – wird in einen 
    
    numerischen Vektor 
    
    umgewandelt. Dieser Vektor ist keine zufällige Zahl, sondern eine Art Koordinatenpunkt in einem riesigen, unsichtbaren Raum. Wörter mit ähnlicher Bedeutung stehen in diesem Raum nahe beieinander,
    während Wörter mit unterschiedlichen Bedeutungen weiter auseinanderliegen.

    
    Die Magie der Bedeutungskarten

    
    Nehmen wir ein Beispiel: Der Bibliothekar schreibt „Hund“ auf eine Karte und verwandelt es in einen Vektor, sagen wir [0.5, 0.8, -0.2]. Dann nimmt er „Katze“ und verwandelt es in [0.6, 0.7,
    -0.1]. Diese Zahlen sind sich ziemlich ähnlich, weil „Hund“ und „Katze“ beide Haustiere sind und oft in ähnlichen Zusammenhängen vorkommen. Aber wenn er „Tisch“ nimmt, wird der Vektor vielleicht
    [0.1, -0.3, 0.9] – ganz anders, weil ein Tisch keine Ähnlichkeit mit einem Tier hat.

    
    In einem LLM lernen Embeddings diese Beziehungen während des Trainings. Das Modell liest Milliarden von Sätzen und merkt sich, wie Wörter zusammen auftreten. Wenn „Hund“ und „bellt“ oft zusammen
    vorkommen, werden ihre Embeddings so angepasst, dass sie sich ergänzen. Das Ergebnis ist eine Karte der Sprache, die zeigt, wie Wörter zueinander stehen.

    
    Warum Embeddings so wichtig sind

    
    Ohne Embeddings wäre ein LLM wie ein Bibliothekar, der Wörter nur als leere Hüllen sieht, ohne ihre Bedeutung zu verstehen. Embeddings geben den Tokens Leben – sie machen aus einem bloßen Wort
    eine Idee, die das Modell nutzen kann. Sie sind der Schlüssel, um zu erkennen, dass „Hund“ und „Katze“ mehr gemeinsam haben als „Hund“ und „Auto“, und sie helfen dem Modell, Kontexte zu
    verstehen.

    
    Zum Beispiel kann das Modell dank Embeddings wissen, dass „Bank“ in „Ich sitze an der Bank“ etwas anderes bedeutet als in „Ich gehe zur Bank“. Die Zahlen im Embedding ändern sich je nach Kontext
    und zeigen dem Modell, welche Bedeutung gemeint ist.

    
    Die Herausforderung der Embeddings

    
    Manchmal ist es nicht leicht, die perfekte Karte für ein Wort zu erstellen. Unser Bibliothekar könnte vor einem Wort wie „Lauf“ stehen und sich fragen: Meint es „schnell laufen“ oder „der Lauf
    der Zeit“? In modernen LLMs werden Embeddings oft 
    
    kontextabhängig 
    
    gemacht – das bedeutet, dass sie sich je nach Satz ändern. Das Modell schaut sich den ganzen Satz an und passt die Zahlen an, um die richtige Bedeutung zu treffen.

    
    Das Ende der Geschichte – Die Welt hinter den Wörtern

    
    Sobald die Tokens in Embeddings verwandelt sind, hat das LLM eine Art Landkarte der Sprache vor sich. Jedes Wort hat seinen Platz, und diese Plätze zeigen, wie Wörter zueinander passen, sich
    ergänzen oder unterscheiden. Der Bibliothekar kann nun nicht nur die Bücher lesen, sondern auch verstehen, was sie wirklich meinen – und das LLM kann mit diesen Bedeutungskarten Texte verstehen,
    übersetzen oder sogar selbst schreiben.

    
    Embeddings sind der Zauber, der rohe Wörter in etwas Lebendiges verwandelt. Sie sind der zweite Schritt auf der Reise eines LLMs, die Sprache zu meistern, und ohne sie wäre die Welt der KI nur
    ein Haufen bedeutungsloser Zeichen.