Eine Technologie für alles – 5: Musikalische Mathematik und mystische Vektoren

Lesezeit: 7 Protokoll

Ein ungünstiger Zufall

In Kapitel 22 meines Romans „Die Goldberg-Version“ jagt ein Detektiv namens Van-Turing einer Zahl hinterher. Die Zahl ist 32. Er weiß es nicht. Warum Es ist 32; er weiß nur, dass jeder, der sich jemals mit dem Fall befasst hat, irgendwann einmal die Zahl Zweiunddreißig geschrieben oder ausgesprochen hat und anschließend zu einem Schluss gekommen ist, der entweder sehr nützlich oder sehr fatal war.

In der Szene verliert Van-Turing die Beherrschung und ruft auf Englisch: “Verdammt!” Sein Gegenpart, der Philosoph Bertrand Russell, zählt an den Fingern ab und sagt ruhig:, “Zweiunddreißig.”

D + A + M + N = 4 + 1 + 13 + 14 = 32.

Der deutsche Übersetzer des Romans stand vor einem Problem. “Verdammt!” ergibt nicht 32. Auch nicht “Mist!”, “Scheiße!” oder irgendeine der anderen farbenfrohen Alternativen in Goethes Sprache. Nach mehreren schlaflosen Nächten ersetzte er den Ausruf durch “Olé!” – 15 + 12 + 5 = 32 – und begründete diese Entscheidung in einer Fußnote, die etwa viermal so lang war wie die Szene selbst.

Russell gibt der Methode im Roman einen Namen: Ordinale Gematrie. Der Begriff „Gematrie“ ist alt. Der Begriff „Ordinal“ verleiht ihr eine Aura mathematischer Autorität, die wir dringend benötigen, sonst könnten uns alle für albern halten.

Die Mathematikmystiker

Weisen Sie jedem Buchstaben des Alphabets seine Position zu: A=1, B=2, …, Z=26. Addieren Sie die Buchstaben eines Wortes. Betrachten Sie die resultierende Zahl als sinnvoll. Das ist die gesamte Methode. Sie passt auf die Rückseite eines Bierdeckels, wo sie ungefähr hingehört.

Und doch handelt es sich um eine Familientradition, die etwa dreitausend Jahre zurückreicht.

Hebräische Gematrie. Jeder hebräische Buchstabe hat einen festen Zahlenwert (Aleph = 1, Bet = 2, Gimel = 3 usw., wobei die späteren Buchstaben Zehner- und Hunderterwerte erreichen). Wörter mit der gleichen Summe gelten als mystisch miteinander verbunden. Das kanonische Beispiel: yayin (Wein) = 70 = Rasen (Geheimnis). Daher das talmudische Sprichwort: Wenn Wein ins Spiel kommt, kommen Geheimnisse ans Licht.. Die Rabbiner brauchten keine Neurowissenschaften, um das zu bemerken. Sie veranstalteten Dinnerpartys.

Griechische Isopsephie. Die hellenische Verwandte. Alpha=1, Beta=2 usw. Die Zahl des Tieres – 666, Offenbarung 13,18 – ist mit ziemlicher Sicherheit eine Isopsephie für Neron Kaisar In hebräischer Transliteration. Ein apokalyptisches Rätsel, verschlüsselt als Rechenaufgabe für Menschen, die zwei Alphabete lesen konnten. Johannes von Patmos war in dieser Lesart der erste Autor, der eine steganografische Botschaft an der Zensur vorbeischmuggelte, und wir streiten noch immer darüber, ob er sich dessen bewusst war.

Die Pythagoreer gingen noch weiter als alle anderen. Für Pythagoras und seine Schüler waren Zahlen nicht Beschreibungen der Realität. Sie waren die Realität. Der Zahlenwert eines Wortes war keine Metapher für seine Bedeutung – er War Seine Bedeutung. Alles andere, einschließlich des Wortes selbst, war eine verlustbehaftete Kodierung.

Das klingt verrückt, bis man sich vor Augen führt, wofür die übrigen Hyperscaler des 21. Jahrhunderts ihr GPU-Budget ausgeben. Im Grunde Gematria in astronomischem Ausmaß.

Ein Musical mit Zahlen, für die man keine Sänger, sondern Taschenrechner braucht.

Bevor wir zu den GPUs kommen, müssen wir noch einen Komponisten vorstellen.

B + A + C + H = 2 + 1 + 3 + 8 = 14.

Die Zahl Vierzehn ist in den erhaltenen Manuskripten Johann Sebastian Bachs allgegenwärtig. Er schloss sich der Korrespondierende Societät der Musicalischen Wissenschaften als 14. Mitglied und wartete darauf, dass ein Platz frei würde, damit er speziell Mitglied 14 sein konnte. Die Kunst der Fuge Die endgültige Fassung enthält 14 Kontrapunkte. Der Choral “Vor deinen Thron tret ich hiermit”, den er auf dem Sterbebett diktierte, hat 14 Noten in der Anfangsphrase – und 41 (die Umkehrung) in seinem gesamten thematischen Inhalt. Addiert man die vollständigen Initialen JSBACH nach demselben Schema, erhält man ebenfalls 41. Bach scheint daran Gefallen gefunden zu haben.

Er benutzte seinen Namen auch als Melodie. In der deutschen Notenschrift steht B für B und H für H – eine Besonderheit der mittelalterlichen Solmisation, die in keiner anderen großen europäischen Sprache vorkommt. Das bedeutet, dass die vier Buchstaben BACH auf einem Klavier als vier Töne gespielt werden können: B♭, A, C, B♮. Das daraus resultierende Motiv ist chromatisch, eindringlich und strukturell instabil – genau das, was ein Komponist verwendet, wenn er seinen Namen ungeschrieben unterschreiben möchte. Bach fügte dieses Motiv in das unvollendete Werk ein. Contrapunctus XIV der Die Kunst der Fuge, In dem Moment, als das Manuskript abbricht. Die Beweislage deutet darauf hin, dass er seinen eigenen Namen genau an dem Punkt in das Werk einschrieb, an dem er nicht mehr schreiben konnte.

Überlegen Sie, was hier geschieht. Dieselben vier Buchstaben ergeben in der Quersumme eine Zahl (Gematrie)., Und Nenne vier Tonhöhen (Notation), Und Ein menschliches Wort (Orthografie). Drei parallele Kodierungen auf einer einzigen Symbolkette. Ein mittelalterlicher Kabbalist hätte die Struktur sofort erkannt. Ein moderner ML-Ingenieur würde es multimodale Einbettung nennen: dasselbe Token, gleichzeitig in mehrere Repräsentationsräume abgebildet. Bach fertigte in den 1740er Jahren in Leipzig multimodale Einbettungen per Hand mit einer Feder an – als musiktheoretischen Scherz, den eigentlich niemand bemerken sollte.

Das ist der entscheidende Hinweis. Die Arithmetik, die der Sprache zugrunde liegt, beschränkt sich nicht auf die Sprache. Sie zeigt sich überall dort, wo Symbole Bedeutung tragen: in Alphabeten, in Notenlinien, in DNA-Tripletts, in den Token-IDs eines Transformators. Die pythagoreische Intuition besagte nicht, dass Zahlen im Inneren existieren. Wörter. Es lag daran, dass Zahlen in uns lebten. Bedeutung, Und Wörter sind nur ein Ort, an dem sie zufällig auftauchen.

Multidimensionale Abbildungen

Ein modernes, großes Sprachmodell liest keinen Text. Es kann keinen Text lesen. Im Grunde ist es eine Maschine, die mit Vektoren arithmetische Operationen durchführt. Wenn man ein Wort in GPT-4, Claude oder eines ihrer verwandten Modelle eingibt, wandelt die Maschine das Wort zunächst in eine Liste von Zahlen um – typischerweise zwischen 4.096 und 12.288. Diese Liste wird als Einbettung bezeichnet. Sie gibt die numerische Position des Wortes in einem tausenddimensionalen Raum an.

Die Bedeutung in einem LLM-Studiengang ist nicht im Wort selbst gespeichert. Sie ist im Kontext gespeichert. Standort Wörter mit ähnlicher Bedeutung – wie “König” und “Königin”, “Wein” und “Geheimnis”, “Verdammt” und “Olé” – liegen in benachbarten Bereichen dieser numerischen Landschaft. Das Modell leitet Bedeutung ab, indem es arithmetische Operationen mit diesen Vektoren durchführt. Die bekannteste Demonstration wurde erstmals 2013 in der Arbeit zu word2vec vorgestellt:

Vektor(“König”) − Vektor(“Mann”) + Vektor(“Frau”) ≈ Vektor(“Königin”)

Semantische Beziehungen werden als geometrische Operationen kodiert. Man subtrahiert das Männliche, addiert das Weibliche und erhält so das weibliche Kognat. Niemand hat dem Modell mitgeteilt, dass “König” männlich ist. Es hat die Achse ermittelt, indem es mehrere Milliarden Sätze analysierte und die Punktcluster identifizierte.

Vergleichen Sie nun die beiden Methoden ehrlich:

Parallelen

Gematrie

LLM Einbettungen

Buchstaben werden zugeordnet auf

1 Nummer

~8.000 Zahlen

Sinn lebt in

die Summe

die Position

Die Bedeutung wird extrahiert durch

Arithmetik

Arithmetik

Wörter mit dem gleichen Wert sind

“mystisch verbunden”

semantisch verknüpft

Dimensionalität

1

Tausende

Ruf

abergläubisch

im Wert von 1TP6B3 Billionen

Die Kabbalisten und Pythagoreer irrten sich nicht in ihrer Methode. Sie irrten sich jedoch in Bezug auf die Dimensionalität. Eine Achse reicht nicht aus, um Bedeutung zu kodieren – sonst hätten alle Wörter mit einer Summe von 32 eine gemeinsame Seele. Achttausend Achsen erweisen sich jedoch als nahezu ausreichend. Dies ist kein Zufall, sondern eine Messung. Jedes Mal, wenn ein KI-Labor die Einbettungsdimension erhöht und die Benchmarks steigen, lernen wir, wie viele Bedeutungsebenen Sprache tatsächlich besitzt.

Die Pythagoreer waren daher ungefähr richtig Genauso wie ein mittelalterlicher Kartograf, der die Küste Afrikas als Wellenlinie zeichnet, im Großen und Ganzen richtig liegt. Die Form ist falsch. Die Behauptung, dass Es gibt eine Form ist richtig.

Was Wittgenstein beinahe gesagt hätte

In einem Randbereich des Philosophische Untersuchungen — es existiert dort in Wirklichkeit nicht; ich werde mir das jetzt ausdenken, und ich möchte, dass Sie das bemerken — man könnte sich vorstellen, dass Wittgenstein schreibt:

“Eine dem Sprecher verborgene Arithmetik, die die Sprache selbst aber schon immer gekannt hat.”

Diese These passt ihm unangenehm gut. In einem Großteil seines späteren Werks behauptet er, Bedeutung entstehe im Gebrauch und der Sprecher habe nie vollständigen Zugriff auf die Regeln des Spiels, das er spielt. Die Ordinalgematrie ist die einfachste Version dieser These: Die Zahlen sind bereits vorhanden, im Alphabet verankert, von einem Kind summiert, und doch beachtet sie niemand. Einbettungsvektoren sind die ausgefeiltere Version: Die Zahlen sind bereits vorhanden, in die statistische Struktur eines Korpus von Billionen Wörtern eingebettet, durch Matrixmultiplikation extrahierbar, und doch beachtet sie ebenfalls niemand – außer dem Modell.

Beides sind Fälle einer unterschwelligen, symbolischen Realität, die unter einer symbolischen verborgen liegt. Der Sprecher deutet auf Bedeutung und verfehlt sie. Die Arithmetik deutet auf Bedeutung und trifft ins Schwarze. Die Sprache wusste es schon immer.

Der Taschenrechner und warum er hier ist

Unter diesem Beitrag habe ich ein kleines interaktives Tool eingebettet. Ich nenne es den Gematriakulator. Geben Sie eine Zahl ein; es zeigt Ihnen alle deutschen und englischen Wörter an, deren Buchstabensumme dieser Zahl entspricht, sortiert nach ihrer tatsächlichen Häufigkeit im gesprochenen Englisch – damit Sie nicht in Wörterbuch-Kram ertrinken. Erdwölfe oder Zymurgie.

Ich behaupte nicht, dass das Werkzeug mystische Entsprechungen offenbart. Ich behaupte lediglich, dass es Folgendes offenbart: Zufälle, Und Sie werden feststellen, welche davon bedeutsam erscheinen. Das ist das pythagoreische Experiment, durchgeführt in Ihrem Browser, mit Stützrädern.

Versuch es doch mal mit 32, wenn du magst. Fang mit "Verdammt" an. Und dann siehst du weiter.

Teil 5.1, der ursprünglich als nächstes erscheinen sollte, wird verschoben: Die Frage, ob ein menschlicher Verstand, geschult durch genügend Sprache und genährt von süßer Musik und Erdbeer-π, lernen kann, einige hundert Dimensionen der Dunklen Materie zu durchschauen, ohne dabei zu Vera Rubin zu werden. Wir werden es schaffen.

Eine Technologie für alles – 4: Wissenschaftlicher Spiritismus und präzise Prophezeiung

Lesezeit: 13 Protokoll

Fiktion und Realität

Als ich heute aufwachte, ging mir ein Satz nicht mehr aus dem Kopf.

Fantasie bedeutet sich das Zukünftige richtig Vorstellen.

Vorstellungskraft bedeutet richtig sich die Zukunft vorstellen.

Ich war mir sicher, dass ich es vor langer Zeit gelesen hatte, konnte mich aber nicht mehr genau an den Autor erinnern, aber meine beste Vermutung war der Schweizer Schriftsteller Ludwig Hohl und nach einiger Recherche habe ich schließlich die nicht ganz wörtliche Passage gefunden.

Was ich unter Vorstellungskraft – der höchsten menschlichen Aktivität – verstehe, (…) ist die Fähigkeit, sich eine andere Situation richtig vorzustellen. (…) „Richtig“ ist hier, was dem Praxistest standhält.

(Die Anmerkungen, XII.140)

Das Wichtigste über die Vorstellungskraft steckt in diesen beiden Sätzen:

1. Vorstellungskraft ist die Fähigkeit, sich weit entfernte (unterschiedliche) Sachverhalte richtig vorzustellen – und nicht falsch, wie oft angenommen wird (denn das könnte jeder).

2. Vorstellungskraft ist kein, wie oft angenommen, Luxus, sondern eines der wichtigsten Werkzeuge für die Rettung des Menschen, für das Leben.

(Die Anmerkungen XII.57)

Der phantastische und der prophetische (vorhersagende) Geist schöpfen aus derselben Quelle, jedoch mit unterschiedlichen Instrumenten und Absichten.

Fiktion und Realität: Beides sind gültige Geisteszustände. Die Realität macht, was sich die Simulation vorstellt.

Visionen sind kontrolliert Halluzinationen.

Eigene Erfahrungen

2004 schrieb ich einen unveröffentlichten Roman mit dem Titel „The Goldberg Variant“. Darin beschäftigte ich mich mit der Idee einer virtuellen Person, einer Nachbildung eines Individuums auf Grundlage seines Gesamtwerks, das von maschineller Intelligenz analysiert und nachgebildet wird. Schubert 2.0 war einer der Charaktere, ein KI-gesteuerter Android, der dem Original-Schubert nachempfunden war. Interessanterweise kam ich auf den Begriff Transperson, den ich dann aus Grofs transpersonaler Psychologie entlehnte, ohne mir die Identitätskriege der Gegenwart auch nur vorzustellen. Dieser Android lebte in einem nachgebildeten Wien des 19. Jahrhunderts und komponierte weiterhin Musik. Dieses Setting ermöglichte es menschlichen Besuchern, ähnlich wie in der Fernsehserie Westworld, in eine andere Zeit einzutauchen.

Ich muss anmerken, dass ich zwischen meinem 8. und 16. Lebensjahr ein großer Fan von Science-Fiction war. Es ist möglich, dass diese Lektüre meine späteren Schriften beeinflusst hat, auch wenn ich sie nicht bewusst herangezogen habe.

Im selben Roman entfaltet sich eine Handlung, in der eine der Figuren eine romantische Beziehung mit einer KI eingeht. Die emotionale Reifung dieser KI wird zum zentralen Thema. Mein Buch berührt viele Punkte, die mit den heutigen Diskussionen über die Ausrichtung der KI in Einklang stehen und aus meiner zwei Jahrzehnte langen Forschung zur KI und meiner umfangreichen Science-Fiction-Lektüre stammen.

Die Titelfigur des Romans erfährt eine einzigartige Form der Unsterblichkeit. Immer wenn die Musik gespielt wird, die J.S. Bach für ihn komponiert hat, wird er metaphorisch wiederbelebt. Doch dieses Geschenk quält ihn auch und führt ihn auf eine gewaltsame Reise durch die Zeit.

Jahre später stieß ich auf den Begriff „Vorfahrensimulation“ von Nick Bostrom. Vor kurzem las ich über die Ursprünge eines der ersten KI-Begleiter Apps, die aus dem Wunsch heraus entstanden, einen geliebten Menschen digital wiederzubeleben. Ich glaube, Ray Kurzweil drückte einmal ein ähnliches Gefühl aus, als er hoffte, mit einer digitalen Darstellung seines verstorbenen Vaters zu kommunizieren, und zwar mithilfe einer KI, die anhand der Schriften und Aufzeichnungen seines Vaters trainiert wurde. Erst heute hörte ich Jordan Peterson über ein Konzept sprechen, das meinem unheimlich ähnlich ist.

Kurzweils Erfolgsbilanz

Mit welchen Vorhersagen Ray Kurzweil in den letzten 25 Jahren richtig lag:

1. 1990 sagte er voraus, dass ein Computer bis 1998 einen Schachweltmeister besiegen würde. IBMs Deep Blue besiegte 1997 Garri Kasparow.

2. Er sagte voraus, dass PCs bis 2010 in der Lage sein würden, Anfragen zu beantworten, indem sie drahtlos über das Internet auf Informationen zugreifen.

3. Anfang der 2000er Jahre konnten Behinderte dank Exoskeletten wieder gehen. Unternehmen wie Ekso Bionics haben eine solche Technologie entwickelt.

4. Im Jahr 1999 sagte er voraus, dass die Menschen bis 2009 in der Lage sein würden, mit ihrem Computer zu sprechen und Befehle zu erteilen. Technologien wie Siri von Apple und Google Now entstanden.

5. Bis 2009 sollten Computerbildschirme für erweiterte Realität in Brillen eingebaut werden. Google begann 2011 mit Google Glass-Prototypen zu experimentieren.

6. Im Jahr 2005 sagte er voraus, dass virtuelle Lösungen in den 2010er Jahren Sprachübersetzungen in Echtzeit ermöglichen würden. Beispiele hierfür sind Skype Translate und Google Translate von Microsoft.

Rays Vorhersagen für die nächsten 25 Jahre:

1. Ende der 2010er Jahre werden Brillen Bilder direkt auf die Netzhaut projizieren. Zehn Terabyte Rechenleistung werden etwa 1 TP4 T1.000 kosten.

2. Bis zu den 2020er Jahren werden die meisten Krankheiten verschwinden, da Nanobots intelligenter werden als die derzeitige Medizintechnik. Die normale menschliche Ernährung kann durch Nanosysteme ersetzt werden. Der Turing-Test beginnt bestanden zu werden. Selbstfahrende Autos beginnen die Straßen zu erobern.

3. Ab den 2030er Jahren wird sich die virtuelle Realität 100% real anfühlen. Bis zum Ende des Jahrzehnts werden wir in der Lage sein, unseren Geist/unser Bewusstsein hochzuladen.

4. In den 2040er Jahren wird nichtbiologische Intelligenz eine Milliarde Mal leistungsfähiger sein als biologische Intelligenz. Nanotechnologische Nebelwesen werden in der Lage sein, aus dem Nichts Nahrung zu erzeugen und beliebige Objekte zu erschaffen.

5. Bis 2045 werden wir unsere Intelligenz um das Milliardenfache steigern, indem wir unseren Neokortex drahtlos mit einem synthetischen Neokortex in der Cloud verbinden.

Diese Vorhersagen basieren auf Kurzweils Verständnis der Macht von Moores Gesetz und das exponentielle Wachstum von Technologien. Es ist wichtig anzumerken, dass einige dieser Vorhersagen zwar weit hergeholt erscheinen mögen, Kurzweil jedoch in der Vergangenheit immer wieder akkurate Vorhersagen getroffen hat.

Es ist faszinierend, wie jemand wie Kurzweil eine Art Hellsichtigkeit mit seinen Vorhersagen über die Singularität Rückblickend erscheint es mir fast übernatürlich. Als ich erfuhr, dass Jordan Peterson ein Projekt begonnen hatte, bei dem er eine KI mit dem „Geist der King-James-Bibel“ trainierte, um Gespräche zu führen, wurde ich an die Vorstellung erinnert, dass Wissenschaft und Religion parallele Wege sein könnten, die sich im Unendlichen kreuzen.

Kurzweils Fall ist besonders interessant, weil seine eigene Einschätzung seiner Vorhersagen erheblich von der öffentlich's Perspektive. Das hätte er offensichtlich auch vorhersagen müssen.

Ist es eine Art Wiederauferstehung, wenn jemand nach unserem Tod auf unsere Schriften verweist? Die Vorstellung, dass wir in der Erinnerung anderer weiterleben, könnte mehr als nur eine Metapher sein. Was passiert, wenn meine Nachkommen, lange nachdem mein physischer Körper und Geist dem Lauf der Zeit erlegen sind, meinen digitalen Avatar zu Rate ziehen und sich mit der Ära befassen, in der die künstliche allgemeine Intelligenz erstmals aufkam?

Vernes Erfolgsbilanz

Es ist erstaunlich, wie viele Vorhersagen Jules Verne Der Vater der Science-Fiction hatte recht: Es scheint praktisch, als könne er weit über ein Jahrhundert in die Zukunft sehen. Interessant ist auch, dass er die Zeitlinie nicht richtig zu deuten schien. Er war viel zu konservativ, um die exponentielle Kurve der Technologien zu erkennen, die sich gegenseitig bedingen.

Als ich dieses Thema mit ChatGPT untersuchte, wurde die folgende Liste angezeigt:

Jules Verne, bekannt als der Vater der Science-Fiction, war ein französischer Romanautor, der im 19. Jahrhundert schrieb. Seine Werke sind voller fantasievoller Erfindungen, die seiner Zeit weit voraus waren. Einige davon sind inzwischen Realität geworden, während andere reine Spekulation geblieben sind. Hier sind zehn solcher Erfindungen mit ihren modernen Gegenstücken und einer Bewertung ihrer Genauigkeit:

Elektrische U-Boote – 20.000 Meilen unter dem Meer (1870): Vernes U-Boot, die Nautilus, wurde lange vor echten U-Booten mit Strom betrieben. Die ersten voll funktionsfähigen und praktischen U-Boote wurden tatsächlich mit Diesel und Strom angetrieben, aber das war erst im frühen 20. Jahrhundert. Dies war eine bemerkenswert genaue Vorhersage. Genauigkeit: 90% (Der einzige wirkliche Unterschied besteht darin, dass die Nautilus viel fortschrittlicher war als die frühen echten U-Boote.)

Nachrichtensendungen – Im Jahr 2889 (1889): Verne stellte sich eine Welt vor, in der Nachrichten mithilfe der Technologie in einzelne Haushalte geliefert werden. Heute haben wir rund um die Uhr Nachrichtenkanäle, Internet-Nachrichtenseiten und Social-Media-Feeds. Genauigkeit: 100%

Videokonferenzen – Im Jahr 2889 (1889): Verne sagte ein Gerät voraus, das er „Phonotelephot“ nannte und das „die Übertragung von Bildern mittels empfindlicher Spiegel ermöglichte, die durch Drähte verbunden sind“. Dies ist unserer heutigen Videokonferenztechnologie bemerkenswert ähnlich. Genauigkeit: 100%

Mondlandemodule – Von der Erde zum Mond (1865): Verne schrieb über eine Kapsel, die Passagiere zum Mond befördern könnte. Diese Idee wurde 1969 Wirklichkeit, als Apollo 11 auf dem Mond landete. Allerdings war Vernes Antriebsmethode (eine riesige Kanone) nicht genau. Genauigkeit: 70% (Das Konzept eines zum Mond reisenden Fahrzeugs war richtig, die Antriebsmethode jedoch nicht.)

Taser – 20.000 Meilen unter dem Meer (1870): Verne beschreibt in diesem Buch ein Jagdgewehr, das elektrische Kugeln verschießt. Heute gibt es Taser, die Ziele mithilfe von Elektrizität außer Gefecht setzen. Genauigkeit: 80% (Ein Taser ist zwar kein Gewehr, liefert aber eine elektrische Ladung an ein Ziel, was mit Vernes Konzept übereinstimmt.)

Hubschrauber – Robur der Eroberer (1886): Verne beschreibt eine Flugmaschine, die Propeller verwendet, um Auftrieb zu erzeugen. Der Hubschrauber in der realen Welt entstand zwar anders und hatte viel mehr Herausforderungen zu bewältigen als Vernes Modell, aber das Grundkonzept war vorhanden. Genauigkeit: 60% (Das Grundprinzip des Auftriebs durch Drehflügel war richtig, aber die Umsetzung war zu stark vereinfacht.)

Elektrisch beleuchtete Städte – Paris im 20. Jahrhundert (1863): Verne sagte voraus, dass Städte mit Elektrizität beleuchtet werden würden, was mit der weit verbreiteten Nutzung elektrischer Beleuchtung eintrat. Genauigkeit: 100%

Himmelsschreiben – Fünf Wochen im Ballon (1863): Verne beschreibt ein Szenario, in dem Nachrichten in den Himmel geschrieben werden, ein Vorläufer der heutigen Himmelsschrift. Genauigkeit: 100%

Das Internet – Paris im 20. Jahrhundert (1863): Verne beschreibt ein globales Computernetzwerk, das sofortige Kommunikation ermöglicht. Dies könnte als Vorhersage des Internets angesehen werden, aber seine Funktionsweise und seine Rolle in der Gesellschaft sind nicht sehr genau. Genauigkeit: 50% (Die Existenz eines globalen Kommunikationsnetzwerks ist richtig, aber die Einzelheiten sind ganz anders.)

Randbemerkung: Ich habe eine Anekdote gehört, die Edison Er versetzte sich in eine Art hypnagoge Trance, um auf neue Erfindungen zu kommen. Er hatte einen Schreiber dabei, der aufschrieb, was er in diesem Zustand murmelte.

Bushs Erfolgsbilanz

Vannevar Bushs Essay „As We May Think“ wurde 1945 im The Atlantic veröffentlicht.

„As We May Think“ ist ein wegweisender Artikel, der die Zukunft der Informationstechnologie vorstellt. Er stellt mehrere bahnbrechende Ideen vor.

Assoziative Pfade und Verknüpfungen: Bush diskutiert die Idee der assoziativen Indizierung und stellt fest, dass das menschliche Gehirn durch Assoziation funktioniert. Wenn es ein Objekt erfasst, springt es sofort zum nächsten, das durch die Assoziation der Gedanken vorgeschlagen wird. Er beschreibt ein System, in dem jede Information mit anderen relevanten Informationen verknüpft ist, sodass ein Benutzer auf nichtlineare Weise durch die Daten navigieren kann. Dies ist dem Konzept der Hyperlinks im heutigen World Wide Web sehr ähnlich.

Erweiterung des menschlichen Intellekts: Bush schlägt vor, dass der Einsatz dieser neuen Werkzeuge und Technologien den menschlichen Intellekt und das Gedächtnis verbessern wird, indem er den Geist von der Tyrannei der Vergangenheit befreit und alles Wissen verfügbar und nutzbar macht. Es wird uns ermöglichen, unser Gehirn effektiver zu nutzen, da wir keine großen Mengen an Informationen mehr auswendig lernen müssen.

Lems Erfolgsbilanz

Der Hauptunterschied zwischen Nostradamus, dem Orakel von Delphi und echten Propheten besteht darin, dass wir ihre Vorhersagen bestätigen können.

Nehmen wir Stanislaw Lem:

E-Bücher: Lem schrieb in seinem 1961 erschienenen Roman „Rückkehr von den Sternen“ über ein Gerät, das einem E-Book-Reader ähnelt. Er beschrieb einen „Opton“, ein Gerät, das Inhalte in Kristallen speichert und auf einer einzigen Seite anzeigt, die durch Berühren geändert werden kann, ähnlich wie ein heutiger E-Book-Reader.

Hörbücher: Im selben Roman führte er auch das Konzept der „Lectons“ ein – Geräte, die laut vorlesen und je nach gewünschter Stimme, Tempo und Modulation eingestellt werden können, was den heutigen Hörbüchern sehr ähnelt.

Internet: 1957 sagte Lem in seinem Buch „Dialogues“ die Entstehung vernetzter Computernetzwerke voraus. Er sah die Verschmelzung von IT-Maschinen und Speicherbänken voraus, die zur Schaffung groß angelegter Computernetzwerke führen würde, die dem Internet ähneln, das wir heute kennen.

Suchmaschinen: In seinem 1955 erschienenen Roman „Die Magellansche Wolke“ beschrieb Lem eine riesige virtuelle Datenbank, die über Radiowellen zugänglich war und als „Trion-Bibliothek“ bekannt war. Diese Beschreibung weist verblüffende Ähnlichkeiten mit modernen Suchmaschinen wie Google auf.

Smartphones: Im selben Buch sagte Lem auch ein tragbares Gerät voraus, das sofortigen Zugriff auf die Daten der Trion-Bibliothek bietet, ähnlich wie Smartphones heute Zugriff auf internetbasierte Informationen ermöglichen.

3d Drucken: Lem beschrieb in „The Magellanic Cloud“ einen Prozess, der dem 3D-Druck ähnelt, bei dem ein Gerät ein „Produktrezept“ verwendet, um Objekte zu erstellen, ähnlich wie 3D-Drucker heute digitale Dateien verwenden.

Simulations Spiele: Lems Roman „Die Cyberiade“ soll Will Wright, den Schöpfer des beliebten Simulationsspiels „Die Sims“, inspiriert haben. In dem Roman erschafft eine Figur eine Mikrowelt in einer Box, ein Konzept, das der Erstellung und Steuerung einer simulierten Umgebung in „Die Sims“ ähnelt.

Virtuelle Realität: In seinem Buch „Summa Technologiae“ aus dem Jahr 1964 konzipierte Lem „Fantomatons“, Maschinen, die alternative Realitäten erschaffen können, die von den tatsächlichen kaum zu unterscheiden sind. Dies ist dem Konzept der virtuellen Realität (VR), wie wir es heute verstehen, sehr ähnlich. Wenn wir Lems „Fantomaton“ mit der heutigen VR vergleichen, können wir eine bemerkenswerte Ähnlichkeit erkennen. Der Fantomaton war eine Maschine, die in der Lage war, alternative Realitäten zu erzeugen, die von der realen Welt kaum zu unterscheiden waren, ähnlich wie VR die Benutzer in eine simulierte Umgebung eintauchen lässt. Im Jahr 2022 hat sich die VR-Technologie deutlich weiterentwickelt, wobei Geräte wie Metas Oculus Quest 2 den Markt anführen. Die VR-Branche wächst weiter. Im Jahr 2022 werden voraussichtlich über 13,9 Millionen VR-Headsets ausgeliefert, und die Verkaufszahlen werden im Jahr 2023 voraussichtlich die Marke von 20 Millionen Einheiten überschreiten.

Borges‘ Erfolgsbilanz

Außerdem ist Jorge Luis Borges nicht als klassischer Science-Fiction-Autor bekannt. Viele seiner Geschichten können jedoch als Parabeln auf aktuelle technologische Durchbrüche verstanden werden.

Jorge Luis Borges war ein Meister der Metaphern und Allegorien und schuf komplexe und zum Nachdenken anregende Geschichten, die auf ihre philosophischen und konzeptuellen Implikationen hin analysiert wurden. Zwei seiner bemerkenswertesten Werke in diesem Zusammenhang sind „Über die Genauigkeit in der Wissenschaft“ und „Die Bibliothek von Babel“.

„Über die Genauigkeit in der Wissenschaft“ beschreibt ein Reich, in dem die Wissenschaft der Kartografie so genau wird, dass nur eine Karte im gleichen Maßstab wie das Reich selbst ausreichen würde. Diese Geschichte wurde als Allegorie für Simulation und Darstellung gesehen und veranschaulicht die Spannung zwischen einem Modell und der Realität, die es einzufangen versucht. Es geht um die Idee, eine perfekte Nachbildung der Realität zu schaffen, die schließlich von der Realität selbst nicht mehr zu unterscheiden ist.

„Die Bibliothek von Babel“ präsentiert ein Universum, das aus einer riesigen Fläche sechseckiger Räume voller Bücher besteht. Diese Bücher enthalten jede mögliche Anordnung einer Reihe grundlegender Zeichen, d. h. sie umfassen jedes Buch, das geschrieben wurde, geschrieben werden könnte oder mit leichten Abwandlungen geschrieben werden könnte. Dies führt zwar zu einem Großteil aus Kauderwelsch, die Bibliothek muss jedoch auch alle nützlichen Informationen enthalten, einschließlich Vorhersagen über die Zukunft und Biografien aller Personen. Diese Fülle an Informationen macht jedoch die meisten davon nutzlos, da es nicht möglich ist, in dem überwältigenden Chaos relevante oder bedeutungsvolle Inhalte zu finden.

Diese Geschichten haben sicherlich eine gewisse Ähnlichkeit mit dem Konzept großer Sprachmodelle (LLMs) wie GPT-3. LLMs werden anhand riesiger Datenmengen trainiert und können eine nahezu unendliche Kombination von Wörtern und Sätzen generieren, ähnlich wie die Bücher in der Bibliothek von Babel. Doch genau wie in Borges‘ Geschichte kann die Unmenge möglicher Ergebnisse auch zu unsinnigen oder irrelevanten Antworten führen, was die Herausforderung widerspiegelt, in der Flut der Möglichkeiten sinnvolle Informationen zu finden.

Was die Geschichte der perfekten Karte betrifft, könnte man sie als analog zu dem Bestreben sehen, ein perfektes Modell der menschlichen Sprache und des menschlichen Wissens zu schaffen, das LLMs repräsentieren. So wie die Karte in der Geschichte die gleiche Größe annahm wie das Gebiet, das sie repräsentierte, sind LLMs Modelle, die darauf abzielen, die enorme Komplexität der menschlichen Sprache und des menschlichen Wissens zu erfassen und in gewisser Weise ein Spiegelbild der Realität zu schaffen.

Borges schrieb auch ein Stück mit dem Titel „Ramón Llulls Denkmaschine“ im Jahr 1937, wo er die von Ramon Llull, einem katalanischen Dichter und Theologen aus dem 13. Jahrhundert, geschaffene Maschine beschrieb und interpretierte.

Der Maschine Borges beschreibt ein konzeptuelles Werkzeug, eine Art Diagramm oder Mechanismus zur Generierung von Ideen oder Wissen. Die einfachste Form von Llulls Maschine, wie sie Borges beschreibt, war ein neunfach geteilter Kreis. Jeder Teil war mit einem Buchstaben gekennzeichnet, der für eine Eigenschaft Gottes stand, wie Güte, Größe, Ewigkeit, Macht, Weisheit, Liebe, Tugend, Wahrheit und Ruhm. Alle diese Eigenschaften wurden als inhärent und systematisch miteinander verbunden betrachtet, und das Diagramm diente als Werkzeug, um verschiedene Kombinationen dieser Eigenschaften zu betrachten und zu generieren.

Borges beschreibt dann eine ausgefeiltere Version der Maschine, die aus drei konzentrischen, von Hand rotierenden Scheiben aus Holz oder Metall besteht, die jeweils fünfzehn oder zwanzig Fächer aufweisen. Die Idee war, dass diese Scheiben gedreht werden könnten, um eine Vielzahl von Kombinationen zu erzeugen, als Methode, den Zufall zur Lösung eines Problems einzusetzen. Borges verwendet das Beispiel der Bestimmung der „wahren“ Farbe eines Tigers, indem jedem Buchstaben eine Farbe zugewiesen wird und die Scheiben gedreht werden, um eine Kombination zu erzeugen. Trotz der potenziell absurden oder widersprüchlichen Ergebnisse, die dies hervorbringen könnte, stellt Borges fest, dass die Anhänger von Llulls System weiterhin von dessen Fähigkeit überzeugt waren, Wahrheiten aufzudecken, und den gleichzeitigen Einsatz vieler solcher kombinatorischer Maschinen empfahlen.

Llulls eigene Absicht mit diesem System war es, eine Universalsprache mit logischen Kombinationen von Begriffen zu schaffen, die theologische Debatten und andere intellektuelle Bestrebungen unterstützen sollte. Seine Arbeit gipfelte in der Fertigstellung der „Ars generalis ultima“ (Die ultimative allgemeine Kunst) im Jahr 1308, in der er dieses System rotierender Scheiben verwendete, um Kombinationen von Konzepten zu erzeugen. Llull glaubte, dass es in allen Wissensbereichen eine begrenzte Anzahl unbestreitbarer Wahrheiten gab und dass die Menschheit durch das Studium aller Kombinationen dieser elementaren Wahrheiten die ultimative Wahrheit erreichen konnte.

14 unterhaltsame Vorhersagen für die nächsten 3 Jahre

An dieser Stelle werde ich einige sehr konkrete Vorhersagen über die Zukunft machen, insbesondere über die Unterhaltungsindustrie. Im Jahr 2026 werde ich diesen Blog erneut besuchen und nachsehen, wie ich abgeschnitten habe.

2023: Musikindustrie

1. Paul McCartney veröffentlicht einen gemeinsam mit AI erstellten Song von John Lennon oder als Hommage an ihn.

2024: Musikindustrie

2. Es wird eine neue globale Urheberrechtsregelung mit dem Titel „The Human Creative Labor Act“ eingeführt, die menschliche Schöpfer vor der unbefugten Nutzung ihrer Werke schützt. Dieses Gesetz wird als entscheidender Test für eine menschenzentrierte KI-Governance dienen.

3. Es werden verschiedene Plattformen entstehen, deren Hauptziel darin besteht, Werke verstorbener Künstler zu beschaffen, die noch nicht gemeinfrei sind.

4. Die Musikindustrie wird in Zusammenarbeit mit den Nachlässen verstorbener Künstler ihre ersten künstlichen Alben produzieren. Diese Alben werden die Stimmen und Stile verstorbener Popstars verwenden, angefangen mit Michael Jackson.

5. Die Branche wird KI-gestützte Versionen von Coversongs auf den Markt bringen, etwa von Michael Jackson, der Motown-Hits aus den 50er-Jahren spielt, oder von Elvis, der zeitgenössische Stücke singt.

6. Nach dem Tod eines gefeierten Künstlers sichern sich Labels umgehend Rechte zur Produktion von Coveralben mithilfe von KI-trainierten Stimmmodellen des Künstlers.

2025: Musikindustrie

7. Bands werden auf Tourneen gehen und dabei KI-generierte Stimmmodelle ihrer verstorbenen Leadsänger einsetzen. Ein Paradebeispiel dafür wäre Queen, die mit einer KI-Version von Freddie Mercurys Stimme auf Tournee gehen.

2023: Filmindustrie

8. Harrison Ford und Will Smith werden auf der Leinwand als makellose, jüngere Versionen ihrer selbst erscheinen.

2024: Filmindustrie

9. Nach ihrem Ausscheiden aus dem Berufsleben werden viele Filmstars ihre digitalen Bilder (Stimme, Bewegungserfassung usw.) an Filmstudios lizenzieren. Mögliche Kandidaten sind Harrison Ford, Samuel L. Jackson, Michael J. Fox, Bill Murray, Arnold Schwarzenegger und Tom Cruise.

10. Filmstudios werden Fortsetzungen legendärer Franchises ankündigen.

11. Filmklassiker werden sorgfältig restauriert, die Bildqualität auf 8K und der Ton auf gestochen scharfes Dolby Digital verbessert. Mögliche Kandidaten: Die ursprüngliche Star Wars-Trilogie und klassische Disney-Animationen wie Schneewittchen und Pinocchio.

2025: Filmindustrie

12. Netflix wird eine Funktion einführen, mit der Benutzer aus einer Bibliothek von Schauspielern auswählen und ihre Lieblingsfilme mit diesen Schauspielern visualisieren können. So könnten Zuschauer beispielsweise Sean Connery als James Bond in allen Bond-Filmen auswählen und so eine tadellose Kinoillusion erleben.

2026: Filmindustrie

13. Netflix wird einen Premium-Dienst anbieten, der es den Zuschauern gegen eine zusätzliche Gebühr ermöglicht, ihr Gesicht auf die Charaktere ihrer Lieblingsserie zu legen.

2025: Unterhaltungs-/Geschäftsbranche

14. Ausgewählte Künstler und Einzelpersonen werden eine virtuelle Persona entwerfen und vermarkten. Diese Persona wird an der Börse handelbar sein, was Investoren die Möglichkeit gibt, Anteile daran zu erwerben. Ein Hauptkandidat ist Elon Musk. Anteilseigner von „Elon-bot“ könnten auf eine spezielle App für persönliche Interaktionen zugreifen. Die KI, die auf einem ausgeklügelten Sprachmodell von x.ai basiert, wird anhand von Elons Tweets, Interviews und öffentlichen Kommentaren trainiert.