the bletchley circle san francisco

Vertreter von 10 Staaten und der Europäischen Union trafen sich im Mai 2024 in Kalifornien, um eine engere Zusammenarbeit bei der Prüfung von Modellen der Künstlichen Intelligenz (KI) zu vereinbaren. Diese Kooperation unter dem Namen The Bletchley Circle San Francisco zielt darauf ab, die nationalen Sicherheitsinstitute für KI besser zu vernetzen. Das Gremium knüpft an die Ergebnisse des ersten globalen KI-Sicherheitsgipfels an, der im November 2023 im britischen Bletchley Park stattfand.

An den zweitägigen Beratungen nahmen Delegationen aus Deutschland, Frankreich, Japan, Südkorea und den USA teil. Das Hauptziel der Verhandlungen bestand darin, gemeinsame Protokolle für die Bewertung von Risiken zu entwickeln, die von fortgeschrittenen Sprachmodellen ausgehen könnten. Laut einer offiziellen Erklärung des US-Handelsministeriums vereinbarten die Teilnehmer, technische Expertise auszutauschen und Forschungsergebnisse zu teilen, um globale Standards für die Sicherheit von Grenzmodellen zu etablieren.

Die Initiative reagiert auf die rasanten technologischen Fortschritte seit der Veröffentlichung von GPT-4. Nationale Behörden stehen vor der Herausforderung, dass die internen Testverfahren privater Unternehmen oft nicht für eine unabhängige Überprüfung zugänglich sind. Michelle Donelan, die britische Ministerin für Wissenschaft, Innovation und Technologie, betonte die Notwendigkeit, staatliche Kapazitäten zur Risikobewertung massiv auszubauen.

Die Rolle von The Bletchley Circle San Francisco in der globalen Regulierung

Innerhalb der internationalen Sicherheitsarchitektur übernimmt The Bletchley Circle San Francisco die Funktion eines operativen Kerns. Während politische Gipfeltreffen oft allgemeine Absichtserklärungen formulieren, konzentriert sich diese Arbeitsgruppe auf die technische Implementierung von Sicherheitsleitplanken. Die Teilnehmer einigten sich darauf, Informationen über neu entdeckte Schwachstellen in KI-Systemen in Echtzeit an die Partnerinstitute zu übermitteln.

Ein zentraler Aspekt der Arbeit liegt in der Definition von Schwellenwerten für die Rechenleistung. Ab einer gewissen Kapazität müssen Modelle laut den Plänen der Gruppe intensiveren Prüfzyklen unterzogen werden. Das deutsche Bundesministerium für Digitales und Verkehr verwies in diesem Kontext auf die Bedeutung des europäischen AI Acts, der bereits rechtliche Rahmenbedingungen für Hochrisiko-Systeme vorgibt.

Technische Harmonisierung der Testverfahren

Die Experten der beteiligten Institute arbeiten an einem standardisierten Framework für sogenannte Red Teaming-Übungen. Bei diesen Verfahren versuchen Prüfer gezielt, die Sicherheitsvorkehrungen einer KI zu umgehen, um potenziell gefährliche Ausgaben zu provozieren. Ein Bericht des National Institute of Standards and Technology (NIST) verdeutlichte, dass ohne einheitliche Messgrößen ein Vergleich der Sicherheitsniveaus verschiedener Anbieter unmöglich bleibt.

Die Harmonisierung umfasst auch die Kategorisierung von Risiken in den Bereichen Cybersicherheit und biologische Bedrohungen. Es besteht die Sorge, dass KI-Modelle Akteuren helfen könnten, komplexe Schadsoftware zu entwickeln oder Rezepte für biologische Kampfstoffe zu verfeinern. Durch die Bündelung der Ressourcen wollen die Staaten verhindern, dass Unternehmen ihre Entwicklungsprozesse in Regionen mit geringeren Sicherheitsstandards verlagern.

Beteiligung der Privatwirtschaft und Transparenzpflichten

Neben staatlichen Vertretern waren auch Führungskräfte führender KI-Laboratorien wie OpenAI, Anthropic und Google DeepMind in die Gespräche eingebunden. Diese Unternehmen sagten zu, den staatlichen Instituten vorab Zugang zu ihren neuesten Modellen zu gewähren. Diese Zusage ist rechtlich jedoch oft noch unverbindlich, was bei einigen Regulierungsbehörden auf Skepsis stößt.

🔗 Weiterlesen: diesen Leitfaden

Die Beteiligung der Industrie gilt als zweischneidig, da die Firmen ein starkes Interesse daran haben, ihre Geschäftsgeheimnisse zu schützen. Ein Sprecher von Anthropic erklärte, dass die Balance zwischen öffentlicher Sicherheit und dem Schutz des geistigen Eigentums gewahrt bleiben müsse. Dennoch signalisierten die Entwickler Bereitschaft, an der Erstellung eines freiwilligen Verhaltenskodex mitzuwirken.

Kritische Stimmen zur Wirksamkeit freiwilliger Zusagen

Menschenrechtsorganisationen und akademische Beobachter kritisieren die starke Fokussierung auf freiwillige Selbstverpflichtungen der Industrie. Die Organisation AlgorithmWatch wies darauf hin, dass ohne gesetzliche Sanktionen die Gefahr von „Safety Washing“ bestehe. Dabei könnten Unternehmen Sicherheitstests vorschieben, um strengere Gesetze zu verhindern.

Ein weiterer Kritikpunkt betrifft die mangelnde Repräsentation von Staaten des globalen Südens in diesem Prozess. Die Verhandlungen finden bisher primär in einem Kreis wirtschaftlich starker Demokratien statt. Kritiker argumentieren, dass die Auswirkungen von KI-Systemen weltweit zu spüren seien und daher eine breitere internationale Basis für solche Sicherheitsgremien erforderlich sei.

Technologische Herausforderungen bei der Modellprüfung

Die physikalische Komplexität moderner KI-Systeme erschwert die Arbeit der Sicherheitsinstitute erheblich. Ein Modell besteht oft aus Milliarden von Parametern, deren Wechselwirkungen selbst für die Entwickler nicht immer vollständig vorhersehbar sind. Das britische AI Safety Institute gab bekannt, dass aktuelle Evaluierungsmethoden noch nicht ausreichen, um alle potenziellen Risiken lückenlos abzudecken.

✨ Nicht verpassen: diese Geschichte

Besondere Aufmerksamkeit widmet das Gremium dem Problem der Halluzinationen, bei denen KI-Systeme faktisch falsche Informationen mit hoher Überzeugungskraft generieren. In sicherheitskritischen Bereichen wie der Medizin oder der Justiz kann dies fatale Folgen haben. Die Forscher in San Francisco diskutierten Ansätze, wie durch zusätzliche Überwachungsschichten die Verlässlichkeit der Ausgaben erhöht werden kann.

Finanzierung und personelle Ressourcen der Institute

Der Aufbau schlagkräftiger Prüfstellen erfordert enorme finanzielle Mittel und spezialisiertes Personal. Die USA haben bereits signifikante Budgets für das NIST AI Safety Institute bereitgestellt, um Spitzenforscher aus der Privatwirtschaft abzuwerben. In Europa gestaltet sich die Personalsuche schwieriger, da die Gehälter im öffentlichen Dienst oft nicht mit den Angeboten der Tech-Giganten konkurrieren können.

Laut einer Analyse der Stanford University wandern viele hochqualifizierte KI-Forscher nach ihrer Promotion direkt in die Industrie ab. Dies führt zu einer Informationsasymmetrie zwischen den Regulierungsbehörden und den regulierten Unternehmen. Die Kooperation innerhalb der Staatengruppe soll diesen Nachteil durch den gemeinsamen Aufbau von Rechenkapazitäten und Datensätzen ausgleichen.

Geopolitische Implikationen der KI-Sicherheit

Die Gründung von The Bletchley Circle San Francisco ist auch vor dem Hintergrund des systemischen Wettbewerbs mit China zu sehen. Während westliche Staaten auf gemeinsame Sicherheitsstandards setzen, verfolgt Peking eine eigene Strategie zur Kontrolle von Algorithmen. Die US-Regierung hat den Export von Hochleistungschips nach China bereits eingeschränkt, um die Entwicklung militärisch nutzbarer KI zu verlangsamen.

👉 Siehe auch: tradus din română în engleză

Einige Analysten befürchten, dass die Welt auf eine Fragmentierung der KI-Standards zusteuert. Sollten sich unterschiedliche Blöcke mit inkompatiblen Sicherheitsvorgaben bilden, könnte dies die globale Zusammenarbeit in der Wissenschaft behindern. Das Stockholm International Peace Research Institute (SIPRI) warnt davor, dass ein Wettrüsten bei der KI-Entwicklung die Stabilität der internationalen Sicherheit gefährden könnte.

Zukünftige Ausrichtung und nächste Schritte

Die nächste Phase der Zusammenarbeit sieht vor, die Ergebnisse der technischen Arbeitsgruppen in konkrete regulatorische Empfehlungen zu überführen. Ein Folgetreffen ist für das Jahr 2025 geplant, um den Fortschritt bei der Implementierung der vereinbarten Testverfahren zu überprüfen. Ein zentraler Punkt wird dabei die Frage sein, wie Open-Source-Modelle in das Sicherheitskonzept integriert werden können.

Während proprietäre Modelle relativ einfach kontrolliert werden können, stellt die Verbreitung von quelloffenen Systemen die Behörden vor neue Probleme. Diese Modelle können von jedermann heruntergeladen und ohne Aufsicht modifiziert werden. Die Staatengruppe muss klären, ob für solche Systeme andere Haftungsregeln gelten müssen, um die Innovation nicht zu ersticken und gleichzeitig die öffentliche Sicherheit zu gewährleisten.