Dokumentation in KI-Projekten: Wer schreibt, der bleibt!

In der Welt der künstlichen Intelligenz (KI) ist die Implementierung eines Systems nur ein Teil des Puzzles auf dem Weg der wirtschaftlichen Nutzung von KI im Unternehmen. Ein ebenso kritischer Aspekt ist die Dokumentation, die oft übersehen wird, aber für den langfristigen Erfolg des KI-Projekts entscheidend ist. Eine gründliche Dokumentation dient nicht nur als Wegweiser für das aktuelle Team, sondern auch als unverzichtbare Ressource für zukünftige Mitarbeiter, die das System warten, aktualisieren oder erweitern müssen. Dabei können die seit Jahrzehnten entwickelten Prinzipien der Software-Dokumentation auf die Dokumentation von KI-Systemen übertragen werden. Beide Bereiche profitieren von klarer Strukturierung, detaillierter Beschreibung der Komponenten und Prozesse sowie der Nachvollziehbarkeit von Entscheidungen und Änderungen. Bei KI-Systemen ist es besonders wichtig, auch die Datenquellen, Trainingsmethoden, Modelle, Algorithmen und Entscheidungslogiken zu dokumentieren. Dies fördert Transparenz und Vertrauen in die KI-Systeme und erleichtert die Wartung, das Debugging und die Weiterentwicklung.
Die Implementierung eines KI-Systems sollte auf der einen Seite zwar immer als Prozess, gleichzeitig aber als Projekt mit einem klaren Anfang und Ende betrachtet werden. Ein interdisziplinäres Team, bestehend aus Datenspezialisten, Entwicklern, Projektmanagern und Stakeholdern, sollte von Anfang an gebildet und einbezogen werden. Jedes Teammitglied bringt seine Perspektive ein, die hilft, die Dokumentation aus verschiedenen Blickwinkeln zu gestalten und sicherzustellt, dass alle Aspekte des Systems erfasst werden.
Damit die implementierte KI auch in Jahren noch nachvollzogen werden kann, ist eine zentrale Dokumentationsplattform unerlässlich. Sie dient als einzige Quelle, wo alle Informationen gesammelt, aktualisiert und von jedem Teammitglied eingesehen werden können. Dies fördert die Konsistenz und erleichtert die Suche nach Informationen, wenn sie benötigt werden. Es sollte auch eine Person bestimmt werden, welche die eigentliche Dokumentation verantwortlich führt, also die Dokumentenhoheit hat. Diese sollte auf Seiten des Ki-System-Anbieters sitzen. Das Endprodukt, die Dokumentation selbst, gehört nach Fertigstellung und Abnahme dann aber dem KI-Anwender.
Bevor man auf die vorhandenen Daten im Unternehmen eine KI legen kann, muss zunächst auch die vorhandene Infrastruktur erfasst werden. Die Infrastruktur ist das Rückgrat jedes KI-Systems. Die Dokumentation sollte Details über die verwendete und benötigte Hardware, Netzwerkkonfigurationen und Speicherlösungen enthalten. Diese Informationen sind entscheidend, um das System in verschiedenen Umgebungen zu replizieren oder Probleme zu diagnostizieren, die während des Betriebs auftreten könnten.
Die Dokumentation der Schulungsdaten und die Definition der erwarteten Ergebnisse sind entscheidende Bestandteile der KI-Dokumentation. Diese müssen unbedingt in den Prozess integriert werden. Dies umfasst die Herkunft und Eigentümerschaft der Daten, die Methoden zur Datensammlung, die Aufbereitung und Bereinigung der Daten sowie die Aufteilung in Trainings-, Validierungs- und Testläufe. Es sollte auch dokumentiert werden, wie die Daten das Modell beeinflussen und welche ethischen Überlegungen getroffen wurden, um Verzerrungen zu vermeiden. Die Daten sind das Herzstück eines jeden KI-Modells. Die Dokumentation sollte Informationen über die Datenquellen, Datenaufbereitung, Feature-Auswahl und alle Transformationen enthalten, die während des Trainingsprozesses durchgeführt wurden. Dabei ist wichtig, klare Ziele für das, was das KI-System erreichen soll, zu definieren. Dazu gehören die erwarteten Outputs, die Leistungskriterien und wie die Ergebnisse gemessen und bewertet werden (Benchmarks). Diese Definitionen helfen dabei, die Genauigkeit und Zuverlässigkeit des KI-Systems zu überprüfen und sicherzustellen, dass es den Anforderungen des Unternehmens entspricht.
Ebenso wichtig ist die Dokumentation des Modells selbst – von der Architektur bis zu den Hyperparametern und dem Trainingsprozess. Auch sollten die durchgeführte Risikoanalyse und Einordnung in Risiko-Kategorien nach dem AI-Act festgehalten werden. Diese Transparenz ist entscheidend für die Reproduzierbarkeit der Ergebnisse und das Verständnis der Entscheidungsfindung des Modells. In einer Zeit, in der KI-Systeme zunehmend reguliert werden, ist die Dokumentation auch ein Schlüssel zur Einhaltung von Standards und Gesetzen. Sie ermöglicht es Organisationen, Ämtern, Kunden und Mitarbeitern die Entscheidungsfindung der im Unternehmen eingesetzten KI-Systeme zu erklären und zu rechtfertigen, was für die Vertrauensbildung bei Kunden und Regulierungsbehörden unerlässlich ist.
Die Dokumentation bei der Implementierung eines KI-Systems ist eine Aufgabe, die sorgfältige Planung, Durchführung und Wartung erfordert. Sie ist ein lebendiges Dokument, das sich mit dem System weiterentwickelt. Indem der Anwender gemeinsam mit dem KI-System-Anbieter die Prinzipien der IT-Dokumentation auf KI-Systeme anwenden, wird eine solide Grundlage für den Erfolg und die Skalierbarkeit der KI-Initiativen geschaffen.