Bei der Berlin Buzzwords 2023, einer der führenden europäischen Konferenzen für moderne Dateninfrastruktur, Suche und maschinellem Lernen, präsentieren und diskutieren Data Scientists über Branchentrends. Qi Wu und Bertram Sändig von der KI-Agentur ontolux gingen in ihrem Vortrag auf domänenspezifische Ontologien im Machine Learning für die IT-Sicherheitsbranche ein.

Vom 18. bis 20. Juni 2023 fand die Buzzwords wieder live in Berlin statt.
Die Konferenz versteht sich als eine Art Plattform für Entwickler, Ingenieure, IT-Architekten, Analysten und Datenwissenschaftler, die sich mit Information Retrieval, der Durchsuchbarkeit großer Datenmengen, NoSQL und Big Data Processing beschäftigen. In vier parallelen Slots wurden mehr als 60 Vorträge in Englisch gehalten.  

Qi und Bertram zeigten am 19.06.2023 um 16:30 Uhr in der Kulturbrauerei (Palais Atelier) mit ihrem Vortrag – Machine Learning mit bereichsspezifischer Ontologie für die IT-Sicherheitsbranche, wie durch die Kombination von Ontologie und maschinellem Lernen ein leistungsstarkes Werkzeug zur Analyse von IT-Sicherheitsdokumenten entwickelt werden kann.

Inhalt des Vortrages: 

Das BSI beobachtet und beurteilt die aktuelle IT-Sicherheitslage und deren langfristige Veränderung. Dazu gehören z.B. Hackergruppen oder neu entdeckte Sicherheitslücken. Zu diesem Zweck werden diverse Nachrichten-Quellen beobachtet und wichtige Informationen extrahiert, um aktuelle Trends zu erkennen und einen Überblick zu gewinnen.

Zur Optimierung dieses Prozesses entwickeln wir gemeinsam mit dem BSI ein System, das die Arbeit unterstützt, indem  Dokumente einer automatischen  Analyse mit Verfahren wie Named Entity Recognition (NER) und Named Entity Linking (NEL) unterzogen werden. Während NER die Zuordnung von Textstellen zu vorgegebenen Klassen durch Machine Learning bezeichnet (z.B. „Browser“ zu Software), wird beim NEL eine Zuordnung zu konkreten Entitäten einer Ontologie angestrebt (z.B. „DOS“ zu „Disk Operating System“). Wir erklären, wie wir mit der besonderen Herausforderung begrifflicher Ambiguitäten umgehen („DOS“ steht nicht nur für „Disk Operating System“ sondern auch für „Denial of Service“). Der Vortrag gab einen Einblick in unser Entitäten-Erkennungs-System. 

Programm zur Veranstaltung

Mehr zum Thema Anwendung von NLP für die Auswertung (un)strukturierter Lageinformationen

 

Veröffentlichung am 13.06.2023