AI LAWYER: Hierbei befasste ich mich mit der Forschung und Prototypentwicklung eines deutschsprachigen Large Language Models. Dieses Modell basiert auf instruction based learning (RLHF) und ist darauf ausgerichtet, in einem rechtlichen Kontext eigenständig relevante Informationen zu verstehen, anwendbare Rechtszusammenhänge zu identifizieren und zielgerichtete Fragen zu stellen.
INFORMATION RETRIEVAL (LLM): Ich habe erfolgreich Information Retrieval Pipelines entwickelt, die durch die Nutzung einer vektorisierten Wissensdatenbank kontextuelle Informationen für Large Language Models wie ChatGPT bereitstellen. Diese Technologie ermöglicht personalisierte und faktenbasierte Interaktionen mit Chatbots. Die Umsetzung erfolgte auf AWS und wurde mittels Terraform konfiguriert, um eine effiziente Verwaltung von Authentifizierung, Lastenausgleich und anderen Schlüsselfunktionen sicherzustellen.
INFORMATION EXTRACTION: Ein Schwerpunkt meiner Tätigkeit lag auf der Entwicklung von Informationsextraktionsmodellen im juristischen Kontext. Dabei stand die Erkennung relevanter Details (Named Entity Recognition - NER) in Kundenkorrespondenz, Gerichtsdokumenten und Versicherungsunterlagen im Fokus. Neben der Nutzung von Transformers-basierten Architekturen implementierte ich auch ein Optical Character Recognition (OCR) Modell. Dies ermöglichte die Extraktion von Informationen aus Bildern, wobei eine Kombination aus YOLOv5 und TrOCR zum Einsatz kam. Die gesamte Entwicklungsphase, inklusive Modelltraining und -evaluation, wurde auf AWS Sagemaker durchgeführt und in MLflow dokumentiert.
DOCUMENT CLASSIFICATION: In meiner Rolle als Machine Learning Engineer habe ich Dokumentklassifikationsmodelle für SCAILEX und deren SaaS-Plattform entwickelt. Diese Modelle verarbeiten jährlich über 500.000 Dokumente aus unterschiedlichen Quellen. Mit innovativen Ansätzen wie SWEM und Transformers haben wir eine Automatisierungsrate von 60% bei einer Genauigkeit von 95% erreicht. Die gesamte Modellentwicklung wurde auf AWS Sagemaker durchgeführt und in MLflow verwaltet, um eine effiziente und transparente Entwicklung sicherzustellen.
Als Data Scientist bei einem IT-Dienstleister für Banken habe ich KI-/ML-Anwendungen im Bankenumfeld entwickelt:
AI LAWYER: Hierbei befasste ich mich mit der Forschung und Prototypentwicklung eines deutschsprachigen Large Language Models. Dieses Modell basiert auf instruction based learning (RLHF) und ist darauf ausgerichtet, in einem rechtlichen Kontext eigenständig relevante Informationen zu verstehen, anwendbare Rechtszusammenhänge zu identifizieren und zielgerichtete Fragen zu stellen.
INFORMATION RETRIEVAL (LLM): Ich habe erfolgreich Information Retrieval Pipelines entwickelt, die durch die Nutzung einer vektorisierten Wissensdatenbank kontextuelle Informationen für Large Language Models wie ChatGPT bereitstellen. Diese Technologie ermöglicht personalisierte und faktenbasierte Interaktionen mit Chatbots. Die Umsetzung erfolgte auf AWS und wurde mittels Terraform konfiguriert, um eine effiziente Verwaltung von Authentifizierung, Lastenausgleich und anderen Schlüsselfunktionen sicherzustellen.
INFORMATION EXTRACTION: Ein Schwerpunkt meiner Tätigkeit lag auf der Entwicklung von Informationsextraktionsmodellen im juristischen Kontext. Dabei stand die Erkennung relevanter Details (Named Entity Recognition - NER) in Kundenkorrespondenz, Gerichtsdokumenten und Versicherungsunterlagen im Fokus. Neben der Nutzung von Transformers-basierten Architekturen implementierte ich auch ein Optical Character Recognition (OCR) Modell. Dies ermöglichte die Extraktion von Informationen aus Bildern, wobei eine Kombination aus YOLOv5 und TrOCR zum Einsatz kam. Die gesamte Entwicklungsphase, inklusive Modelltraining und -evaluation, wurde auf AWS Sagemaker durchgeführt und in MLflow dokumentiert.
DOCUMENT CLASSIFICATION: In meiner Rolle als Machine Learning Engineer habe ich Dokumentklassifikationsmodelle für SCAILEX und deren SaaS-Plattform entwickelt. Diese Modelle verarbeiten jährlich über 500.000 Dokumente aus unterschiedlichen Quellen. Mit innovativen Ansätzen wie SWEM und Transformers haben wir eine Automatisierungsrate von 60% bei einer Genauigkeit von 95% erreicht. Die gesamte Modellentwicklung wurde auf AWS Sagemaker durchgeführt und in MLflow verwaltet, um eine effiziente und transparente Entwicklung sicherzustellen.
Als Data Scientist bei einem IT-Dienstleister für Banken habe ich KI-/ML-Anwendungen im Bankenumfeld entwickelt: