Zur Erstellung einer Lösung zum Intelligent Document Processing wurden Optical Character Recognition (OCR), Document Classification, Schlüsselinformationsextraktion (Key Information Extraction) und die Interaktion durch ein Large Language Model (LLM) mit den neuesten wissenschaftlichen Erkenntnissen entwickelt. Die Anforderung war, eine OCR-Lösung zu entwickeln, die auch für suboptimale Scans und Fotos eine hohe Genauigkeit liefert und flexibel auf mehrere Sprachen anwendbar ist, sowie für on-premise-Lösungen eingesetzt werden kann und so über den State-of-the-Art durch Tesseract & Co. hinausgeht.
In diesem KI-Projekt automatisierte ich die Audiodeskription gemäß den "full verbatim" und "clean verbatim" Regeln. Das Training erfolgte durch den Einsatz eines Voicebots, der auch dazu diente, die Ergebnisse zu überprüfen. Die technische Anbindung von APIs ermöglichte eine effiziente Integration von Spracherkennungs- und Textverarbeitungsdiensten. Zusätzlich beriet ich die Anwender ausführlich zur Funktionsweise der KI-Audiodeskription, um eine optimale Nutzung sicherzustellen.
Die Automatisierung nach "human in the loop"-Kriterien war sehr erfolgreich, den Anforderungen sowohl an "full verbatim" als auch "clean verbatim" wurde gerecht.
Öffentliche Profile wurden aus tagesaktuell aus Social Media Seiten gescraped und auf Basis ihrer Informationen an die passenden Akquisiteure geleitet. Es wurden automatisiert Nachrichten nach individuellen Templates versendet. Dabei wurde streng auf die Einhaltung regulatorischer Richtlinien und allgemeiner Geschäftsbedungen geachtet.
Programmierung nach den höchsten Standards von cleanem Code and best practices.
Gewissenhafte Dokumentation, ausgiebige Regressionstests.
Zur Erstellung einer Lösung zum Intelligent Document Processing wurden Optical Character Recognition (OCR), Document Classification, Schlüsselinformationsextraktion (Key Information Extraction) und die Interaktion durch ein Large Language Model (LLM) mit den neuesten wissenschaftlichen Erkenntnissen entwickelt. Die Anforderung war, eine OCR-Lösung zu entwickeln, die auch für suboptimale Scans und Fotos eine hohe Genauigkeit liefert und flexibel auf mehrere Sprachen anwendbar ist, sowie für on-premise-Lösungen eingesetzt werden kann und so über den State-of-the-Art durch Tesseract & Co. hinausgeht.
In diesem KI-Projekt automatisierte ich die Audiodeskription gemäß den "full verbatim" und "clean verbatim" Regeln. Das Training erfolgte durch den Einsatz eines Voicebots, der auch dazu diente, die Ergebnisse zu überprüfen. Die technische Anbindung von APIs ermöglichte eine effiziente Integration von Spracherkennungs- und Textverarbeitungsdiensten. Zusätzlich beriet ich die Anwender ausführlich zur Funktionsweise der KI-Audiodeskription, um eine optimale Nutzung sicherzustellen.
Die Automatisierung nach "human in the loop"-Kriterien war sehr erfolgreich, den Anforderungen sowohl an "full verbatim" als auch "clean verbatim" wurde gerecht.
Öffentliche Profile wurden aus tagesaktuell aus Social Media Seiten gescraped und auf Basis ihrer Informationen an die passenden Akquisiteure geleitet. Es wurden automatisiert Nachrichten nach individuellen Templates versendet. Dabei wurde streng auf die Einhaltung regulatorischer Richtlinien und allgemeiner Geschäftsbedungen geachtet.
Programmierung nach den höchsten Standards von cleanem Code and best practices.
Gewissenhafte Dokumentation, ausgiebige Regressionstests.