Viele Unternehmen stehen vor der Herausforderung, neue Produktanforderungen mit älteren Versionen abzugleichen. In diesem Kontext wird Optical Character Recognition (OCR) und Generative AI eingesetzt, um den Vergleich von PDFs zu automatisieren und Mitarbeitende zu entlasten.
Inhalt:
Warum ist das relevant?
Dynamische Arbeitswelt mit hoher Fluktuation
Wissenslücken bei erfahrenen Mitarbeitern
Generative AI ermöglicht Content-Erzeugung: Texte, Bilder, Python Code
RAG (Retrieval Augmented Generation): Chat GPT trifft Unternehmenswissen
Retrieval Augmented Generation (RAG) kombiniert Antworten in natürlicher Sprache von Chat GPT mit dem Wissen des Unternehmens. Dies geschieht ohne ein neues Training des Modells und erfordert lediglich die Dokumente bzw. Wissenssammlung des Unternehmens.
Das Vorgehen wird in zwei Schritte unterteilt:
Dokumentenextraktion: Die Dokumente werden extrahiert, die am besten zur Anfrage des Nutzers passen. Dafür wird eine sogenannte Vektorsuche verwendet. Die Dokumente werden in einer Dokumentendatenbank gesammelt, die Vektorsuche findet nun die Dokumente, die zu der Anfrage passen.
Generierung der Antwort: Die Frage des Nutzers wird mit den extrahierten Dokumenten angereichert, um mithilfe einer Generativen AI eine Antwort zu erzeugen. Es ist wichtig, kritisch zu bleiben, da Generative AI Fehler machen kann. Daher sollten die Quellen referenziert werden.
Beispiel aus unserem Chatbot:
Tools aus Microsoft Azure:
Azure App Services: Frontend- und Backend-Services
Azure Cosmos DB: Dokumentendatenbank mit Vektorsuche
Azure Open AI: Schnittstelle zu GPT-3.5 und Embeddings
Wie funktioniert es?
Datenbankaufbau: Artikel aus Confluence werden exportiert und mit Metadaten angereichert.
Vektorisierung: Dokumente werden vektorisiert, indem Azure Open AI Embeddings erstellt.
App Service: Stellt das User-Interface bereit, generiert Vektoren, führt Vektorsuche durch und leitet Anfragen an den OpenAI Bot weiter.
Cosmos DB: Vergleicht die Ähnlichkeit zwischen Suchanfrage und Dokumenten.
Open AI: Generiert Antworten basierend auf extrahierten Dokumenten.
Zusammenfassung:
Durch die Kombination von Cosmos DB und Azure Open AI lässt sich ein maßgeschneiderter Assistent erstellen. Dieser kann Fragen beantworten, Dokumente vergleichen und sogar Funktionen aufrufen. Die Methode erfordert kein Modelltraining mit eigenen Daten und bietet Potenzial für weitere Funktionen wie Funktion Calling in der zweiten Blogserie. Entdecken Sie die Zukunft der Wissensextraktion mit Generative AI!
Comments