04 Nov 2024
14:00  - 16:00

Europainstitut (Riehenstrasse 154), Pavillon 2, Seminarraum 00.002

Veranstalter:
RISE

Veranstaltungen, Workshop

RISE-Crashkurs "Informationsextraktion aus Bildern mit KI"

In diesem zweistündigen Kurs erfahren Sie, wie man mit multimodalen Large Language Models (wie ChatGPT-4o, Gemini 1.5, oder Claude Sonnet 3.5) strukturierte Informationen aus Bildern gewinnt.

Eine Karteikarte mit Text und der Text in strukturierter Form

In dieser zweistündigen, hybrid angebotenen Veranstaltung werden Sie lernen, wie multimodale Large Language Models, wie ChatGPT-4o, Gemini 1.5 oder Claude Sonnet 3.5, genutzt werden können, um strukturierte Informationen direkt aus Bildern zu extrahieren. Dabei entfällt der in herkömmlichen Methoden häufig notwendige Zwischenschritt der Texterkennung und -transkription (siehe bspw. Transkribus). 

Anhand konkreter Anwendungsbeispiele aus laufenden Forschungsprojekten wird der Kurs die praktischen Möglichkeiten und Grenzen dieser Technologie verdeutlichen. Dabei wird auch auf die technischen und methodischen Voraussetzungen eingegangen, die für eine erfolgreiche Implementierung erforderlich sind. Zusätzlich werden Aspekte der Datenqualität, die FAIRness (Findability, Accessibility, Interoperability, Reusability) der extrahierten Daten sowie die damit verbundenen Kosten betrachtet und reflektiert.

Der Kurs richtet sich an Forschende und Studierende der Sozial- und Geisteswissenschaften. Die Teilnehmerzahl ist jeweils auf 15 Personen (vor Ort) pro Termin begrenzt. Bei Bedarf kann der Kurs in englischer Sprache angeboten werden. Fragen und Beiträge auf Englisch sind unabhängig von der Kurssprache natürlich jederzeit willkommen.

Die Plätze werden nach dem first-come-first-served Prinzip vergeben. Jetzt anmelden.


Veranstaltung übernehmen als iCal