Wir freuen uns, eine neue Publikation in Methods in Ecology and Evolution über ELIE vorzustellen. Dieses Projekt dient als wichtiger technologischer Rahmen, der die laufenden Entwicklungen innerhalb von ELIO am Museum für Naturkunde Berlin ergänzt. Da beide Projekte an ähnlichen Lösungen zur Digitalisierung arbeiten, bietet ELIE wertvolle Synergien für unsere Arbeit.
ELIE: 87 % weniger manueller Aufwand. 🚀
Während Naturkundemuseen Milliarden von Insektenpräparaten kuratieren, stellt die Extraktion der Metadaten von den Etiketten seit langem einen massiven manuellen Engpass dar. Unter der Leitung von Margot Belot und Théo Léger wurde die semi-automatisierte ELIE-Pipeline entwickelt, um diese Lücke effizient zu schließen.
⚙️ Wie ELIE funktioniert (kurz zusammengefasst):
- Intelligente Erkennung: Das System nutzt Computer Vision (CNNs), um Etiketten zu erkennen und zwischen gedrucktem und handschriftlichem Text zu unterscheiden.
- Effiziente Extraktion: Gedruckte Etiketten werden mit hochpräziser Texterkennung (OCR via Google Vision oder Tesseract) verarbeitet.
- Text-Clustering: Anstatt jedes einzelne Etikett einzeln zu bearbeiten, gruppiert ELIE identische oder ähnliche Texte.
📊 Die Ergebnisse:
Benchmarks zeigten, dass ELIE bis zu 98 % der gedruckten Etiketten korrekt extrahieren kann. Dabei wurde der manuelle Aufwand um bis zu 87 % reduziert.
Hier geht es zum vollständigen Open-Access-Artikel: https://lnkd.in/d-T2ikMm
Wir gratulieren Margot und Théo ganz herzlich zu dieser Veröffentlichung und freuen uns riesig mit ihnen über den großartigen Erfolg ihrer Pipeline! ✨