QuickAnnotator
Please use the following text to cite this item or export to a predefined format:
Jan Oliver Rüdiger, 2025,
QuickAnnotator, LINDAT/CLARIAH-CZ digital library at the Institute of Formal and Applied Linguistics (ÚFAL),
http://hdl.handle.net/11234/1-5965.
Authors
Item identifier
Project URL
Referenced by
Date issued
2025-07-01
Type
Language(s)
Description
Projektübersicht (Deutsch) - [English project description see below]
IDS.QuickAnnotator ist ein umfassendes, modular aufgebautes System zur effizienten, transparenten und reproduzierbaren Annotation von Textkorpora. Ziel des Projekts ist es, den gesamten Workflow von der Auswahl und Vorbereitung der Texte über die eigentliche Annotation bis hin zur Auswertung und Konvertierung der Ergebnisse zu unterstützen und zu automatisieren.
Das System besteht aus mehreren spezialisierten Komponenten, die jeweils einen klar abgegrenzten Aufgabenbereich abdecken:
IDS.QuickAnnotator.API
Die zentrale Server-Komponente stellt eine REST-basierte Web-API bereit, über die sämtliche Annotationen, Annotations-Jobs und Nutzerinteraktionen verwaltet werden. Sie sorgt für die Konsistenz der Daten und ermöglicht die Integration externer Tools und Clients.
IDS.QuickAnnotator.Client
Die Hauptoberfläche für Annotatoren bietet eine intuitive Benutzerführung und unterstützt die individuelle Bearbeitung und Verwaltung von Annotationen. Jeder Nutzer arbeitet mit eigenen Annotationen, wodurch eine klare Trennung und Nachvollziehbarkeit gewährleistet ist.
IDS.QuickAnnotator.Client.Selector
Dieses Tool unterstützt Hilfskraftbetreuer bei der Vorauswahl von Texten. Mithilfe von statistischem Sampling können gezielt relevante Textausschnitte für die Annotation zusammengestellt werden, um eine ausgewogene und repräsentative Stichprobe zu gewährleisten.
IDS.QuickAnnotator.CorpusPreSampler
Das Presampling-Modul automatisiert die statistische Vorauswahl und Bereinigung von Texten. Es bereitet die Daten für den IDS.QuickAnnotator.Client.Selector vor und stellt sicher, dass die zu annotierenden Texte den gewünschten Kriterien entsprechen.
IDS.QuickAnnotator.Processor
Dieses Modul konvertiert verschiedene Korpusformate (z. B. KorAP) in ein einheitliches, von der API verarbeitbares Format. Dadurch können unterschiedlich strukturierte Ausgangsdaten problemlos integriert und weiterverarbeitet werden.
IDS.QuickAnnotator.QafSampler
Der QafSampler ermöglicht eine quotenbasierte Auswahl von Texten, um bestimmte Kriterien oder Verteilungen innerhalb des Korpus gezielt abzubilden und die Zusammensetzung der Stichprobe zu steuern.
IDS.QuickAnnotator.Tool4.AnnotatedBy
Mit diesem Analyse-Tool lässt sich nachvollziehen, welche Texte und Textstellen von welchen Personen annotiert wurden. Es unterstützt die Qualitätssicherung, die Auswertung der Annotationen und die Dokumentation der Arbeitsprozesse.
IDS.QuickAnnotator.Tool4.ApplyAnnotatorFixes
Dieses Tool dient dazu, nachträgliche Korrekturen und Anpassungen an bestehenden Annotationen vorzunehmen, etwa um Fehler zu beheben oder die Datenqualität zu erhöhen.
IDS.QuickAnnotator.Tool4.CalcDiff
Das Berichtstool erstellt Auswertungen zu abgeschlossenen Annotationen, darunter Interannotator Agreement, DIFF-Ansichten im HTML-Format und Analyse-Diagramme zur Visualisierung der Ergebnisse. So können Unterschiede und Übereinstimmungen zwischen Annotatoren systematisch erfasst werden.
IDS.QuickAnnotator.Tool4.ConvertToCorpus
Nach Abschluss der Annotationen können die Korpora mit diesem Tool in verschiedene Zielformate (z. B. KorAP) konvertiert werden, um sie für weitere Analysen oder externe Anwendungen bereitzustellen.
IDS.QuickAnnotator.Tool4.ConvertToJournal
Dieses Modul konvertiert die annotierten Korpora in ein internes Journal-Format, das für spezifische Workflows und Dokumentationszwecke innerhalb des Projekts genutzt wird.
IDS.QuickAnnotator.Tool4.FindMatchSentences
Mit diesem Tool können übereinstimmende Sätze in verschiedenen annotierten Korpora gefunden und verglichen werden, was die Konsistenzprüfung und Qualitätssicherung erleichtert.
IDS.QuickAnnotator.Tool4.OnlyAnnotatedBy
Dieses Analyse-Tool identifiziert Annotationen, die ausschließlich von einem bestimmten Annotator erstellt wurden, und unterstützt so die gezielte Auswertung individueller Beiträge und die Überprüfung der Annotationstiefe.
IDS.QuickAnnotator.Tool4.RemoveAnnotator
Ermöglicht das nachträgliche Entfernen von Annotationen, beispielsweise wenn ein Annotator ausfällt oder Daten bereinigt werden müssen.
IDS.QuickAnnotator.Web
Die Web-Version des Clients befindet sich aktuell im Beta-Stadium und bietet eine moderne, browserbasierte Oberfläche für die Annotation. Sie ermöglicht ortsunabhängiges Arbeiten und eine einfache Integration in bestehende Workflows.
Alle Komponenten sind in separaten Unterordnern organisiert und greifen über klar definierte Schnittstellen ineinander. Die modulare Architektur erlaubt eine flexible Erweiterung und Anpassung an unterschiedliche Anforderungen und Korpusformate. So entsteht eine skalierbare Infrastruktur, die den gesamten Prozess von der Auswahl und Konvertierung der Texte bis zur Analyse und Auswertung der Annotationen abdeckt und eine hohe Datenqualität sowie Nachvollziehbarkeit sicherstellt.
project description (Englisch)
IDS.QuickAnnotator is a comprehensive, modular system for the efficient, transparent, and reproducible annotation of text corpora. The aim of the project is to support and automate the entire workflow, from the selection and preparation of texts to the actual annotation and evaluation and conversion of the results.
The system consists of several specialized components, each covering a clearly defined area of responsibility:
IDS.QuickAnnotator.API The central server component provides a REST-based web API that manages all annotations, annotation jobs, and user interactions. It ensures data consistency and enables the integration of external tools and clients.
IDS.QuickAnnotator.Client
The main interface for annotators offers intuitive user guidance and supports individual editing and management of annotations. Each user works with their own annotations, ensuring clear separation and traceability.
IDS.QuickAnnotator.Client.Selector
This tool supports assistant supervisors in the preselection of texts. With the help of statistical sampling, relevant text excerpts can be compiled for annotation in order to ensure a balanced and representative sample.
IDS.QuickAnnotator.CorpusPreSampler The presampling module automates the statistical preselection and cleaning of texts. It prepares the data for the IDS.QuickAnnotator.Client.Selector and ensures that the texts to be annotated meet the desired criteria.
IDS.QuickAnnotator.Tool4.AnnotatedBy
This analysis tool allows you to track which texts and text passages have been annotated by which individuals. It supports quality assurance, the evaluation of annotations, and the documentation of work processes.
IDS.QuickAnnotator.Tool4.ApplyAnnotatorFixes
This tool is used to make subsequent corrections and adjustments to existing annotations, for example to fix errors or improve data quality.
IDS.QuickAnnotator.Tool4.CalcDiff The reporting tool generates evaluations of completed annotations, including interannotator agreement, DIFF views in HTML format, and analysis diagrams for visualizing the results. This allows differences and similarities between annotators to be systematically recorded.
IDS.QuickAnnotator.Tool4.ConvertToCorpus
Once the annotations are complete, this tool can be used to convert the corpora into various target formats (e.g., KorAP) in order to make them available for further analysis or external applications.
IDS.QuickAnnotator.Tool4.ConvertToJournal This module converts the annotated corpora into an internal journal format that is used for specific workflows and documentation purposes within the project.
IDS.QuickAnnotator.Tool4.FindMatchSentences This tool can be used to find and compare matching sentences in different annotated corpora, which facilitates consistency checking and quality assurance.
IDS.QuickAnnotator.Tool4.OnlyAnnotatedBy
This analysis tool identifies annotations that were created exclusively by a specific annotator, thereby supporting the targeted evaluation of individual contributions and the review of annotation depth.
IDS.QuickAnnotator.Tool4.RemoveAnnotator
Enables annotations to be removed retrospectively, for example if an annotator is unavailable or data needs to be cleaned up.
IDS.QuickAnnotator.Web
The web version of the client is currently in beta and offers a modern, browser-based interface for annotation. It enables location-independent working and easy integration into existing workflows.
All components are organized in separate subfolders and interact via clearly defined interfaces. The modular architecture allows for flexible expansion and adaptation to different requirements and corpus formats. This creates a scalable infrastructure that covers the entire process from text selection and conversion to annotation analysis and evaluation, ensuring high data quality and traceability.
Subject(s)
Collections
Files in this item
- Name
- README.md
- Size
- 9.06 KB
- Format
- application/octet-stream
- Description
- Unknown
- MD5
- 9fca432cffbcfebfa1ff41ea08fc0db9

The file preview has not been generated yet. Please try again later or contact the system administrator lindat-help@ufal.mff.cuni.cz
- Name
- IDS.QuickAnnotator.API.zip
- Size
- 462.53 KB
- Format
- application/zip
- Description
- Zip
- MD5
- c346b9897f570942e33ad1a35dd1221c

- Name
- IDS.QuickAnnotator.Client.zip
- Size
- 21.94 MB
- Format
- application/zip
- Description
- Zip
- MD5
- 8fc43b2420c82ab4c0afe0f20d1b3ea0

-
- System.Runtime.CompilerServices.Unsafe.dll18 kB
- Telerik.WinControls.ChartView.dll637 kB
- Telerik.WinControls.RadChart.xml966 kB
- Telerik.WinControls.Themes.HighContrastBlack.dll269 kB
- Telerik.WinControls.RadMap.xml802 kB
- Telerik.WinControls.PdfViewer.xml123 kB
- Telerik.WinControls.UI.Design.dll3 MB
- Telerik.WinControls.RadDiagram.xml1 MB
- System.Memory.dll141 kB
- Telerik.WinControls.PivotGrid.xml704 kB
- System.Text.Json.xml557 kB
- Telerik.Windows.Documents.Spreadsheet.FormatProviders.Pdf.xml10 kB
- Telerik.WinControls.RadDock.dll890 kB
- Telerik.WinControls.RadWebCam.xml30 kB
- Microsoft.mshtml.dll7 MB
- Microsoft.Bcl.AsyncInterfaces.xml30 kB
- System.ValueTuple.dll73 kB
- System.Runtime.CompilerServices.Unsafe.xml21 kB
- MediaFoundation.dll291 kB
- Telerik.Windows.Documents.Spreadsheet.FormatProviders.Xls.dll3 MB
- Telerik.WinControls.ChartView.xml637 kB
- Telerik.WinControls.RadSpreadsheet.dll.config161 B
- Telerik.WinControls.RadMarkupEditor.dll172 kB
- Telerik.WinControls.UI.dll6 MB
- IDS.QuickAnnotator.Client.application2 kB
- Telerik.Windows.Documents.Fixed.dll2 MB
- IDS.QuickAnnotator.Client.pdb299 kB
- TelerikCommon.dll909 kB
- Telerik.WinControls.RichTextEditor.dll11 MB
- System.Memory.xml203 kB
- System.IO.Pipelines.dll82 kB
- IDS.QuickAnnotator.Client.exe336 kB
- Telerik.WinControls.RadDock.xml310 kB
- System.ValueTuple.xml83 kB
- Newtonsoft.Json.dll695 kB
- Telerik.Windows.Documents.Spreadsheet.FormatProviders.Xls.xml2 MB
- System.Buffers.dll23 kB
- Telerik.WinControls.RadMarkupEditor.xml14 kB
- Telerik.WinControls.UI.xml4 MB
- Telerik.Windows.Documents.Spreadsheet.FormatProviders.OpenXml.dll451 kB
- Telerik.Windows.Documents.Fixed.xml1 MB
- Telerik.WinControls.RichTextEditor.xml2 MB
- Telerik.WinControls.dll4 MB
- Telerik.WinControls.GridView.dll1 MB
- System.IO.Pipelines.xml40 kB
- Telerik.Windows.Documents.Spreadsheet.dll2 MB
- RestSharp.dll208 kB
- System.Threading.Tasks.Extensions.dll27 kB
- System.Numerics.Vectors.dll107 kB
- Telerik.Licensing.Runtime.dll116 kB
- Newtonsoft.Json.xml696 kB
- System.Buffers.xml10 kB
- Telerik.Windows.Documents.Core.dll1 MB
- IDS.QuickAnnotator.Client.exe.manifest34 kB
- Telerik.WinControls.Scheduler.dll1018 kB
- Telerik.Windows.Documents.Spreadsheet.FormatProviders.OpenXml.xml9 kB
- Telerik.WinControls.RadSpreadsheet.dll3 MB
- TelerikData.dll661 kB
- Telerik.WinControls.xml1006 kB
- Telerik.WinControls.GridView.xml2 MB
- Telerik.Windows.Documents.Spreadsheet.xml1 MB
- RestSharp.xml169 kB
- System.Text.Encodings.Web.dll77 kB
- IDS.QuickAnnotator.Client.exe.config2 kB
- System.Threading.Tasks.Extensions.xml41 kB
- System.Numerics.Vectors.xml187 kB
- Telerik.WinControls.RadChart.dll730 kB
- Telerik.WinControls.RadMap.dll605 kB
- Telerik.WinControls.Themes.Material.dll243 kB
- Telerik.WinControls.PdfViewer.dll329 kB
- Microsoft.AnalysisServices.AdomdClient.dll558 kB
- Telerik.WinControls.RadDiagram.dll1 MB
- Telerik.Windows.Documents.Core.xml559 kB
- Telerik.WinControls.Scheduler.xml682 kB
- Telerik.WinControls.PivotGrid.dll951 kB
- TelerikData.xml384 kB
- Telerik.WinControls.RadSpreadsheet.xml1 MB
- System.Text.Json.dll709 kB
- Telerik.Windows.Documents.Spreadsheet.FormatProviders.Pdf.dll51 kB
- Telerik.Windows.MediaFoundation.dll90 kB
- Telerik.WinControls.RadWebCam.dll53 kB
- Microsoft.Bcl.AsyncInterfaces.dll25 kB
- System.Text.Encodings.Web.xml61 kB
- Name
- IDS.QuickAnnotator.Tool4.ConvertToCorpus.zip
- Size
- 1.87 MB
- Format
- application/zip
- Description
- Zip
- MD5
- 8b0d06f962dc61d056736bd2981a4665

-
- CsvHelper.dll220 kB
- IDS.QuickAnnotator.API.deps.json2 kB
- IDS.QuickAnnotator.Tool4.ConvertToCorpus.runtimeconfig.json147 B
- IDS.QuickAnnotator.Tool4.ConvertToCorpus.exe148 kB
- TFRES.DotNet5.pdb25 kB
- PostSharp.dll236 kB
- CorpusExplorer.Sdk.dll.config4 kB
- CorpusExplorer.Sdk.Diagnostic.dll.config782 B
- Microsoft.Bcl.AsyncInterfaces.dll18 kB
- IDS.QuickAnnotator.API.pdb14 kB
- K4os.Compression.LZ4.Streams.dll83 kB
- IDS.QuickAnnotator.Tool4.ConvertToCorpus.pdb12 kB
- K4os.Compression.LZ4.dll69 kB
- CorpusExplorer.Sdk.Diagnostic.dll8 kB
- K4os.Hash.xxHash.dll13 kB
- CorpusExplorer.Sdk.Extern.Json.dll95 kB
- HtmlAgilityPack.dll163 kB
- Newtonsoft.Json.dll695 kB
- LICENSE.txt34 kB
- IDS.QuickAnnotator.Tool4.ConvertToCorpus.deps.json59 kB
- BitCutStudios.CorpusExplorer.dll47 kB
- CorpusExplorer.Sdk.dll1 MB
- Polenter.SharpSerializer.dll245 kB
- Microsoft.Bcl.HashCode.dll19 kB
- System.Diagnostics.DiagnosticSource.dll182 kB
- layers.json215 B
- Microsoft.OpenApi.dll237 kB
- CorpusExplorer.Sdk.Diagnostic.pdb7 kB
- TFRES.DotNet5.dll42 kB
- CorpusExplorer.Sdk.Extern.Json.pdb325 kB
- IDS.QuickAnnotator.API.runtimeconfig.json147 B
- CorpusExplorer.Sdk.Extern.Json.dll.config3 kB
- System.IO.Pipelines.dll82 kB
- BitCutStudios.CorpusExplorer.pdb23 kB
- settings.bin411 B
- CorpusExplorer.Sdk.pdb575 kB
- IDS.QuickAnnotator.API.dll13 kB
- System.Runtime.CompilerServices.Unsafe.dll18 kB
- CorpusExplorer.Sdk.xml581 kB
- BitCutStudios.CorpusExplorer.dll.config1 kB
- IDS.QuickAnnotator.API.exe148 kB
- IDS.QuickAnnotator.Tool4.ConvertToCorpus.dll9 kB

