IDE@DHd 2014 in Passau

DHd 2014 PassauVom 25. bis 28. März 2014 fand die erste Jahrestagung des Verbandes „Digital Humanities im deutschsprachigen Raum“ unter dem Titel „Digital Humanities – methodischer Brückenschlag oder ‚feindliche Übernahme‘?“ an der Universität Passau statt.

Das IDE-Mitglied Malte Rehbein und sein Passauer Lehrstuhlteam organisierten eine reibungslose und motivierende Tagung mit über 350 TeilnehmerInnen aus Deutschland, Österreich und der Schweiz sowie Gästen aus nicht-deutschsprachigen Ländern, bei der die vorherrschende Aufbruchstimmung in den Digital Humanities greifbar wurde.

Das IDE war mit zahlreichen Beiträgen vertreten:

Patrick Sahle sprach zur Positionierung, Definition und Abgrenzung der Digital Humanities und leitete eine Sektion zu Editionen und Editionstechniken, Georg Vogeler brachte Vorschläge zur digitalen Edition mittelalterlicher und frühneuzeitlicher Rechnungsbücher ein, die auf die Einbindung einer RDF-Repräsentation von Inhalten digital edierter Texte zielen, und Torsten Schaßan präsentierte gemeinsam mit Daniel Fecker die Herausforderungen der Mustererkennung zur automatisierten Schreiberhanderkennung in mittelalterlichen und frühneuzeitlichen Handschriften. In der Poster-Sektion präsentierte Simone Kronenwett gemeinsam mit Patrick Sahle das Datenzentrum des Cologne Center for eHumanities (CCeH) und Martina Semlak die digitale Edition der Werktagebücher von Hartmut Skerbisch. Die Posterbeiträge wurden beim Poster-Award in einer starken Konkurrenz von über 30 Beiträgen mit dem dritten bzw. zweiten Platz belohnt.

Die nächste Tagung des Verbandes DHd wird vom Zentrum für Informationsmodellierung – Austrian Centre for Digital Humanities an der Universität Graz veranstaltet und findet vom 23. bis 27. Februar 2015 statt. Save the date!

Spring School Digitale Editionen

In enger Kooperation mit der Universität Rostock veranstaltet das Institut für Dokumentologie und Editorik vom 10. bis 14.3.2014 eine Springschool in Rostock. Die School richtet sich an Anfänger in dem Bereich Digitale Editionen und vermittelt Grundkenntnisse in den X-Technologien sowie einführende Lehreinheiten zum Umgang und den Themen der Text Encoding Initiative. Sie richtet sich an NachwuchswissenschaftlerInnen aus dem Bereich der Geisteswissenschaften, die offen für den Einsatz moderner Techniken in ihrem jeweiligen Fachgebiet sind. Vorwissen über XML und TEI ist nicht notwendig.

Es hat sich auf den Lehrveranstaltungen des IDEs inzwischen eingebürgert, dass am Abend des ersten Tages eine ausgewiesene Kennerin der Digital Humanities einen öffentlichen Festvortrag halten wird. Dieses Jahr haben wir die Ehre, Frau Elisabeth Burr aus Leipzig begrüßen zu dürfen.

Die Springschools des IDE zeichnen sich durch einen hohen Betreuungsaufwand aus. Während der Vormittage werden in Frontalvorträgen einzelne Lehrinhalte vermittelt, am Nachmittag folgen dann praktische Übungen, die intensiv betreut werden. An den Nachmittagen ist es erwünscht, dass die TeilnehmerInnen an eigenen Editionsprojekten das am Vormittag gewonnene Wissen umsetzen.

Die Teilnahme an der Lehrveranstaltung wird mit zwei ECTS-Punkten belohnt. Für die Teilnahme an der Springschool wird ein geringer Unkostenbeitrag erhoben.

Das Programm der letzten School finden Sie hier.

Bei Interesse an einer Teilnahme schreiben Sie bitte eine formlose Email an … mit einer kleinen Projektskizze Ihres Editionsprojekts.

Programm

Veranstaltungsort

UB Rostock, Bereichsbibliothek Südstadt
Albert-Einstein-Str. 6
18059 Rostock
Raum 013

Programm

Montag, 10. März 2014

13:00–14:30
Begrüßung, Zielstellungen
Markus Schnöpf (Berlin)

15:00–16:30
Textcodierung mit XML
Ulrike Henny (Köln) / Patrick Sahle (Köln)

Materialien: Folien, Übungen
16:45–18:15
Abendvortrag: Digitale Editionen und der Status von Sprachen. Wo ist die Verbindung?
Elisabeth Burr (Universität Leipzig)

Materialien: Folien

Dienstag, 11. März 2014

9:00–10:30
Textnavigation mit XPath
Ulrike Henny (Köln) / Patrick Sahle (Köln)

Materialien: Folien, Übungen
11:00–12.30
Texttransformation mit XSLT
Ulrike Henny (Köln) / Patrick Sahle (Köln)

Materialien: FolienÜbungen

12:30–14:00 Mittagspause

14:00–15:30
Textpublikation mit X-Technologien
Ulrike Henny (Köln) / Patrick Sahle (Köln)

Materialien: Folien, Übung

16:00–18:00
Wozu und zu welchem Ende erstellt man Digitale Editionen?
Patrick Sahle (Köln)

Materialien: Folien

Mittwoch, 12. März 2014

9:00–10:30
Einführung in die TEI (Text Encoding Initiative)
Franz Fischer (Köln)

11:00–12:30
Strukturierung eines TEI-Dokuments (TEI Kapitel 4)
Ulrike Henny (Köln)

Materialien: Folien, Übungen

12:30–14:00 Mittagspause

14:00–15:30
Elemente für die Textauszeichnung in Prosa, Vers und Drama (TEI Kapitel 3)
Oliver Duntze (Berlin)

Materialien: FolienÜbungen, Beispiele

16:00–18:00
Der TEI-Header (TEI Kapitel 2)
Oliver Duntze (Berlin)

Materialien: FolienBeispiele

Donnerstag, 13. März 2014

9:00–10:30
XML-Schemasprachen und TEI Roma
Markus Schnöpf (Berlin)

Materialien: Folien

11:00–12:30
Darstellung von TEI-Dokumenten mit TEI-Boilerplate
Markus Schnöpf (Berlin)

Materialien: Folien

12:30–14:00 Mittagspause

14:00-15:30
Namen und Daten, Kritische Apparate in TEI (TEI Kapitel 12 und 13)
Franz Fischer (Köln)

16:00–18:00
Vertiefung, Weitere Übung zu TEI

Freitag, 14. März 2014

9:00–10:30
Kodierung von Sonderzeichen (Unicode und TEI Kapitel 5)
Oliver Duntze (Berlin)

Materialien: Folien, ÜbungenBeispiele

11:00–12:30
Übung zu TEI, Vervollständigung der Teilnehmerprojekte

12:30–14:00 Mittagspause

14:00–15:00
Feedback und Verabschiedung

15:30–17.00
Ggf. Individualberatung

Änderungen vorbehalten

DiXiT – IDE an EU-Projekt zu digitalen Editionen beteiligt

Das IDE ist an einem von der EU mit mehr als vier Millionen Euro finanzierten internationalen Forschungs- und Doktorandenprogramm zu digitalen Editionen beteiligt. Das Programm des Digital Scholarly Editions Initial Training Network (DiXiT) umfasst zahlreiche Fortbildungsveranstaltungen und Konferenzen (Camps & Conventions). Ab April 2014 werden insgesamt 17 Marie Curie-Fellowships zu vergeben sein.

Akademische Partner innerhalb des Digital Scholarly Editions Initial Training Network (DiXiT) sind u.a.:
– Universität zu Köln (Koordinator)
– Univerität Borås, Schweden
– King’s College London
– Huygens Institute for the History of the Netherlands, Den Haag
– Universität Antwerpen
– Universität Graz
– Trinity College Dublin
– École des Haute Études en Sciences Sociales (Lyon)
– La Sapienza, Rom
– University of Oxford

Darüberhinaus sind neben dem IDE diverse Softwareentwickler, Verlage, Nationalbibliotheken und Open Knowledge-Organisationen in das Programm eingebunden.

Weitere Informationen auf der DiXiT-Webseite:
http://dixit.uni-koeln.de

Review of ‚digital Monumenta Germaniae Historica (dMGH)‘

Extended preprint, to be published (without illustrations, footnotes, and bibliography) in Digital Philology: A Journal of Medieval Cultures 2.1 (Spring): 136–144 (2013).

This version (as PDF) is archived in the institutional repository KUPS (Kölner Universitäts Publikations Server) under urn:nbn:de:hbz:38-51103.

Review of: Monumenta Germaniae Historica and Bavarian State Library. 2005-2010 (current installation). Web <http://www.dmgh.de>.

by: Patrick Sahle, Universität zu Köln <sahle@uni-koeln.de> – Georg Vogeler, Universität Graz <georg.vogeler@uni-graz.at>

The Monumenta Germaniae Historica (MGH) publishes scholarly editions of source material relevant to the history of the Realm of the Franks and the Holy Roman Empire in the Middle Ages. The enterprise began in the early nineteenth century and became a research institution of its own in 1935. The publication of critical editions remains the central goal of the MGH. Over the last 150 years, the MGH has gained a reputation for the high quality of their editions, although they had to redo some of their early volumes in order to integrate new research results. The series is divided into several sections: historiography in the scriptores, law texts in the leges, charters in the diplomata, letters in the epistolae, and various genres from poetry to necrologies in the antiquitates. In the international community, the c. 400 volumes are considered the most prestigious editions of continental European sources of the early and high Middle Ages, both in terms of scholarly standards and completeness. The majority of these sources are in Latin, with a smaller selection in German.

By the early 1990s, the MGH started to digitize its editions in cooperation with Brepols Publishers under the label of eMGH (electronic MGH). The eMGH as a CD-ROM publication from 1996 onwards was based on the CETEDOC software, and the resulting product is mainly intended as a philological research tool (Sahle 2002, Müller 2003). From 2004 to 2010 the MGH received three grants from the Deutsche Forschungsgemeinschaft (DFG) to create a new digital version (thus dMGH) of the existing printed editions in cooperation with the Digitization Center at the Bavarian State Library. This review draws upon a monographic discussion of the dMGH (Sahle2008), shifts its focus towards philology, and extends it to the project’s recent developments.

As of 2012, the dMGH present without any access restriction an impressive amount of textual material: some 350 volumes with more than 165.000 pages, presumably all editions that have been published until 2007. 23 of these volumes are parts of two additional series, which are not part of the core sections, i.e. the Quellen zur Geistesgeschichte des Mittelalters and Deutsches Mittelalter, Kritische Studientexte. New editions are supposed to be added every three years after their publication in print according to the official statement. However, when checking the website in late November 2012, we found some volumes from 2005 and 2007 that are still missing (capitula episcoporum 4; diplomata 14,2; concilia 6,2). In fact, we have been told by a project staff member that 30 volumes from 2005 to 2009 should be available online in early 2013. All editions are available as digital images as well as electronic full-texts.

A declared aim of the dMGH was to create an identical representation of the printed version to ensure that a citation from the dMGH could be found as well in the printed version. Accordingly, the website offers a main menu with the series and volumes of the printed version. The interface is primarily a tool to flip through page images in the original order. Once the user has chosen a volume, further browsing through a table of contents or by page number is possible. The user can zoom in and out of the images, and also switch between scanned images and an HTML version of the full text. The scans can be printed as single images or downloaded as a PDF for larger parts, even entire volumes. However the user should be aware that the PDF contains only images, not the full text. To ensure “citability” in the digital realm, every page has a permanent link that is part of the URN-identification system used by the Bavarian State Library. But the dMGH also provides another mechanism that draws on the established canonical references to the volumes and their pages and implements a PURL approach (persistent URL). To give an example, page 40 in the scriptores volume 17, can be addressed as <http://www.mgh.de/dmgh/resolving/MGH_SS_17_S._40>.

The section entitled “Datenbanken” of the MGH homepage (but not on the dMGH site itself) includes very useful, additional information on MGH editions: additions and new editions of charters, PDF versions of texts to be published in print, and images of manuscripts extracted from photographs in the collection of the institute. Currently the only way to integrate this information into the dMGH seems to be the publication in print and re-launch of the print version in the dMGH after three years. Most of this data is declared as “preliminary” or “uncritical” documentation, leaving the final scholarly decisions to the print publication, which is still considered to present the canonical text versions.

Reading a volume as imagesReading a volume as images

The conversion of the page images in the dMGH into full-text allows for the implementation of additional search functionality, which is offered in two places. First, there is the option to restrict the query to particular volumes. Second, a generic interface with the same look is offered through the main navigation panel. Here, the search can be narrowed down according to the major sections and to types of text: edited text, textual apparatus, comments, and other texts (like forewords). The search input field comes with auto completion suggestions, which increase its heuristic value significantly. The user can further adjust the search results by determining their order (by relevance, title, year, or volume) and appearance. Hits can be shown as image snippets, as bibliographic information, and as text in context.

Search interface translated

The search interface offers some basic full-text indexing features such as and-concatenation, normalization of German umlaut, a not-operator (minus sign), exact phrase search (quotation marks), right truncation (*), single letter wildcard (?) and stop words. The primary search entity is the volume. Queries across the whole corpus deliver a list of volumes containing the search term. Search queries across one single volume separately show a keyword-in-context list.The division of the volumes into single edited texts or other deeper text structures in the volumes is not possible.

The relevance algorithm applied to the search function tends to deliver misleading results. A Latin phrase search proves to be too sensitive to word order, as e.g. is the case of hyperbata: A search for sacrum imperium[1] in Staatsschriften 1.1 gives only one correct hit within the first ten; in Const. 5 sacrum vacare continget imperium scores at 75% while promovendum ad sacrum imperium gets only 50%.[2] From the philological point of view they have both the same relevance. All the others are occurrences of the single word imperium. Similar problems show up when searching for the phrase in the whole corpus. The above mentioned Staatsschriften volume scores at 69.78%,[3] while Const. 3, with five correct hits in the first ten, scores only at 65%.

One can consider the dMGH as a major resource for early and high medieval Latin texts. Together with projects like ALIM (Archivio della Latinità Italiana del Medioevo)[4]or the CETEDOC data[5] it constitutes a veritable corpus of the Latin language in this period. The major drawback is that it is still difficult to access the texts with linguistic or philological research interests. Someone looking for readymade tools (like lemmatized search, explicit proximity search, etc.) may be still better off with the eMGH. Someone looking for a preliminary text base to be converted in the format of their own research tools, will be disappointed, as the data source is not available. This person would have to write their own scripts to extract the texts he or she is interested in from the HTML or XML pages respectively.[6] If the MGH still considers its raison d’être to be providing base material for further research, it should consider going further in the open data direction.

The dMGH is an extremely rich information resource even apart from the edited texts, as is evident, for example, in the indices on persons and places or the manuscript descriptions in the introductions. This information was incorporated into the dMGH as full text, partially with added functionalities, as the iMGH (indices tomorum Monumentorum Germaniae Historicorum); the digital texts of the indices for the volumes of the Scriptores in Folio (excluded vol. 15) were converted into a database format that links the index entries to the texts. In the interface, there is currently only a link via “Zusatzinfo” at the top of the page, including the index entries for the current page, although the complete index can be accessed directly via <http://www.mgh.de/dmgh/indices>. In addition to these indices, the MGH created a database of medieval place names including geo-coordinates. The database contains the information extracted from Graesse-Benedict-Plechls’ Orbis Latinus (2. ed. 1909) (more than 7000), the GeoNames-Database (583 entries) and user contributions. Perhaps due to a lack of publicity, these user contributions amounted to only fifteen entries as of December 10, 2012. In an example, the dMGH connected this data with the place names in the edition of the Merovingian charters <http://www.mgh.de/dmgh/geo/ demo/merowinger/> and showed the possibilities of a simple GIS-like presentation. A database of the manuscript descriptions in the volumes is under construction and certainly will become a very useful resource.[7] In the global view, the idea of a collective index of all volumes, including references to manuscript shelfmarks, remains yet to be realized.

The main focus of the MGH has always been a historical one. The texts are sources for the research in the history of Central and Western Europe. This affects mainly the selection of texts but also the editorial method; the edited texts are of a Lachmannian nature: corrected, normalized and cautiously modernized. While the texts are not lemmatized for more powerful searching, they do not follow the exact historical spelling either. Still, the dMGH form an impressive and extensive corpus for certain textual genres and can thus be very useful for philological research as well.

The dMGH is not primarily a linguistic text corpus or research tool for literary studies. Neither is it a digital scholarly edition that tries to solve editorial problems with digital methods. It is rather a scholarly digital library. Compared to many other digitization projects, which stop indexing at the division of text at chapter level, the dMGH implements a deeper data structure, offers reliable full texts, and provides a clear and useful browse and search interface. From this perspective, the dMGH has reached its own goals. Admittedly, we would be happy to have all formerly printed resources (other than MGH) made available in the same manner, but there are several areas where we could imagine some progress to come. In the long run, a deeper exploitation of the material and a better integration into the evolving digital humanities infrastructure or virtual research environments is desirable. Persistent URLs and web services resolving canonical references point in the right direction. But the accessibility of the raw data only on the page level is a major drawback. The flat search is another one, in particular with regard to the fact that information necessary for the identification of relevant text entities obviously does exist and indices could be configured to calculate relevance by these text chunks (single charters, edited works) without too much effort. The comparison with a resource like Perseus,[8] which integrates many important texts and tools for the classicist, may demonstrate some aims for which scholarly digital libraries like the dMGH could strive. The dMGH has already taken some steps in this direction and is working on more; with the iMGH semantic information enrichment has been put on the agenda. Work on these aspects is ongoing, and we hope that the dMGH will soon deliver more of the rich information from the printed editions in a structured way.

 

Bibliography

[dMGH 2006] Website of the dMGH: <http://www.dmgh.de>

[Müller 2003]Dedo-Alexander Müller: Rezension zu: MonumentaGermaniaeHistorica (Hrsg.): Elektronische MonumentaGermaniaeHistorica 3 (MGH-3). Turnhout 2002, in: H-Soz-u-Kult, 16.10.2003, <http://hsozkult.geschichte.hu-berlin.de/rezensionen/2003-4-030>.

[Sahle 2002] Patrick Sahle: Die elektronischen MonumentaGermaniaeHistorica auf CD-ROM: eMGH. Lieferung 2. Turnhout 2000, in: Zeitschrift für Bibliothekswesen und Bibliographie 49/5-6 (2002), S. 337-340,<http://www.klostermann.de/zeitsch/osw_495.htm> (preprint, available only via web.archive.org).

[Sahle 2008]Bernhard Assmann, Patrick Sahle: Digital ist besser. Die Monumenta Germaniae Historica mit den dMGH auf dem Weg in die Zukunft – eine Momentaufnahme. Schriften des Instituts für Dokumentologie und Editorik 1. Norderstedt: BoD 2008. ISBN 978-3-8370-2987-1 . Online: urn:nbn:de:hbz:38-23179

 


[5] Migne Patrologia Latina at documenta catholica omnia <http://www.documentacatholicaomnia.eu/25_10_MPL.html> unfortunately provides only images of the printed texts.

[6] The HTML is very much oriented towards the print version; therefore the main text chunk is the line, expressed as an HTML paragraph. As an undocumented feature you can address the TEI source of each page by replacing the html extension of the file with xml (e.g. <http://www.dmgh.de/de/fs1/object/display/bsb00000451_00299.xml?sortIndex=030%3A040%3A0006%3A010%3A02%3A00&text=true&subSeriesTitle_str=&html=true&hl=false>). This XML provides the display information of the page (e.g. lines) rather than a TEI encoding of the textual structure (e.g. paragraphs).

[7] Personal note by project staff member Clemens Radl, 12.12.2012.

 

Summer School „Digitale Editionen – Methodische und technische Grundfertigkeiten“

Technische Universität Chemnitz, 26.-30.08.2013

 

Die Kritische Digitale Edition ist ein zentrales Feld des Einsatzes moderner Computertechnologien in den Geisteswissenschaften. In den letzten Jahrzehnten hat sich eine umfassende Methodologie herausgebildet. Die technische Basis bilden Text-Auszeichnungssprachen wie XML und HTML. Den speziellen Anforderungen bei der Auszeichnung zu editierender Texte wird durch den de-facto-Standard der Text Encoding Initiative (TEI) Rechnung getragen. Diese Technologien (XML, XSLT, XQUERY et. al.) und Praktiken (TEI) werden ansatzweise auch schon in der universitären Lehre vermittelt. In spezieller Ausrichtung auf die Bedürfnisse der edierenden Geisteswissenschaften bemüht sich das Institut für Dokumentologie und Editorik (IDE) seit 2008 um die Verbreitung dieser Kenntnisse in regelmäßigen außercurricularen Veranstaltungen (Summer Schools).

Die Summer School richtet sich an NachwuchswissenschaftlerInnen aus dem Bereich der Geisteswissenschaften, die noch über keine Erfahrungen mit XML und der Textkodierung verfügen. Teilnahmevoraussetzungen sind ein abgeschlossenes oder in der Endphase befindliches geisteswissenschaftliches Studium mit text- bzw. editionswissenschaftlichem Schwerpunkt. Die TeilnehmerInnen sollen nach Möglichkeit Material aus einem eigenen Editionsprojekt für Übungseinheiten und Projektkonsultationen bereithalten.

Ziel der Veranstaltung ist es, Grundkenntnisse im Bereich der Textkodierung mit XML/TEI, der Weiterverarbeitung XML-kodierter Daten sowie ihrer Aufbereitung für die Präsentation im Internet zu vermitteln. Eines der Grundkonzepte der Summer School ist die aktive Beteiligung der TeilnehmerInnen in tutoriell dicht betreuten Übungen. Der theoretisch vermittelte Stoff wird hier anhand praktischer Übungen vertieft und das theoretische, passive Wissen in aktives Handlungswissen übersetzt, das direkt von den TeilnehmerInnen in ihren Editionsprojekten umgesetzt werden kann. Die TeilnehmerInnen sollen deshalb möglichst mit eigenem Material (z.B. aus eigenen Editionsprojekten, Dissertationen o.Ä.) arbeiten. Um diese starke Praxisorientierung der Summer School zu verwirklichen, ist ein im Vergleich zu anderen eher theoretisch ausgerichteten Lehrveranstaltungen hoch angesetzter Betreuungsschlüssel notwendig.

Programm – Stand 23.7.2013:

26.8., 13-14.30, Beginn, Begrüßung, Vorstellung

26.8., 15-16.30, Kriterien zur Bewertung digitaler Editionen
Markus Schnöpf

26.8., 16.45-18.15, Überblick über die X-Technologien (Folien)
Ulrike Henny

Öffentlicher Abendvortrag: Gregory Crane: Open Philology in the City of (e-) books (Abendvortrag Summer School 2013.2)
27.8., 9-10.30: XML 1 (Einführung, oxygen) (Folien)
Ulrike Henny

27.8., 11-12.30: Übungen zu XML 1

27.8., 14-15.30: XML 2 (Vertiefung) (Folien)
Torsten Schassan

27.8., 16-18: Übungen zu XML 2

28.8., 9-10.30: TEI-Einführung (Guidelines Überblick, Boilerplate) (Folien)
Torsten Schassan

28.8., 11-12.30: Übungen zu TEI-XML

28.8., 14-15.30: XML-Schema (Folien)
Martina Semlak

28.8., 16-18: Übungen zu XML-Schema

29.8., 9-10.30: TEI-Kap 3 und 2 (inkl. Metadaten) (Folien)
Markus Schnöpf

29.8., 11-12.30: Übung zu TEI Kap 3 und 2

29.8., 14-15.30: TEI Kap 12 und 13 (Folien 12Folien 13)
Oliver Duntze

29.8., 16-18: Übungen zu TEI

30.8., 9-10.30: TEI Kap 10 und 11 (Folien)
Franz Fischer

30.8., 11-12:30: Übung zu TEI, Vervollständigung der Teilnehmerprojekte

30.8., 14-15: Verabschiedung

30.8., 15:30-17.00: Individualberatung

 

 

Die Veranstaltung vom 26.-30.08.2013 richtet das Institut für Dokumentologie und Editorik e.V. in Zusammenarbeit mit dem Lehrstuhl für Literatur- und Sprachgeschichte des Mittelalters und der Frühen Neuzeit der Technischen Universität Chemnitz aus. Für die Teilnahme wird ein Kostenbeitrag von 100,- EUR erhoben. Wenn Sie sich für den Kurs interessieren, melden Sie sich bitte mit einer kurzen Projektskizze (10 Zeilen) unter der e-Mail <schools@i-d-e.de> an. Da die Kapazität des Kurses auf 20 Personen beschränkt ist, wird um eine frühzeitige Anmeldung gebeten.