Advertisement

Publizistik

, Volume 63, Issue 4, pp 535–556 | Cite as

Digitale Perspektiven in der Kommunikations- und Mediengeschichte

Erkenntnispotentiale und Forschungsszenarien für die historische Presseforschung
  • Erik Koenen
Aufsatz

Zusammenfassung

Der Beitrag stellt in der Diskussion um die Zukunft der Kommunikations- und Medienwissenschaft in digitalen Zeiten die Position und Perspektive der Kommunikations- und Mediengeschichte in den Mittelpunkt und spielt die mit der Digitalisierung verbundenen Herausforderungen, Probleme und Potentiale am Beispiel der historischen Presseforschung durch. Innerhalb des Medienensembles der klassischen Massenkommunikation profitiert derzeit vor allem die periodische Presse von der retrospektiven Digitalisierung historischer Medien und deren digitaler Edition in Datenbanken und Portalen. Mit digitalisierten Zeitungen und digitalen Zeitungsportalen ergibt sich für die historische Presseforschung eine neue, weil zunehmend digitale Forschungssituation: Digitale Zeitungsportale als neuartige, originär digitale Überlieferungswelt für Zeitungen erleichtern nicht bloß den Weg zu den einzelnen Zeitungen und ihren Inhalten, sie erschließen diese als digitale Quellenressourcen maschinenlesbar und öffnen somit für die Forschung völlig neue Wege. Ziel des Beitrags ist es, die epistemologisch-methodologischen Problemlagen und die methodisch-praktische Operationalisierung digital gerahmter bzw. unterstützter pressehistorischer Erkenntnis- und Forschungsprozesse zu erörtern sowie konkrete Erkenntnisperspektiven und Forschungsstrategien für die Praxis vorzustellen.

Schlüsselwörter

Digitale Methoden Kommunikations- und Mediengeschichte Historische Presseforschung Distant Reading Text Mining 

Digital perspectives in communication and media history

Cognitive potentials and research scenarios for historical press research

Abstract

In the discussion about the future of communication and media science in digital times, this article focuses on the position and perspective of communication and media history. The challenges, problems and potentials associated with digitization are illustrated using the example of historical press research. Within the media ensemble of classical mass communication, the periodic press in particular benefits from the retrospective digitization of historical media and their digital edition in databases and portals. For historical press research, digitized newspapers and digital newspaper portals represent an originally new, because increasingly digital research situation: Digital newspaper portals as a novel, originally digital world for newspapers not only facilitate the path to newspapers and their contents, they also open them up as digital resources machine-readable and thus open up completely new paths for research—not least supported by digital methods.

The main objective of this article is to discuss the epistemological-methodological problems and the practical operationalization of digitally framed or supported research processes in historical press research and to present concrete perspectives of knowledge and research strategies for practice. With this aim in mind, the paper discusses three points:

(1.) Methodological and practical consequences of historical press research in digital research environments. With the digitization of newspapers and their digital reproduction in newspaper portals, their source character shifts essentially in three dimensions: They are edited and indexed digitally and their complete content is made accessible through optical character recognition. This makes previously unimportant technical aspects such as data formats, portal interfaces, search algorithms and programming interfaces very relevant for the methodology of historical press research. A primary methodological effect of the digital reorganization of newspapers in data and portals is the reversal of the usual reading practice: from “top down” to “bottom up”. With the help of “keyword searching”, newspapers can now be searched comprehensively and transversely to the order of the newspaper original. Nevertheless, there is a warning against an all too naïve and uncritical usage of digitized newspapers and newspaper portals. In practice, some problems and risks are crucial for the conception of historical newspaper research in digital research environments: Besides a hardly standardized and in large parts “wild”, because often uncoordinated and selective digitization of newspapers, the newspaper portals are different in their conception as well as characterized by different content, technical, legal and entrepreneurial conditions.

(2.) Historical newspapers as digital sources in practice. The methodological and technical framework are fundamental and far-reaching for the further practical use of newspapers as digital sources in research. In each research step, it must be considered that digitized newspapers are genuinely new and, depending on the quality and depth of digitization, very complex sources with information gains and losses compared to the originals. Newspapers are not simply digitized, they are digitally constructed and differ in this construction from each other. In this respect, historical press researchers are increasingly becoming “users”. However simple and uncomplicated newspaper portals may be in practice, one must incorporate the implicit functions (hidden in algorithms, data and code) and the limits of these knowledge engines and their “correct” use into the research process. Combining and mediating classical hermeneutic methods with search technologies is an essential moment in the practical handling of digitized newspapers.

(3.) Historical press research and digital methods. In the light of the new research situation which is emerging with digitized newspapers and newspaper portals, it is obvious that historical press research should increasingly open up to the possibilities of digital methods. In the digital method discussion of historical press research, one concept in particular forms a central point of reference: Franco Moretti’s concept of “Distant Reading”. Basically, “Distant Reading”—and this is what makes this perspective so interesting for historical press research in dealing with the considerable metadata and full text volumes of digitized newspapers—is about the quantitative-automatic indexing of large text corpora using methods and techniques of “Text Mining”. Digital text methods are thus seriously changing the way we look at texts and the research practice with texts such as newspapers: In parts, they automate and accelerate reading processes, produce “new” text extracts by the computer, generate new interpretation contexts between individual text, corpus and condensate, and thus set new orientation points for “close reading”. Computers and digital text methods thus do not relieve researchers of interpretation. Rather, they constantly challenge them to interpret in a continuous interplay in order to give meaning to the text patterns discovered by machines.

In spite of all these advantages, digital methods have so far only been used sporadically in historical press research. For this reason, finally a digital workflow for research processes in historical press research will be presented, which illustrates and summarizes essential challenges, problems, solutions and potentials of digitally framed or supported research in press history.

Keywords

Digital methods Communication and media history Historical press research Distant reading Text mining 

1 Einleitung: Zukunft der Kommunikations- und Mediengeschichte unter digitalen Vorzeichen

Mit dem Beitrag „Kommunikations- und Medienwissenschaft in datengetriebenen Zeiten“ hat Andreas Hepp (2016) eine nachhaltige Debatte zu den disziplinären Folgen von Digitalisierung und digitalen Medien angestoßen. In ihrer Reaktion haben Christian Strippel et al. vorgeschlagen, sich vermehrt den „konkreten Schritten“ zuzuwenden, „wie kommunikations- und medienwissenschaftliche Gegenstände, Theorien und Methoden unter gewandelten Kommunikationsbedingungen behandelt werden können“ (Strippel et al. 2018a, S. 12). Mit dem Call for Paper, dem dieser Beitrag gefolgt ist, haben sie dazu eingeladen, „die Diskussion über die Zukunft des Fachs anhand konkreter Beispiele fortzuführen und zu vertiefen“ (Strippel et al. 2018b, S. 7). Mit Hepp, der darauf hinwies, dass „in datengetriebenen Zeiten die Kommunikations- und Medienwissenschaft so vielfältig sein [sollte] wie der Kommunikations- und Medienwandel, mit dem wir konfrontiert sind“ (Hepp 2016, S. 241), legen sie Wert darauf, „nicht von einer Zukunft der Kommunikationswissenschaft zu sprechen, sondern in diversen Zukünften zu denken, die sich bereits in zahlreichen Projekten und Einzelvorhaben ankündigen und dort realisiert werden“ (Strippel et al. 2018a, S. 22).

An eine dieser „Zukünfte“ denkt man im Zusammenhang von Digitalisierung und digitalen Medien sicher nicht zuerst: nämlich die Zukunft der historischen Kommunikations- und Medienforschung unter digitalen Vorzeichen (vgl. Koenen et al. 2018). Gerade bei der Kommunikations- und Mediengeschichte wird ersichtlich, dass die Diskussion über die Digitalisierung der kommunikations- und medienwissenschaftlichen Forschung in Methoden, Themen, Theorie und Praxis nicht nur Forschungsfelder angeht, die sich bevorzugt mit aktuellen Phänomenen der Medienkommunikation befassen und in diesem Sinne qua Gegenstand direkt vom digitalen Wandel berührt sind. Recht nahe liegt es noch, dass die Herausbildung und Durchsetzung digitaler Kommunikation und Medien das kommunikations- und medienhistorische Feld vor die Aufgabe stellen, Forschungsperspektiven und -konzepte für eine Digitalmediengeschichte zu entwerfen, die die Dimensionen, Folgen und Prozesse digitalen Medienwandels historisch einordnen und rekonstruieren. Zugleich schreitet aber auch die Retro-Digitalisierung des klassischen massenmedialen Ensembles rasant voran und schafft obendrein für die Geschichte des Zeitalters der Massenmedien eine vollkommen neue Situation.

Schon heute zeichnet sich so ab, dass sich im Zuge der Digitalisierung die Ausgangslage und Grundlagen kommunikations- und medienhistorischer Forschung enorm verändern. Zukünftig werden mit hoher Wahrscheinlichkeit digitale Informationsinfrastrukturen, digitale Methoden sowie digitale Quellenressourcen (gleich, ob es sich bspw. um zeithistorische Twitter-Daten zum Arabischen Frühling oder Zeitungsvolltexte des 19. und 20. Jahrhunderts handelt) die Praxis historischer Kommunikations- und Medienforscher und -forscherinnen durchgreifend prägen. Wie Gabriele Balbi (2011, S. 151) in seinem programmatischen Zukunftsentwurf „Doing Media History in 2050“ prognostiziert, werden sie damit vor neue und komplexe epistemologische, methodische und praktische Herausforderungen gestellt: „[T]hey will have to approach the digital heritage differently than the analogue one, because digital data are volatile, interconnected, unstable and abundant; they will seek new tools to manage this great mass of data; they will use technological systems because archives of the future will be different and they will adopt new, and more technology dependent, ways of working; they will interact with new institutions and they will learn new methods of access to sources; they will have to learn new methods to reconstruct the past from these digital sources; and, finally, they will face new difficulties, such as accessibility, ownership, fragility, originality and contextualization of digital sources.“

Aus den von der Digitalisierung ermöglichten verschiedenen Zukunftsszenarien kommunikations- und medienhistorischer Forschung greift dieser Beitrag die historische Presseforschung exemplarisch heraus, um den skizzierten digitalen Wandel der Kommunikations- und Mediengeschichte weiter zu veranschaulichen und mit Leben zu füllen. Mit der Digitalisierung ergeben sich selbst für diesen etablierten und weitgehend konsolidierten Gegenstandsbereich neue Herausforderungen wie auch neue Erkenntnisoptionen und Forschungspotentiale. Zudem entstehen mit Retro-Digitalisierung, digitalisierten Zeitungen und digitalen Zeitungsportalen für die historische Presseforschung explizit digitale Forschungskontexte. Ziel des Beitrags ist es, die epistemologisch-methodologischen Problemlagen und die methodisch-praktische Operationalisierung der Einbettung pressehistorischer Erkenntnis- und Forschungsprozesse in solche digitalen Kontexte sowie konkrete Erkenntnisperspektiven und Forschungsstrategien für die Praxis zu diskutieren. Zentral sind im Folgenden drei Punkte, die am Beispiel einer experimentellen Fallstudie zur medialen Resonanz der Russischen Revolution 1917 in der zeitgenössischen australischen und US-amerikanischen Presse illustriert werden: Erstens geht es um die generellen Folgen des „Digital Turn“ für die historische Presseforschung (Kap. 2). Zweitens stehen Zeitungsportale als digitale Forschungsumgebungen (Abschn. 2.1) sowie Zeitungen als digitale Quellen (Abschn. 2.2) im Mittelpunkt, und es werden jeweils die damit verbundenen forschungspraktischen Konsequenzen und Probleme dargestellt. Drittens werden konkrete Forschungsperspektiven historischer Presseforschung in digitalen Kontexten erörtert und vorgestellt (Kap. 3). Schließlich widmet sich das Resümee der Relevanz der digitalen Wende kommunikations- und medienhistorischer Forschung für die Kommunikations- und Medienwissenschaft insgesamt.

2 Der „Digital Turn“ der historischen Presseforschung

Innerhalb des Medienensembles der klassischen Massenkommunikation profitiert derzeit (verglichen mit Film und Rundfunk) vor allem die periodische Presse und mit ihr die historische Presseforschung von der retrospektiven Digitalisierung historischer Medien (für einen ersten Überblick über digitale Ressourcen vgl. Bösch 2018). Mit der Retro-Digitalisierung von historischen Zeitungen und deren Wiedergeburt als digitale Quellenressourcen entsteht seit gut zwei Jahrzehnten weltweit ein riesiges Text- und (weitgehend unbeachtetes und unerschlossenes) Bildkorpus für diesen Forschungszweig. „Changing paper and ink into bits and bytes“, so bezeichnet James Mussell (2017, S. 17–18) die Retro-Digitalisierung von Zeitungen und unterscheidet hierbei drei Dimensionen, in denen sich deren Quellencharakter evident erweitert und wesentlich verschiebt. Sie betreffen
  1. 1.

    die editorischen Möglichkeiten der Digitalisierung;

     
  2. 2.

    die maschinell-inhaltliche Erschließung von Zeitungen via Optical Character Recognition (OCR) – „in which every word might be searched“ (Mussell 2017, S. 18);

     
  3. 3.

    die Integration der Zeitungsdigitalisate und -volltexte in digitalen Zeitungsportalen und deren maschinelle Indexierung und Strukturierung mit Metadaten: „With sufficient metadata, they can also become catalogues, enumerating articles, issues, volumes and publications.“ (Mussell 2017, S. 18)

     

Unter diesen Voraussetzungen ergibt sich für die historische Presseforschung mit digitalisierten Zeitungen und digitalen Zeitungsportalen eine generell neue Forschungssituation: Digitale Zeitungsportale als neuartige, originär digitale Überlieferungswelt für Zeitungen erleichtern nicht bloß den Weg zu den einzelnen Zeitungen und ihren Inhalten, sie erschließen diese als digitale Quellenressourcen maschinenlesbar und öffnen somit gleichermaßen für die Forschung völlig neue Wege. Bob Nicholson bezeichnet die hiermit verknüpften komplexen digital akzentuierten Herausforderungen und Potentiale hinsichtlich Epistemologie, Methoden und Praxis folgerichtig als „Digital Turn“ pressehistorischer Forschung: „[A] ‚digital turn‘ in humanities scholarship driven by the creative use of online archives and a willingness to imagine new kinds of research.“ (Nicholson 2013, S. 63)

2.1 Digitale Zeitungsportale als pressehistorische Forschungsumgebungen: Kennzeichen und methodologische Prämissen, Probleme und Risiken

Vor über einem Jahrhundert hob der Historiker und Zeitungskundler Martin Spahn als Erster den besonderen historischen Quellenwert von Zeitungen hervor. In seinem auf dem Internationalen Historikertag 1908 gehaltenen Vortrag „Die Presse als Quelle der neuesten Geschichte und ihre gegenwärtigen Benutzungsmöglichkeiten“ verwies er zugleich nachdrücklich auf die Bedingungen, um Zeitungen überhaupt als historische Quellen nutzen zu können: eine spezifische wissenschaftliche Methode, die sich der „Eigenart“ der Zeitung „anschmiegt“, und die Schaffung von zentralen Sammlungsorten, wo Zeitungen langfristig archiviert, konserviert sowie mit „einer umfassenden, nach Schlagwörtern geordneten Registratur“ inhaltlich erschlossen werden (Spahn 1908, Sp. 1165 und 1209).

Nachdem die Vorschläge Spahns nie realisiert wurden, scheinen sich mit dem beschriebenen „Digital Turn“ der historischen Presseforschung seine wesentlichen Anliegen und Forderungen geradezu von selbst zu verwirklichen. Digitale Zeitungsportale wie u. a. „Anno“ (http://anno.onb.ac.at), „Chronicling America“ (https://chroniclingamerica.loc.gov), „Europeana Newspapers“ (http://www.theeuropeanlibrary.org/tel4/newspapers) oder „Trove“ (https://trove.nla.gov.au/newspaper/) etablieren sich als zwar virtuelle, aber zentrale Sammlungsorte für Zeitungen (für eine umfassende und kritische Übersicht zum internationalen Stand der historischen Zeitungsdigitalisierung und zu verfügbaren Zeitungsportalen vgl. Blome 2018). Mit OCR und den Möglichkeiten maschineller Volltextsuche werden Zeitungen erstmals als Ganzes inhaltlich erschlossen. Schließlich zieht die materielle Transformation von Zeitungen im Prozess der Retro-Digitalisierung eine engagierte methodologische Debatte über die Eigenart, Kritik und Nutzung von Zeitungen als Quellen nach sich – eine Debatte, die im Übrigen seit Spahn nur gelegentlich und im Sinne einer profunden Quellentheorie der Zeitung wenig produktiv geführt wurde (vgl. Wilke 1999; Steinbach 1999; zuletzt zur Zeitung als historischer Quelle: Opgenoorth 1997, S. 106–109; Ackermann 1992; Kraus 2002).

Solche Vorfragen sind in der Diskussion zur historischen Presseforschung in digitalen Kontexten vor allem deshalb wesentlich, um die vielschichtigen informatorisch-technischen Bedingungen der Transformation von Zeitungen in digitale Ressourcen sowie der Recherche innerhalb von digitalen Portalen und mit digitalen Suchtechnologien systematisch zu reflektieren. Mit u. a. Datenformaten, Portalinterfaces, Suchalgorithmen und Programmierschnittstellen werden ja bislang eher unerhebliche technische Aspekte für die pressehistorische Methodologie und Quellenkritik relevant. Technik und Technologie sind durchaus nicht neutral (vgl. Kranzberg 1986), und dies gilt genauso für digitale Forschungsumgebungen (vgl. u. a. Witten et al. 2007; Ramsey 2011; Day 2014). Außer dem Standard und der Qualität und Tiefe der eigentlichen Zeitungsdigitalisierung haben so insbesondere das Design und das Funktionsrepertoire sowie die interne Ordnung und Struktur der Zeitungsportale maßgeblichen Einfluss auf Fragestellungen und Forschungsstrategien. Darauf verweist schon Bob Nicholson in seinem Schlüsselbeitrag „Exploring the Methodological Possibilities of Digital Newspaper Archives“: „By the time we view a digital archive, its contents have been through a complex process of transformation; the questions we can ask of a digital source are, in this sense, determined before we even login to the database.“ (Nicholson 2013, S. 65)

Für den pressehistorischen Forschungsprozess stellt Nicholson heraus, dass die der Digitalisierung immanenten Logiken und Routinen die von der analog-manuellen Sichtung von Zeitungen gewohnte Recherchepraxis geradezu revolutionieren (siehe Abb. 1): „Classically […], when we want to find something in a conventional newspaper we tend to approach it using a top-down approach. We start by selecting what we hope is the correct publication and then pick out what we hope will be the correct volume or issue. Next, we look at headers for potentially useful columns or articles. Finally, we read through the text of what promises to be a relevant article.“ (Nicholson 2013, S. 66)
Abb. 1

Forschungslogik der „top-down“-Recherche von Zeitungen und der „bottom-up“-Stichwortsuche in Zeitungsportalen im Vergleich (Nicholson 2013, S. 66 und 67)

Mit Portalen und digitalen Suchinstrumenten wird diese konventionelle Recherchepraxis der intellektuell kontrollierten, linear-selektiven, manuellen Sichtung von Zeitungen nach dem „top-down“-Prinzip umgekehrt (siehe Abb. 1). Schon mit einem simplen Interface für „Keyword Searching“ werden per OCR erschlossene Zeitungen umfassend und quer zur Ordnung des Zeitungsoriginals maschinell durchsuchbar. Was den Einzelnen überfordern würde, ganze Jahrgänge von Zeitungen Artikel für Artikel, Seite um Seite zu sichten, erledigen Stichwortsuchen in Sekunden. Maschinelle Prozeduren überwinden so im Umgang mit Zeitungen als Massenquellen die forschungsökonomischen und kognitiven Grenzen „singularisierender Quellenarbeit“ (Wilke 1987, S. 49) und machen zugleich das bei jedem selektiven Rechercheverfahren zwangsweise im Dunkeln bleibende „Great Unread“ (Cohen 1999, S. 23; Graham et al. 2016, S. 70–72) sichtbar: „Crucially, however, it is our direct access to individual words that presents the most exciting new methodological possibilities. […] [R]esearchers […] can now locate information, track the use and evolution of language, trace the development and movement of people, texts and ideas and explore discursive formations in ways that were hitherto impossible.“ (Nicholson 2013, S. 67)

Trotz des zu Recht vielgepriesenen großen Erkenntnis- und Innovationspotentials, das man Portalen mit ihren integrierten Recherche- und Suchroutinen für die pressehistorische Forschung zumisst, bergen diese in der Forschungspraxis zahlreiche Schwierigkeiten. Sehr deutlich wird darauf hingewiesen, dass damit (jedenfalls in absehbarer Zeit) keinesfalls eine Forschung auf „Knopfdruck“ (Deacon 2007) ins Haus steht, und vor einem allzu naiven und unkritischen Gebrauch gewarnt. Adrian Bingham (2010, S. 229) betont, dass „Keyword Searching“ nur bei richtiger Verwendung „effektiv“ ist und ohne zuvor entwickelte Forschungsfragen eher ein „stumpfes Werkzeug“ bleibt. Die Autoren des Historian’s Macroscope (Graham et al. 2016, S. 48, 49–50) warnen sogar vor einem der Konstruktion von Datenportalen und Datenwissen immer impliziten „verzerrenden Effekt“: „We need to consider the underlying structure of databases: how they were constructed, what assumptions went into them, and how the data are formatted? […] [We] need to always consider the quality of the text. How was it constructed?“ Praktisch spiegelt sich dieser Effekt in einem zweidimensionalen digitalen Bias von Problemen und Risiken, der nachhaltig die Erkenntnisoptionen und die Konzeption von pressehistorischen Forschungsprozessen in digitalen Kontexten fundiert: Neben einer kaum standardisierten und in großen Teilen „wilden“, weil oft unkoordinierten, punktuellen und selektiven Retro-Digitalisierung von Zeitungen sind die verfügbaren Portale selbst in ihrer Konzeption sehr verschieden sowie durch unterschiedlichste inhaltliche, technische, rechtliche und unternehmerische Konditionen gekennzeichnet (siehe Tab. 1).
Tab. 1

Synopse der Probleme und Risiken von Zeitungsdigitalisierung und Zeitungsportalen für die historische Presseforschung (vgl. Bingham 2010; Nicholson 2013; Strange et al. 2014; Smits 2014; Wijfjes 2017; Blome 2018)

Zeitungsdigitalisierung: Probleme und Risiken der Datengenerierung

Zeitungsportale: Probleme und Risiken von Infrastrukturen

– keine übergreifenden Standards

– oftmals unkoordinierte, punktuelle und selektive Retro-Digitalisierung: digitale Verfügbarmachung von Zeitungen entspricht nicht den historischen Zeitungslandschaften

– mangelhafte Dokumentation der Retro-Digitalisierung

– unterschiedliche Qualitäten und Tiefen von Digitalisaten, Metadaten und OCR

– unübersichtliche Vielfalt der Portale (epochal, inhaltlich-thematisch, regional)

– Unterschiede in

– den Portalinfrastrukturen

– der Funktionsweise und den -repertoires von Recherche- und Suchinterfaces

– den rechtlichen und wirtschaftlichen Konditionen von Bereitstellung und Nutzung

– dem Umgang mit der Freigabe und Nachnutzung von Digitalisaten, Metadaten und OCR

2.2 Zeitungen als digitale Quellen in der Praxis

Für pressehistorische Forschungsprozesse in digitalen Kontexten sind die dargelegten methodologisch-technischen Rahmenbedingungen grundlegend und folgenreich. Von Anfang an und in jedem Forschungsschritt ist zu berücksichtigen, dass mit digitalisierten Zeitungen genuin neue und je nach Qualität und Tiefe der Retro-Digitalisierung sehr vielschichtige Quellen mit Informationsgewinnen und -verlusten gegenüber den Originalen vorliegen: „[S]ources are ‚remediated‘ and not just reproduced.“ (Nicholson 2013, S. 64) Zeitungen werden zu „Metaquellen“: „A set of structured information, modelled, passed on to the computer and processed by it.“ (Genet 1994; hier übersetzt von Fickers 2016) Im Prozess der Retro-Digitalisierung werden Zeitungen neu formatiert und zu Einsen und Nullen verdatet, werden zu Daten, Dateien, Dokumenten und digitalen Korpora, zu „in Form gebrachten Informationen“ (Fickers 2016) als Grundlage für maschinelle Lesbarkeit und Verarbeitung. Für die Forschungspraxis heißt dies, dass Erhebung und Erschließung digitalisierter Zeitungen abhängig sind von der Granularität und Güte der Informationen, den Funktionalitäten der Zeitungsportale, diese Informationen zugänglich und verfügbar zu machen, sowie den Reflexionskompetenzen des Forschers, diesen doppelten digitalen Impact kritisch im Auge zu behalten und praktisch zu nutzen.

Historische Presseforscherinnen und -forscher werden insofern zunehmend zum „User“ (Brake 2012, S. 223). So schlicht und unkompliziert, wie ihnen Zeitungsportale in der Praxis entgegentreten, so sehr müssen sie die implizite (in Algorithmen, Daten und Code versteckte) Funktionsweise und die Grenzen dieser Wissensmaschinen und deren „richtige“ Nutzung in den Forschungsprozess einbeziehen. „Heuristiken des Suchens“ (Fickers 2016), die klassische hermeneutische Verfahren mit Suchtechnologien verbinden und vermitteln, sind ein wesentliches Moment im praktischen Umgang mit digitalisierten Zeitungen – ein Umstand der mittlerweile breit erörtert wird (vgl. Beall 2008; Upchurch 2012; Underwood 2014; Huistra und Mellinek 2016): „Scholars […] should learn to refine their process of source selection through full-text search.“ (Huistra und Mellinek 2016, S. 226) Volltextsuchen sind vom digitalen Korpus und forschungsspezifischen Suchworten bestimmt und darum nicht bloß wegen der Fehlerhaftigkeit des OCR-Prozesses (weil ein Suchwort nicht in jedem Fall im Korpus greift) häufig unzuverlässig. Vielfach schlagen sie auch schon deshalb fehl, weil der Nutzer selbst den historischen Sprachgebrauch und Kontext nicht einkalkuliert oder zu ungenau sucht: „The absence of a particular word does not necessarily mean that a subject is not discussed, it may merely indicate that alternative terminology has been used. Researchers […] must therefore learn to be both imaginative and persistent in trying synonyms and other usages.“ (Bingham 2010, S. 229–230)

Erfolgreiche Suchvorgänge erzielen oftmals wiederum Ergebnisse, die in die Tausende gehen und so ohne Möglichkeiten der Auswahl und Klassifizierung nur noch schwer nachzuvollziehen und zu überblicken sind. Umso wichtiger ist es, dass digitalisierte Zeitungen nicht nur inhaltlich im Volltext erschlossen sind, sondern gleichzeitig mit formalen und strukturellen Metadaten angereichert und indexiert wurden, die sie als einzelne digitale Objekte definieren und identifizieren sowie innerhalb des digitalen Korpus integrieren und vernetzen. Metadaten eröffnen so diverse Optionen der Einschränkung, Ordnung und Kontextualisierung von Suchergebnissen. Mit Metadaten lassen sich etwa, wie das Beispiel in Abb. 2 mit dem Portal von „Chronicling America“ belegt, Suchanfragen und -resultate im Korpus US-amerikanischer Zeitungen nach Kriterien wie Erscheinungsort, Zeitungstitel und Zeitfenstern einstellen bzw. filtern und ordnen und damit für die Generierung von Forschungskorpora oder die Reduktion des Forschungsmaterials einsetzen. Weiterhin rücken sie Suchresultate, wie in dem Beispiel mit „US News Map“ (http://usnewsmap.com) gezeigt, in weitere Kontexte und ermöglichen beispielsweise die Visualisierung der Dichte, geographischen Hotspots und Verbreitung der Zeitungsberichterstattung für ein Suchwort – hier für „Russian Revolution“.
Abb. 2

Resultate für eine geodaten-referenzierte Suche mit „US News Map“ (unten) und eine gefilterte Stichwortsuche (oben) nach „Russian Revolution“ im digitalen Zeitungskorpus von „Chronicling America“

Sieht man sich nun exemplarisch Modellierungen von digitalisierten Zeitungen an, so wird nochmals die erhebliche Transformations- und Konstruktionsleistung der Zeitungsdigitalisierung deutlich: Zeitungen werden nicht einfach digitalisiert, sie werden digital konstruiert und unterscheiden sich in dieser Konstruktion (zum Teil massiv) voneinander. Das mit der Schnittstelle von „Chronicling America“ abgefragte Metadatenset für die New Yorker Sun vom 16. März 1917 (Abb. 3) illustriert, wie die digitalisierte Zeitung entgegen dem gedruckten Original mit formalen, inhaltlichen und strukturellen Metadaten sowie Volltext angereichert ist, die dann automatisiert erhoben und genutzt werden können. Ferner gibt es offensichtliche Grenzen: der OCR-Prozess bezieht sich nicht auf einzelne Artikel, sondern die ganze Seite, der Volltext ist recht „schmutzig“, und die Zeitungsfotos sind nicht extra erschlossen – ein gewichtiges Manko, das portalübergreifend zu beobachten ist (vgl. Maurantonio 2014). In „Trove“ und für die in Sydney erschienene Sun vom 9. November 1917 (Abb. 4) lassen sich neben dem automatisiert abgefragten Metadatenset manuell verschiedene Formen der digitalisierten Zeitung exportieren. Hier wird sichtbar, dass der Bezugspunkt des OCR-Prozesses nicht die Zeitungsseite, sondern der einzelne Zeitungstext ist, und sich digitalisierte Zeitungen in der Regel aus mehreren Quellenschichten zusammensetzen, die je nach Format variabel nachnutzbar sind.
Abb. 3

Beispiel für ein Metadatenset im json-Format in „Chronicling America“: The Sun (New York) vom 16. März 1917

Abb. 4

Quellenschichten einer digitalisierten Zeitung und Möglichkeiten der Nachnutzung in „Trove“: The Sun (Sydney) vom 9. November 1917

Momentan erlauben indes nur wenige Zeitungsportale wie „Chronicling America“ und „Trove“, mithilfe reichhaltiger Metadaten und programmierbarer Schnittstellen Suchabfragen automatisiert und individuell angepasst zu stellen. Statt eines freien und offenen Zugangs zu Digitalisaten, Metadaten und Volltexten überwiegt vielmehr die Tendenz, diese eigentlichen Daten als digitalen Mehrwert und als Quellenkern digitalisierter Zeitungen unter Verschluss zu halten. Trotz der Effektivität und Effizienz des „Keyword Searching“, trotz der reichhaltigen Potentiale, mit Metadaten Suchanfragen bzw. Suchergebnisse zu facettieren und zu selektieren, lassen die meisten Portale die Nutzer nur eingeschränkt auf der Vorderbühne der über Interfaces vorjustierten Oberflächen agieren. Zudem stellen sie nur recht komplizierte und restriktive Möglichkeiten des Exports und der Weiterverwertung von Suchresultaten zur Verfügung. Durch solche mangelhafte „Usability“, so zeigt eine Metastudie zur Nutzung digitalisierter Zeitungen, werden die forschungspraktischen Vorteile digitaler Portale, digitaler Recherchetechniken und digitalisierter Zeitungsressourcen von vornherein entscheidend limitiert: „Users of large-scale digitised collections find difficulties in using search functionality to return accurate results […]. They also face the enforcement of a particular type of search and browsing behaviour, created by inflexible interfaces, which force all users into a narrow range of interactions.“ (Gooding 2017, S. 182)

3 Forschungsperspektiven historischer Presseforschung in digitalen Kontexten

Zuletzt steht die Problematik der Forschungsperspektiven historischer Presseforschung in digitalen Kontexten und die Nutzung digitalisierter Zeitungen im Zentrum. Damit wird zum einen die Frage behandelt, welche Forschungsfragen und -interessen sich mit Zeitungen verfolgen lassen, wenn sie digitalisiert als Metadaten und Volltexte vorliegen und mit digitalen Methoden und Techniken untersucht werden können. Im Weiteren geht es um Fragen der Konzeption und Operationalisierung konkreter Forschungsprozesse mit der Zielsetzung, digitale Workflows für die pressehistorische Forschungspraxis zu modellieren.

3.1 Digitale Methoden in der pressehistorischen Forschung

Vor dem Hintergrund der geschilderten grundlegend neuen Forschungs- und Quellensituation liegt es nahe, dass sich die historische Presseforschung vermehrt den Möglichkeiten digitaler Methoden öffnet und die Potentiale des mit Computer, Internet und Software zunehmend digitalen Settings im Forschungsprozess intensiv auslotet. Gemeint ist damit nicht, dass das etablierte, am verstehenden Erklären orientierte, historisch-interpretative Methodenrepertoire zur Disposition steht (vgl. Arnold et al. 2008; Simonson et al. 2013). Kommunikations- und medienhistorische Forschung folgt dem „Mehrmethodendesign der Triangulation“ (Stöber 2016, S. 304). Somit kann es nicht darum gehen, digitale Quellenressourcen wie digitalisierte Zeitungen einfach auf Daten zu reduzieren und unreflektiert bloß noch digitale Methoden einzusetzen. Vielmehr gilt es, hybride Forschungsdesigns und -strategien zu entwickeln, die zu den jeweiligen Fragestellungen und Quellenressourcen passen und die Potentiale digitaler und hermeneutisch-verstehender Methoden kombinieren: „Historical research cannot exclusively be the algorithmic processing of big data sets, no matter how sophisticated the methods are or will be. It also needs research based on the critical interpretation of hybrid information from multiple and varied sources.“ (Wijfjes 2017, S. 8)

In der digitalen Methodendiskussion der historischen Presseforschung bildet vor allem ein Konzept den zentralen Bezugspunkt: Franco Morettis „Distant Reading“ (vgl. Liddle 2012; Nicholson 2012a, 2012b, 2013; Huijnen und Wevers 2015; Wijfjes 2017). In dem Schlüsseltext „Conjectures in World Literature“ hat Moretti mit dem provokanten Motto „We know how to read texts, now let’s learn how not to read them“ (Moretti 2000, S. 57; weiter: Moretti 2013) eine methodische Perspektive vorgezeichnet, die sich nicht mehr direkt, exklusiv und gründlich mit einigen wenigen Texten auseinandersetzt, sondern sich aus der Distanz großen Textmassen zuwendet. Das war eine wichtige methodische Grundidee für die digitale Forschung mit Texten. So hat sich in der Folge unter dem Oberbegriff des „Distant Reading“ ein breites Spektrum an computerlinguistischen und korpusbasierten Methoden und Verfahren entwickelt. Im Gegensatz zum textnahen „Close Reading“ delegieren sie den Leseprozess an Computer und sind dadurch einerseits in der Lage, immens große Mengen Text zu „lesen“ und andererseits zugleich einer neuen „specific form of knowledge“, „from texts to models“ den Weg zu ebnen: „[F]ewer elements, hence a sharper sense of their overall interconnections. Shapes, relations, structures. Forms. Models.“ (Moretti 2005, S. 1)

Im Kern geht es beim „Distant Reading“ – und das macht diese methodische Perspektive für den Umgang mit den beträchtlichen Metadaten- und Volltextmengen digitalisierter Zeitungen so interessant – um die quantitativ-maschinelle Erschließung großer Textkorpora mithilfe von digitalen Methoden und Techniken des „Text Mining“ (vgl. Ignatow und Mihalcea 2017; Tonkin und Tourte 2016). Auf diese Weise wird es möglich, in sehr vielen Texten gemeinsame bzw. diese unterscheidende Eigenheiten, Formen, Merkmale, Muster und Strukturen zu erkennen und diesen wiederum in ihrer langfristigen Entwicklung nachzuspüren. Unabhängig vom jeweiligen Forschungsschwerpunkt „dekonstruieren“ digitale Textmethoden manifeste Texte prinzipiell (vgl. Huijnen und Wevers 2015) und verändern damit den Blick auf Texte und die Forschungspraxis mit Texten gravierend. In Teilen automatisieren und beschleunigen sie Leseprozesse, bringen maschinell „neue“, das heißt komprimierte, auf Algorithmen und statistischen Verfahren beruhende Textextrakte hervor. Sie generieren neue Interpretationskontexte zwischen Einzeltext, Korpus und Kondensat. So setzen sie neue Orientierungspunkte für textnahes „Close Reading“, regen es an und inspirieren es. Computer und digitale Textmethoden entlasten Forscher somit nicht von der Interpretation. Vielmehr fordern sie sie im kontinuierlichen Wechselspiel permanent zum Interpretieren heraus, um den vom Computer entdeckten Textmustern Sinn zu verleihen: „a constant to and for between distant reading and close reading – the interpretation of data visualizations and the zooming in on potentially interesting texts.“ (Huijnen und Wevers 2015)

Im Kontrast zu der Relevanz und den Vorteilen, die „Distant Reading“ und „Text Mining“ in der von der historischen Presseforschung geführten digitalen Methodendiskussion immer wieder zugesprochen werden, fallen sie in der pressehistorischen Methodenpraxis bislang kaum ins Gewicht und sind forschungspraktisch wenig elaboriert. Mit „Experimenten“, einzelnen Methodenversuchen und Modellstudien befindet sich die pressehistorische Forschung in der Anwendung und Nutzung digitaler Methoden für digitalisierte Zeitungsressourcen zur Zeit noch in einem frühen Stadium des Ausprobierens und Testens (vgl. Liddle 2012; Nicholson 2012a, 2012b, 2013). Ordnet man die vorliegenden vereinzelten Studien, die eigens digitale Methoden für die historisch-empirische Erschließung und Untersuchung digitalisierter Zeitungsressourcen verwenden, so zeichnen sich vorerst zwei innovative Forschungsperspektiven ab:
  • „Distant Reading“ von Metadaten. Die Experimente von Dallas Liddle (2012) mit der Times oder von Jean-Philippe Moreux (2015) mit dem französischen Zeitungskorpus in „Europeana Newspapers“ bewegen sich in der digitalen Quellendimension der Metadaten. Metadaten, so Liddle (2012, S. 231), bilden die Zeitung als „physical, typographical, and information artifact“ ab und sind für pressehistorische Forschungen ein dichtes und reichhaltiges Datenkorpus, um den formalen und inhaltlichen Wandel von Zeitungen (Format, Layout, Umfang, Ressorts etc.) sowohl in komparativer Hinsicht wie im Zeitverlauf einzufangen. Mit validen Metadaten lässt sich so u. a. einlösen, worauf Max Weber schon in seiner Skizze zur „Soziologie des Zeitungswesens“ hingewiesen hat, „zu messen, […], wie sich denn der Inhalt der Zeitungen in quantitativer Hinsicht verschoben hat […], […] im Inseratenteil, im Feuilleton, zwischen Feuilleton und Leitartikel, zwischen Leitartikel und Nachricht, zwischen dem, was überhaupt an Nachrichten gebracht wird und was heute nicht mehr gebracht wird.“ (Weber 1988, S. 441)

  • News Culturomics. Von verschiedenen Seiten wird das Potential der „Culturomics“ hervorgehoben, die mit sehr großen Korpora wie beispielsweise dem „Google Books“-Korpus computergestützt kulturelle Entwicklungen, Muster und Trends identifizieren (vgl. Aiden und Michel 2014). Mehr noch als Bücher sieht Bob Nicholson (2012a, 2012b, 2013) Zeitungen als Kulturspeicher. Volltexterschließende Zeitungsportale machen diesen Speicher nun zugänglich und öffnen für die Erforschung der medialen Evolution gesellschaftlicher und kultureller Diskurse neue Perspektiven: „I could use the press as a living dictionary, one which allowed me to access the minutiae of everyday cultural discourse and track the complex ways in which words and phrases circulated, how their meanings evolved and how their usage changed on an almost daily basis.“ (Nicholson 2013, S. 70–71) Pionierstudien in dieser Richtung nutzen die mittels „Text Mining“ ermittelten „Statistical Signals“ in großen Zeitungskorpora, um langfristige Trends sozialen Wandels und Strukturen öffentlicher Diskurse zu rekonstruieren (vgl. Dzogang et al. 2016; Lansdall-Welfare et al. 2017).

3.2 Modellierung digitaler Workflows für die pressehistorische Forschungspraxis

Unter dem Gesichtspunkt der erkenntnispraktischen Funktionen digitaler Methoden für die pressehistorische Forschungspraxis gilt sicher, dass digitalisierte Zeitungsressourcen vollkommen ohne digitalen Methodeneinsatz kaum effektiv und sinnvoll zu untersuchen sind. Vergleichbar den jüngst von Andreas Scheu et al. (2018) beschriebenen Einsatzmöglichkeiten und Potentialen (teil-)automatisierter Verfahren in der qualitativen Forschung erfüllen sie im Umgang mit den bei Suchanfragen anfallenden immensen Metadaten- und Volltextmengen insbesondere explorative und komplexitätsreduzierende Leistungen. So skalieren und steuern sie insgesamt die Interpretation im Spannungsfeld zwischen Gesamtkorpus und exemplarischen Texten. Praktisch resultieren hieraus für den pressehistorischen Forschungsprozess zwei miteinander kombinierbare Wege des interpretativen Zugangs zu Zeitungen:
  • ein quantitativ-textstatistischer, strukturierender „Makro“-Fokus für die Distanz: „to identify broad patterns in the data“;

  • ein hermeneutisch-qualitativer „Mikro“-Fokus für die Nahsicht: „to track […] specific words and texts“ (Nicholson 2013, S. 68, 69 f.).

Operationalisiert und in routinierte Forschungsschritte übertragen, die transparent und zielgerichtet die forschungspraktische Komplexität im Umgang mit digitalen Zeitungsportalen und digitalisierten Zeitungsressourcen berücksichtigen und einbeziehen, sind pressehistorische Forschungsprozesse unter digitalen Bedingungen im Moment noch nicht. Im Folgenden wird ein digitaler Workflow kursorisch vorgestellt, wie er experimentell für eine Fallstudie zur medialen Resonanz der Russischen Revolution 1917 in der zeitgenössischen australischen und US-amerikanischen Presse eingesetzt und erprobt wurde. Dies soll noch einmal praxisnah wesentliche Herausforderungen und Lösungen für digital gerahmte bzw. unterstützte pressehistorische Forschungsprozesse verdeutlichen (siehe Abb. 5):
Abb. 5

Modell eines digitalen Workflows für die pressehistorische Forschungspraxis

1. Schritt: Erkenntnisinteresse und Forschungsumgebung, Portal- und Ressourcenkritik. Grundlegend sind eine Fragestellung, die für Suchanfragen in Suchtermini und -strategien übersetzt werden kann, sowie Fragen der Datengrundlage, Portal- und Ressourcenkritik (siehe Tab. 1): Welches Portal und welche Ressourcen kommen infrage, wie sind Portale und Suchinterfaces funktional konzipiert und wie setzen sich die Zeitungskorpora inhaltlich zusammen? Im Beispiel wurden mit „Chronicling America“ und „Trove“ zwei Zeitungsportale benutzt, die es ermöglichen, Suchanfragen sehr detailliert und komplex einzustellen. Gesucht wurde jeweils über das gesamte Korpus mit einer Wort-im-Kontext-Suche nach „Russia“ und „Revolution“ für den Zeitraum vom 1. Januar 1917 bis zum 31. Dezember 1917.

2. Schritt: Daten abfragen und erheben. Im zweiten Schritt geht es um die Fragen, in welchen Format und mit welcher Granularität und Güte die Ressourcen erschlossen und hinterlegt sind und welche Möglichkeiten bzw. Schnittstellen es gibt, um sie für die Forschung zu nutzen. Im Beispiel wurden mithilfe der von „Chronicling America“ und „Trove“ bereitgestellten Schnittstellen die mit den Suchergebnissen verknüpften Metadaten und Volltexte als Datensets automatisiert abgefragt. Sodann wurden für die weitere Konzeption und quellenkritische Transparenz des Forschungsprozesses exemplarische Ressourcenmodelle erstellt (siehe Abb. 3 und 4), die mit den Kerndimensionen und der Struktur der digitalisierten Zeitungsressourcen zugleich forschungspraktische Grenzen und Potentiale markieren.

3. Schritt: Data Mining und Forschungskorpus mit Preprocessing vorbereiten. Im dritten Schritt stehen unter den Stichworten „Data Mining“ und „Preprocessing“ Probleme der Filterung, Kontrolle und Normalisierung der erhobenen Zeitungsressourcen für die weiteren inhaltlichen Forschungsschritte im Mittelpunkt. In der Dimension der Metadaten betrifft dies vor allem die forschungspraktische Reduktion der teilweise recht umfangreichen Datensets zu Forschungskorpora, der dann in der Dimension der Volltexte die Vorbereitung der oftmals unkuratierten Texte folgt. Unter Kosten-Nutzen-Gesichtspunkten wurde im Beispiel pragmatisch entschieden, erst einmal lediglich das „Trove“-Datenset weiter zu verwenden. Es wurde mit einem Metadatenfilter so reduziert, das das Forschungskorpus nur noch die Suchresultate für die erste Seite und den relativ kleinen Textkorpus der Schlagzeilen umfasst. Verwendet wurde für diesen Selektionsprozess das Datenanalysepaket „Tableau“ (https://www.tableau.com), das je nach Zuschnitt der Metadaten zugleich erste inhaltlich-visuelle Einblicke in den Rhythmus und die Struktur der medialen Resonanz der revolutionären Ereignisse in Russland in der australischen Presse verschafft.

4. Schritt: Text Mining. Mit dem vierten Schritt wendet sich der Forschungsprozess der Untersuchung des Schlagzeilen-Korpus unter Nutzung digitaler textstatistischer Methoden des „Text Mining“ zu. Prinzipiell verarbeiten die verschiedenen Verfahren des „Text Mining“ Texte nicht nur maschinell, sondern stellen verschiedene Techniken der Textextraktion bereit und erzeugen unterschiedliche Textsichten: Grob gesagt geben sie (1.) korpusstatistische Zusammenfassungen; helfen (2.) spezifische Informationen zu extrahieren, etwa geographische Angaben, Konzepte oder vorkommende Personen; liefern (3.) Verwendungsmuster von einzelnen Worten oder Kombinationsmuster mehrerer Worte; identifizieren und klassifizieren (4.) Wort-Cluster als Textthemen oder (5.) Stimmungen in Texten oder Textteilen.

5. Schritt: Interpretation und Visualisierung. Umgesetzt wurde das „Text Mining“ mit der Webschnittstelle „Voyant Tools“ (http://voyant-tools.org) (vgl. Rockwell und Sinclair 2016), die ein breites Spektrum an Verfahren und Techniken des „Text Mining“ sowie die Interpretation unterstützende Visualisierungen integriert. Ohne die mit „Voyant Tools“ hergestellten Textperspektiven einzeln zu interpretieren, sollen sie hier insbesondere zeigen, dass sich mit der Vielfalt digitaler Textwerkzeuge wie Wortkollokationen, Worttrends oder Wortwolken schon im Schlagzeilen-Korpus sehr multiplexe und vielschichtige inhaltliche Muster, Trends und Strukturen der medialen Resonanz der revolutionären Ereignisse in Russland entdecken lassen. In Kombination mit dem hermeneutischen Verstehen provozieren sie eine vermehrt experimentell-kreative Interpretations- und Textpraxis.

4 Resümee

Blickt man resümierend über die digitale Wende der historischen Presseforschung hinaus, so beginnt die deutschsprachige historische Kommunikations- und Medienforschung insgesamt gerade, das digitale Neuland zu entdecken und zu erkunden. Will man diese Entwicklungen erfolgreich weiter gestalten, so gilt es nicht bloß, die Fachdiskussion um die Relevanz und Praxis digitaler Forschungskontexte für die Kommunikations- und Mediengeschichte zu intensivieren und voranzutreiben, sondern zugleich über die spezifischen Feldgrenzen hinauszublicken. Denn weitreichende digitale Methodenkompetenz und -praxis im Umgang mit digitalen Quellen und Ressourcen erschließen der Kommunikations- und Mediengeschichte nicht nur neue forschungspraktische Expertise und methodische Innovationen. Hier ergeben sich auch neue Anknüpfungspunkte für Diskussionen und Kooperationen mit anderen Feldern im Fach Kommunikations- und Medienwissenschaft. In den laufenden Diskussionen um die Zukunft der Kommunikations- und Medienwissenschaft unter digitalen Vorzeichen sind es beispielsweise die routinierten quellenkritischen Reflexionsleistungen, die die historische Kommunikations- und Medienforschung zum Problem der zunehmenden digitalen Medialität von Forschungsdaten einbringen kann: Ob „digital born“ oder „digital reborn“ – charakteristisch sind vor allem deren Flüchtigkeit und Lückenhaftigkeit sowie ihre strukturelle Komplexität, und es bedarf dringend Standards und Kriterien einer fundierten digitalen Ressourcenkritik für die breite kommunikations- und medienwissenschaftlicher Praxis. Mit Quellenressourcen wie digitalisierten Zeitungen liegen zugleich thematische Kooperationen mit der Journalismusforschung, der Internationalen und Interkulturellen Kommunikation oder der Politischen Kommunikation nahe: Mit der Entwicklung und den Strukturen von politischen Diskursen, der Forschung zu Medienereignissen oder der Rekonstruktion medialer Themenkarrieren seien hier nur drei Forschungsfelder mit großen Schnittmengen zur kommunikations- und medienhistorischen Forschung markiert. Sie könnten von gemeinsamen Forschungsperspektiven und dem retrospektiven Zugriff auf digitalisierte Zeitungen enorm profitieren.

Literatur

  1. Ackermann, V. (1992). Presseartikel. In B.-A. Rusinek, V. Ackermann & J. Engelbrecht (Hrsg.), Einführung in die Interpretation historischer Quellen. Schwerpunkt: Neuzeit (S. 233–252). Paderborn: Ferdinand Schöningh.Google Scholar
  2. Aiden, E., & Michel, J.-B. (2014). Uncharted. Big data as a lens on human culture. New York: Riverhead Books.Google Scholar
  3. Arnold, K., Behmer, M., & Semrad, S. (Hrsg.). (2008). Kommunikationsgeschichte. Positionen und Werkzeuge. Ein diskursives Hand- und Lehrbuch. Berlin: Lit.Google Scholar
  4. Balbi, G. (2011). Doing media history in 2050. Westminster Papers in Communication and Culture, 8, 133–157.CrossRefGoogle Scholar
  5. Beall, J. (2008). The weakness of full-text searching. The Journal of Academic Librarienship, 34, 438–444.CrossRefGoogle Scholar
  6. Bingham, A. (2010). The digitization of newspaper archives. Opportunities and challenges for historians. Twentieth Century British History, 21, 225–231.CrossRefGoogle Scholar
  7. Blome, A. (2018). Zeitungen. In L. Busse, W. Enderle, R. Hohls, T. Meyer, J. Prellwitz & A. Schuhmann (Hrsg.), Clio Guide – Ein Handbuch zu digitalen Ressourcen für die Geschichtswissenschaften (Bd. 2, S. 1–36). Berlin: Clio-online.Google Scholar
  8. Bösch, F. (2018). Mediengeschichte. Archive und Online-Ressourcen für die Forschung. In L. Busse, W. Enderle, R. Hohls, T. Meyer, J. Prellwitz & A. Schuhmann (Hrsg.), Clio Guide – Ein Handbuch zu digitalen Ressourcen für die Geschichtswissenschaften (Bd. 2, S. 1–18). Berlin: Clio-online.Google Scholar
  9. Brake, L. (2012). Half full and half empty. Journal of Victorian Culture, 17, 222–229.CrossRefGoogle Scholar
  10. Cohen, M. (1999). The sentimental education of the novel. Princeton: Princeton University Press.Google Scholar
  11. Day, R. (2014). Indexing it all. The subject in the Age of documentation, information and data. Cambridge: MIT Press.Google Scholar
  12. Deacon, D. (2007). Yesterday’s papers and today’s technology. Digital newspaper archives and „push button“ content analysis. European Journal of Communication, 22, 5–26.CrossRefGoogle Scholar
  13. Fickers, A. (2016). Digitale Metaquellen und doppelte Reflexivität. https://www.hsozkult.de/debate/id/diskussionen-2954. Zugegriffen: 31. Aug. 2018. H‑Soz-Kult-Forum: Historische Grundwissenschaften und die digitale Herausforderung.Google Scholar
  14. Dzogang, F., Lansdall-Welfare, T., FindMyPast Newspaper Team, & Cristianini, N. (2016). Discovering periodic patterns in historical news. PLoS One, 11(11)  https://doi.org/10.1371/journal.pone.0165736.CrossRefGoogle Scholar
  15. Genet, J.-P. (1994). Source, Métasources, Texte, Histoire. In F. Bocchi & P. Denley (Hrsg.), Storia & Multimedia (S. 3–17). Bologna: Grafis Editori.Google Scholar
  16. Gooding, P. (2017). Historic newspapers in the digital Age: „search all about it“. London: Routledge.Google Scholar
  17. Graham, S., Milligan, I., & Weingart, S. (2016). Exploring big historical data. The historian’s Macroscope. London: Imperial College Press.Google Scholar
  18. Hepp, A. (2016). Kommunikations- und Medienwissenschaft in datengetriebenen Zeiten. Publizistik, 61, 225–246.CrossRefGoogle Scholar
  19. Huijnen, P., & Wevers, M. (2015). Digital Deconstruction. The digital turn and the use of news media as sources for historical research. Officina della Storia. https://www.officinadellastoria.eu/it/2015/09/14/digital-deconstruction-the-digital-turn-and-the-use-of-news-media-as-sources-for-historical-research/. Zugegriffen: 31. Aug. 2018.Google Scholar
  20. Huistra, H., & Mellinek, B. (2016). Phrasing history. Selecting sources in digital repositories. Historical Methods, 49, 220–229.CrossRefGoogle Scholar
  21. Ignatow, G., & Mihalcea Rada, F. (2017). An introduction to text mining. Research design, data collection, and analysis. Los Angeles: SAGE.Google Scholar
  22. Koenen, E., Schwarzenegger, C., Bolz, L., Gentzel, P., Kramp, L., Pentzold, C., & Sanko, C. (2018). Historische Kommunikations- und Medienforschung im digitalen Zeitalter. Medien & Zeit, 33(2), 4–19. Ein Kollektivbeitrag der Initiative „Kommunikationsgeschichte digitalisieren“ zu Konturen, Problemen und Potentialen kommunikations- und medienhistorischer Forschung in digitalen Kontexten.Google Scholar
  23. Kranzberg, M. (1986). Technology and history. Kranzbergs law’s. Technology and Culture, 27, 544–560.CrossRefGoogle Scholar
  24. Kraus, H.-C. (2002). Zeitungen, Zeitschriften, Flugblätter, Pamphlete. In M. Maurer (Hrsg.), Quellen. Aufriss der Historischen Wissenschaften, (Bd. 4, S. 373–401). Stuttgart: Philipp Reclam jun.Google Scholar
  25. Lansdall-Welfare, T., Sudhahar, S., Thompson, J., Lewis, J., FindMyPast Newspaper Team, & Cristianini, N. (2017). Analysis of 150 years of British periodicals. Proceedings of the National Academy of Sciences, 114(4)  https://doi.org/10.1073/pnas.1606380114.CrossRefGoogle Scholar
  26. Liddle, D. (2012). Reflections on 20,000 victorian newspapers. „distant reading“ the times using the times digital archive. Journal of Victorian Culture, 17, 230–237.CrossRefGoogle Scholar
  27. Maurantonio, N. (2014). Archiving the visual. The promises and pitfalls of digital newspapers. Media History, 20, 88–102.CrossRefGoogle Scholar
  28. Moretti, F. (2000). Conjectures in world literature. New Left Review, 1, 54–68.Google Scholar
  29. Moretti, F. (2005). Graphs, maps, trees. Abstract models for literary history. London: Verso.Google Scholar
  30. Moretti, F. (2013). Distant reading. London: Verso.Google Scholar
  31. Moreux, J.-P. (2015). Data mining historical newspaper Metadata. Old news teaches history. http://altomator.github.io/EN-data_mining/. Zugegriffen: 31. Aug. 2018.Google Scholar
  32. Mussell, J. (2017). Beyond the „great index“. Digital resources and actual copies. In J. Shattock (Hrsg.), Journalism and the periodical press in nineteenth-century britain (S. 17–30). Cambridge: Cambridge University Press.CrossRefGoogle Scholar
  33. Nicholson, B. (2012a). Looming large. America and the late-victorian press, 1865–1902. PhD Thesis, University of Manchester. http://digitalvictorianist.com/Shared%20Files/Bob%20Nicholson%20-%20PhD%20Thesis%20-%20Looming%20Large%20-%202012.pdf. Zugegriffen: 31. Aug. 2018.Google Scholar
  34. Nicholson, B. (2012b). Counting culture; or, how to read victorian newspapers from a distance. Journal of Victorian Culture, 17, 238–246.CrossRefGoogle Scholar
  35. Nicholson, B. (2013). The digital turn. Exploring the methodological possibilities of digital newspaper archives. Media History, 19, 59–73.CrossRefGoogle Scholar
  36. Opgenoorth, E. (1997). Einführung in das Studium der neueren Geschichte (5. Aufl.). Paderborn: Ferdinand Schöningh.Google Scholar
  37. Ramsey, S. (2011). Reading machines. Toward an algorithmic criticism. University of Illinois Press: Urbana.Google Scholar
  38. Rockwell, G., & Sinclair, S. (2016). Hermeneutica. Computer-assisted interpretation in the humanities. Cambridge: MIT Press.Google Scholar
  39. Scheu, A., Vogelgesang, J., & Scharkow, M. (2018). Qualitative Textanalyse. Blaupause und Potenziale (teil-)automatisierter Verfahren. In A. Scheu (Hrsg.), Auswertung qualitativer Daten in der Kommunikationswissenschaft (S. 309–322). Wiesbaden: Springer VS.CrossRefGoogle Scholar
  40. Simonson, P., Peck, J., Craig, R. T., & Jackson, J. P. (Hrsg.). (2013). The handbook of communication history. New York: Routledge.Google Scholar
  41. Smits, T. (2014). Problems and possibilities of digital newspaper and periodical archives. Tijdschrift Voor Tijdschriftstudies, 36, 139–146.CrossRefGoogle Scholar
  42. Spahn, M. (1908). Die Presse als Quelle der neuesten Geschichte und ihre gegenwärtigen Benutzungsmöglichkeiten. Internationale Wochenschrift für Wissenschaft, Kunst und Technik, 2(1163–1170), 1201–1212.Google Scholar
  43. Steinbach, P. (1999). Zeitgeschichte und Massenmedien aus der Sicht der Geschichtswissenschaft. In J. Wilke (Hrsg.), Massenmedien und Zeitgeschichte (S. 32–52). Konstanz: UVK.Google Scholar
  44. Stöber, R. (2016). Historische Methoden in der Kommunikationswissenschaft. In S. Averbeck-Lietz & M. Meyen (Hrsg.), Handbuch nicht standardisierte Methoden in der Kommunikationswissenschaft (S. 303–318). Wiesbaden: Springer VS.CrossRefGoogle Scholar
  45. Strange, C., Wodak, J., & Wood, I. (2014). Mining for the meanings of a murder. The impact of OCR quality on the use of digitized historical newspapers. Digital Humanities Quarterly, 8. http://www.digitalhumanities.org/dhq/vol/8/1/000168/000168.html. Zugegriffen: 31. Aug. 2018.Google Scholar
  46. Strippel, C., Bock, A., Katzenbach, C., Mahrt, M., Merten, L., Nuernbergk, C., Pentzold, C., Puschmann, C., & Waldherr, A. (2018a). Die Zukunft der Kommunikationswissenschaft ist schon da, sie ist nur ungleich verteilt. Eine Kollektivreplik. Publizistik, 63, 11–27.CrossRefGoogle Scholar
  47. Strippel, C., Bock, A., Katzenbach, C., Mahrt, M., Merten, L., Nuernbergk, C., Pentzold, C., & Waldherr, A. (2018b). Call for Papers für ein Themenheft „Herausforderungen der Digitalisierung – Theoretische und methodische Antworten der Kommunikationswissenschaft“. Publizistik, 63, 7–9.CrossRefGoogle Scholar
  48. Tonkin, E. L., & Tourte, G. J. L. (2016). Working with text. Tools, techniques and approaches for text mining. Amsterdam: Elsevier. Chandos PublishingGoogle Scholar
  49. Underwood, T. (2014). Theorizing research practices we forgot to theorize twenty years Ago. Representations, 127, 64–72.CrossRefGoogle Scholar
  50. Upchurch, C. (2012). Full-text databases and historical research. Cautionary results from a ten-year study. Journal of Social History, 46, 89–105.CrossRefGoogle Scholar
  51. Weber, M. (1988). Soziologie des Zeitungswesens. In M. Weber (Hrsg.), Gesammelte Aufsätze zur Soziologie und Sozialpolitik (2. Aufl. S. 434–441). Tübingen: J. C. B. Mohr (Paul Siebeck).Google Scholar
  52. Wijfjes, H. (2017). Digital humanities and media history. A challenge for historical newspaper research. Tijdschrift voor Mediageschiedenis, 20, 4–24.Google Scholar
  53. Wilke, J. (1987). Quantitative Methoden in der Kommunikationsgeschichte. In M. Bobrowsky & W. R. Langenbucher (Hrsg.), Wege zur Kommunikationsgeschichte (S. 49–57). München: Verlag Ölschläger.Google Scholar
  54. Wilke, J. (1999). Massenmedien und Zeitgeschichte aus der Sicht der Publizistikwissenschaft. In J. Wilke (Hrsg.), Massenmedien und Zeitgeschichte (S. 19–31). Konstanz: UVK.Google Scholar
  55. Witten, I. H., Gori, M., & Numerico, T. (2007). Web dragons. Inside the myths of search engine technology. San Francisco: Morgan Kaufmann.Google Scholar

Copyright information

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2018

Authors and Affiliations

  1. 1.Zentrum für Medien-, Kommunikations- und Informationsforschung (ZeMKI)Universität BremenBremenDeutschland

Personalised recommendations