Slavistische Textkorpora und Textsammlungen im Internet

Altkirchenslavisch

Westslavische Sprachen

  • Niedersorbisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Sorbisches Institut, Cottbus
    Dolnoserbski tekstowy korpus
    http://www.dolnoserbski.de/korpus/
  • Obersorbisch
    Korpus, nur mit Anmeldung, Text nicht zugänglich, Suchverfahren
    Sorbisches Institut, Bautzen
    Hornjoserbski tekstowy korpus
    http://www.serbski-institut.de/cms/os/48/hornjoserbski
  • Polnisch
    Narodowy Korpus Języka Polskiego
    http://www.nkjp.pl/
  • Polnisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Instytut Podstaw Informatyki PAN
    Korpus IPI PAN
    korpus.pl/pl/index.php
  • Polnisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Wydawnictwo Naukowe PWN
    Korpus Języka Polskiego Wydawnictwa Naukowego PWN
    korpus.pwn.pl/szukaj.php
  • Polnisch
    Marek Adamiec
    Textsammlung, reiner Text
    Wirtualna biblioteka literatury polskiej
    literat.ug.edu.pl/books.htm
  • Polnisch
    Textsammlung, reiner Text
    Instytut Filologii Polskiej, Wydział Filologiczno-Historyczny (Uniwersytet Gdański)
    Biblioteka literatuy polskiej w internecie
    literat.ug.edu.pl
  • Altpolnisch
    Textsammlung, reiner Text
    Staropolska on-line
    staropolska.pl
  • Slovakisch
    Korpus, mit oder ohne Anmeldung, Text nicht zugänglich, Suchverfahren
    Slovenský národný korpus
    korpus.juls.savba.sk
  • Tschechisch
    Korpus, mit oder ohne Anmeldung, Text nicht zugänglich, Suchverfahren
    Český národní korpus
    ucnk.ff.cuni.cz
  • Tschechisch
    Sammlung digitalisierter Texte aus den Beständen der Tschechischen Nationalbibliothek
    Kramerius NK ČR
    http://kramerius.nkp.cz/kramerius/Welcome.do
  • Tschechisch
    Textsammlung, Registrierung erforderlich
    Česká elektronická knihovna - Plnotextová databáze české poezie 19. a počátku 20. století
    www.ceska-poezie.cz

Südslavische Sprachen

  • Bosnisch
    Korpus, Suchverfahren, Anmeldung erforderlich
    Tekstlaboratoriet, Universitetet i Oslo
    The Oslo Corpus of Bosnian Texts
    www.tekstlab.uio.no/Bosnian/Corpus.html
    - Zugang: Mit Onlineabfrage und vielen interessanten Möglichkeiten, jedoch Anmeldung erforderlich
    - Umfang: ca. 1,5 Mio. Wörter
  • Kroatisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Institute of Linguistics, University of Zagreb
    Hrvatski nacionalni korpus
    www.hnk.ffzg.hr
    - Umfang: 9.156.446 Wörter
  • Kroatisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Institut za hrvatski jezik i jezikoslovlje
    Hrvatska jezična mrežna riznica
    riznica.ihjj.hr
    - Enthält Original- und Übersetzungsprosa, Sachliteratur, wissenschaftliche Literatur, Zeitungen, ältere Literatur
  • Kroatisch
    Sammlung von kroatischen literarischen Texten verschiedener Epochen
    betrieben von Kroatistik-Student/innen aus Zagreb
    Književnost
    http://www.hrvatskijezik.eu/?q=knjizevnost
  • Mazedonisch
    Textsammlung
    Истражувачки центар за ареална лингвистика (ИЦАЛ)
    Дигитален архив на македонскиот јазик
    damj.manu.edu.mk
    - Enthält ältere Texte zur Geschichte der mazedonische Sprache in Form von durchsuchbaren PDF-Dateien
  • Serbisch
    Korpus savremenog srpskog jezika na Matematičkom fakultetu Univerziteta u Beogradu (Anmeldung nötig)
    http://korpus.matf.bg.ac.rs/prezentacija/korpus.html
  • Serbisch
    Korpus
    Institute for Experimental Phonetics and Speech Pathology, Belgrade; Laboratory for Experimental Psychology, University of Belgrade
    Corpus of Serbian Language by Đorđe Kostić
    www.serbian-corpus.edu.rs/ie/menu/emenu.html
    - (noch?) nicht online abfragbar, auch Anfrage werden jedoch die gewünschten Belege per Email zugesandt
    - Umfang: noch nicht sehr weit
  • Serbisch
    Textsammlung, reiner Text

    Projekat Rastko, Biblioteka srpske kulture

    www.rastko.rs
  • Serbisch/Kroatisch/Bosnisch
    Info
    Marko Tadić
    Artikel “Natural Language Processing of Croatian and the Croatian National Corpus”
    www.hnk.ffzg.hr/txts/mt4hnk_e.pdf
    www.hnk.ffzg.hr/mt/ (Homepage von Marko Tadić)
  • Serbisch/Kroatisch/Bosnisch
    Korpus
    Danko Sipka, Katedra za Slavistiku Univerziteta Adama Mickjevića u Poznanju
    Srpskohrvatski tekstualni korpusi
    www.staff.amu.edu.pl/~sipkadan/korpus.html
    - Inhalt: Links zu serbischen/kroatisch/bosnischen Korpora, leider recht veraltet
  • Serbisch/Kroatisch/Bosnisch
    Korpus, Text nicht zugänglich, Suchverfahren
    SFB 441, Projekt B8, Universität Tübingen
    Tübinger BKS-Korpus - Bosnisch/Kroatisch/Serbisches Korpus - TUSNELDA electronic version
    tusnelda.sfb.uni-tuebingen.de/TUSNELDA/b8/b8header.html (Projektbeschreibung), tusnelda.sfb.uni-tuebingen.de/tusnelda-query.html (Onlineabrage)
  • Serbisch/Kroatisch/Bosnisch
    Textsammlung, reiner Text
    Borut Maričić
    South Slavic Literature Library
    www.borut.com/library/index.htm
    - Linksammlung
  • Slovenisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Fran Ramovš Institute of Slovenian Language ZRC-SAZU Corpus Laboratory
    nova beseda
    bos.zrc-sazu.si/a_beseda.html
    - Inhalt: verschiedene Textsorten
  • Slovenisch
    Korpus, reiner Text
    Miran Hladnik
    Zbirka slovenskih leposlovnih besedil
    www.ijs.si/lit/leposl.html
  • Slovenisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Philosophische Fakultät der Universität Ljubljana und Jožef-Stefan-Institut
    Korpus slovenskega jezika FIDA
    www.fidaplus.net

Ostslavische Sprachen

  • Russisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Nacional’nyj korpus russkogo jazyka
    www.ruscorpora.ru
  • Russisch
    Korpus, Textdateien
    Universität Uppsala
    The Uppsala Russian Corpus
    www.slaviska.uu.se/korpus.htm
  • Russisch
    Korpus, Text nicht zugänglich, Suchverfahren
    SFB 441, Projekt B1, Universität Tübingen
    Tübinger russische Korpora
    www.sfb441.uni-tuebingen.de/b1/korpora.html
    - Mit Onlineabfrage in kyrillischer Schrift oder Transliteration - Inhalt: Uppsala-Korpus, Interviewtexte, Artikel aus der Zeitschrift Ogonek, Literatur des 19. und 20. Jhs.
    derzeit nicht zugänglich
  • Russisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Bol’šoj korpus russkogo jazyka (BOKR)
    www.comp.leeds.ac.uk/ssharoff/bokrcorpora
  • Russisch
    Korpus, Text nicht zugänglich, Suchverfahren
    AOT - Avtomatičeskaja obrabotka teksta
    www.aot.ru
  • Russisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Arto Mustajoki (Projektleiter)
    Chanko - Chel'sinskij annotirovannyj korpus
    www.ling.helsinki.fi/projects/hanco/
    - Umfang: 100.000 Wörter aus der Zeitschrift „Itogi“
  • Russisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Institut für Slavistik, Universität Regensburg
    Regensburger Diachrones Korpus des Russischen
    www-korpus.uni-r.de/diakorp/
  • Russisch
    Textsammlung, reiner Text
    Biblioteka Maksima Moškova
    lib.ru
    - sehr umfangreiche Textsammlung
    - Inhalt: klassische und moderne Prosa und Lyrik, Texte von Liedermachern, Kriminalromane, Sachprosa, Übersetzungsliteratur u.v.m
  • Russisch
    Textsammlung, reiner Text
    Evgenij Peskin
    Publičnaja ėlektronnaja biblioteka
    public-library.narod.ru
    - Inhalt: russische (v.a. klassische) Literatur
  • Russisch
    Textsammlung, reiner Text
    Maria Škol’nikova
    Poėty na stichi
    www.litera.ru/stixiya/poets.html
    - Inhalt: umfangreiche Sammlung russischer Lyrik
  • Russisch
    Textsammlung, reiner Text
    Igor Sazonov
    Klassika.ru
    www.klassika.ru
  • Russisch
    Textsammlung, reiner Text
    Proza i poėzija
    www.friends-partners.org/partners/afarber/proza.html, www.friends-partners.org/partners/afarber/poeziya.html
    - Inhalt: Links zu russischen Prosa- und Lyriktexten im Internet (nach Autoren sortiert)
    - Die Seite wird offenbar nicht mehr gepflegt, viele Links sind veraltet.
  • Russisch
    Textsammlung, reiner Text
    Biblioteka (Internet-izdatel'stvo)
    www.magister.msk.ru/library/
    - Inhalt: Prosa des 19. und 20. Jh., Texte zu Geschichte, Philosophie, Psychologie, Politik
  • Russisch
    Textsammlung, reiner Text
    Russkaja virtual'naja biblioteka
    rvb.ru
    - Inhalt: Belletristik vom 18.-20. Jh.
  • Russisch
    Textsammlung, HTML-Text Text
    Ostrovok
    www.ostrovok.de
    Sammlung zeitgenössischer russischer Prosa und Lyrik
  • Russisch
    Textsammlung, reiner Text, Suchverfahren
    Fundamental’naja ėlektronnaja biblioteka "Russkaja literatura i fol’klor"
    http://feb-web.ru/
    Inhalt: Literatur vom 11.–20. Jh., Folklore, Literaturwissenschaft und -kritik
  • Russisch
    Zeitungsarchiv, Text nicht zugänglich, Suchverfahren
    Laboratorii obščej i komp'juternoj leksikologii i leksikografii filologičeskogo fakulteta MGU
    Komp'juternyj korpus tekstov russkich gazet konca XX-ogo veka
    www.philol.msu.ru/~lex/corpus/
  • Ukrainisch
    Textsammlung, HTML-Text, Suchmöglichkeit vorhanden
    Elektronnaja biblioteka ukraïns'koï literatury
    www.utoronto.ca/elul/Main-Ukr.html
    Enthält auch eine umfangreiche Linksammlung
  • Altweißrussisch
    Textsammlung, reiner Text
    The Old Belarusian Poetry
    www.belarusguide.com/culture1/literature/Old_Poetry.html

Mehrsprachige Korpora 

  • Korpus 
    ParaSol: A Parallel Corpus of Slavic and other languages 
    http://parasol.unibe.ch
    – Slavische, deutsche und englische Originaltexte mit verschiedenen slavischen und deutschen Übersetzungen, teilweise getaggt 
  • Korpus, reiner Text 
    Multext-East “1984” Corpus 
    nl.ijs.si/ME/CD/docs/1984.html 
    - Inhalt: George Orwells „1984“ in Englisch und einigen osteuropäischen Sprachen 
  • Korpus 
    Linguistisches Laboratorium (LiLab), Seminar für Slavistik, Universität Bochum 
    Akustische Datenbanken u.a.m. 
    www.ruhr-uni-bochum.de/lilab/ > Dokumentation ... > ..., > Landeskunde ... > ... 
  • Korpus 
    SFB 441, Universität Tübingen 
    Korpora, Sammlung von Internetadressen 
    www.sfb441.uni-tuebingen.de/c1/corpora.html

Linksammlungen
(nicht nur zu slavistischen Korpora)

Informationen zur Korpuslinguistik