Slavistische Textkorpora und Textsammlungen im Internet
Inhalt |
Altkirchenslavisch
- Infoseite
Kodeks, Mediävistische Sektionen
kodeks.uni-bamberg.de/Medieval.htm - Infoseite
R. M. Cleminson
Obščežitie, The webpage for the study of cyrillic and glagolitic manuscripts and early printed books
www.obshtezhitie.net - Korpus, reiner Text
Frederik Kortlandt
Electronic text editions
www.kortlandt.nl/editions/
- Inhalt: altslovenische (Freisinger Denkmäler), altpolnische und altpreußische Texte, auch in TITUS) enthalten - Korpus, reiner Text
Jos Schaeken
Electronic text editions
www.schaeken.nl/lu/research/online/index.htm
- auch in TITUS) enthalten - Korpus, reiner Text
Slavonic and Baltic Department of the University of Helsinki
Corpus Cyrillo-Methodianum Helsingiense. An Electronic Corpus of Old Church Slavonic Texts
www.slav.helsinki.fi/ccmh/ - Korpus, reiner Text (xml, sgml)
R. M. Cleminson
The Budapest Glagolitic Fragments
userwww.port.ac.uk/cleminsr/introd.html - Textsammlung, zugänglich mit Hilfe eines frei downloadbaren Programms
Slavonic Software, Sankt Petersburg
Altkirchenslavische Bibel
jove.prohosting.com/~ggz/downloads.html - Textsammlung, Text in kyrillischer Schrift als pdf-Dateien
Norwegian University of Science and technology, Trondheim/New Bulgarian University, Sofia
Corpus of Old Slavic Texts from the XIth Century
mime.hf.ntnu.no/SofiaTrondheimCorpus/
Westslavische Sprachen
- Obersorbisch
Korpus, Text nicht zugänglich, Suchverfahren
Sorbisches Institut, Bautzen
Hornjoserbski tekstowy korpus
sibz.whyi.org/cgi-bin/corpus Polnisch
Narodowy Korpus Języka Polskiego
http://www.nkjp.pl/- Polnisch
Korpus, CD-Rom
Polska Akademia Nauk / Instytut Języka Polskiego, Kraków
Słownik frekwencyjny polszczyzny wspólczesnej (1990)
- Umfang: 500 000 Wörter (jeweils 100 000 aus wissenschaftlichen Texten, Pressenachrichten, Publizistik, Prosa und Drama) - Polnisch
Korpus, Text nicht zugänglich, Suchverfahren
Instytut Podstaw Informatyki PAN
Korpus IPI PAN
korpus.pl/pl/index.php
- Umfang: mehr als 300 Mio. Wörter - Polnisch
Korpus, Text nicht zugänglich, Suchverfahren
Wydawnictwo Naukowe PWN
Korpus Języka Polskiego Wydawnictwa Naukowego PWN
korpus.pwn.pl/szukaj.php
- Umfang: 1.817.058 Wörter - Polnisch
Korpus
Korpus des Instituts für polnische Sprache, Krakau
- Umfang: 14 Mio. Wörter (9,5 Mio. Presse, 4,5 Mio. Belletristik)
- Zugang: intern, nach Vereinbarung auch für externe Forscher Nutzung möglich; Kontakt: RafalG@ijp-pan.krakow.pl - Polnisch
Korpus, Text nicht zugänglich, Suchverfahren
Polish and English Language Corpora for Research and Applications (PELCRA)
pelcra.ia.uni.lodz.pl
- Zugang: intern, nach Absprache auch für externe Forscher nutzbar
- Kontakt: walinski@krysia.uni.lodz.pl - Polnisch
R. Antoszewski
Textsammlung
Nowa netografia
homepages.ihug.co.nz/~antora/NETOGRAF/NETOGRAF.HTM
- Inhalt: Links zu Textsammlungen - Polnisch
Marek Adamiec
Textsammlung, reiner Text
Wirtualna biblioteka literatury polskiej
literat.ug.edu.pl/books.htm - Polnisch
Textsammlung, reiner Text
Instytut Filologii Polskiej, Wydział Filologiczno-Historyczny (Uniwersytet Gdański)
Biblioteka literatuy polskiej w internecie
literat.ug.edu.pl - Altpolnisch
Textsammlung, reiner Text
Staropolska on-line
staropolska.pl - Slovakisch
Korpus, mit oder ohne Anmeldung, Text nicht zugänglich, Suchverfahren
Slovenský národný korpus
korpus.juls.savba.sk - Tschechisch
Korpus, mit oder ohne Anmeldung, Text nicht zugänglich, Suchverfahren
Český národní korpus
ucnk.ff.cuni.cz - Tschechisch
Sammlung digitalisierter Texte aus den Beständen der Tschechischen Nationalbibliothek
Kramerius NK ČR
http://kramerius.nkp.cz/kramerius/Welcome.do - Tschechisch
Textsammlung, Registrierung erforderlich
Česká elektronická knihovna - Plnotextová databáze české poezie 19. a počátku 20. století
www.ceska-poezie.cz
Südslavische Sprachen
- Bulgarisch
Textsammlung, reiner Text
Holger von Rauch
Bulgarische virtuelle Bibliotheken
www.vonrauch.de/bulg/bulbib.htm
- Linksammlung - Bosnisch
Korpus, Suchverfahren, Anmeldung erforderlich
Tekstlaboratoriet, Universitetet i Oslo
The Oslo Corpus of Bosnian Texts
www.tekstlab.uio.no/Bosnian/Corpus.html
- Zugang: Mit Onlineabfrage und vielen interessanten Möglichkeiten, jedoch Anmeldung erforderlich
- Umfang: ca. 1,5 Mio. Wörter - Kroatisch
Korpus, Text nicht zugänglich, Suchverfahren
Institute of Linguistics, University of Zagreb
Hrvatski nacionalni korpus
www.hnk.ffzg.hr
- Umfang: 9.156.446 Wörter - Kroatisch
Korpus, Text nicht zugänglich, Suchverfahren
Institut za hrvatski jezik i jezikoslovlje
Hrvatska jezična mrežna riznica
riznica.ihjj.hr
- Enthält Original- und Übersetzungsprosa, Sachliteratur, wissenschaftliche Literatur, Zeitungen, ältere Literatur - Kroatisch
Sammlung von kroatischen literarischen Texten verschiedener Epochen
betrieben von Kroatistik-Student/innen aus Zagreb
Književnost
http://www.hrvatskijezik.eu/?q=knjizevnost - Mazedonisch
Textsammlung
Истражувачки центар за ареална лингвистика (ИЦАЛ)
Дигитален архив на македонскиот јазик
damj.manu.edu.mk
- Enthält ältere Texte zur Geschichte der mazedonische Sprache in Form von durchsuchbaren PDF-Dateien - Serbisch
Korpus savremenog srpskog jezika na Matematičkom fakultetu Univerziteta u Beogradu (Anmeldung nötig)
http://korpus.matf.bg.ac.rs/prezentacija/korpus.html - Serbisch
Korpus
Institute for Experimental Phonetics and Speech Pathology, Belgrade; Laboratory for Experimental Psychology, University of Belgrade
Corpus of Serbian Language by Đorđe Kostić
www.serbian-corpus.edu.rs/ie/menu/emenu.html
- (noch?) nicht online abfragbar, auch Anfrage werden jedoch die gewünschten Belege per Email zugesandt
- Umfang: noch nicht sehr weit - Serbisch
Textsammlung, reiner TextProjekat Rastko, Biblioteka srpske kulture
www.rastko.rs - Serbisch/Kroatisch/Bosnisch
Info
Marko Tadić
Artikel “Natural Language Processing of Croatian and the Croatian National Corpus”
www.hnk.ffzg.hr/txts/mt4hnk_e.pdf
www.hnk.ffzg.hr/mt/ (Homepage von Marko Tadić) - Serbisch/Kroatisch/Bosnisch
Korpus
Danko Sipka, Katedra za Slavistiku Univerziteta Adama Mickjevića u Poznanju
Srpskohrvatski tekstualni korpusi
www.staff.amu.edu.pl/~sipkadan/korpus.html
- Inhalt: Links zu serbischen/kroatisch/bosnischen Korpora, leider recht veraltet - Serbisch/Kroatisch/Bosnisch
Korpus, Text nicht zugänglich, Suchverfahren
SFB 441, Projekt B8, Universität Tübingen
Tübinger BKS-Korpus - Bosnisch/Kroatisch/Serbisches Korpus - TUSNELDA electronic version
tusnelda.sfb.uni-tuebingen.de/TUSNELDA/b8/b8header.html (Projektbeschreibung), tusnelda.sfb.uni-tuebingen.de/tusnelda-query.html (Onlineabrage) - Serbisch/Kroatisch/Bosnisch
Textsammlung, reiner Text
Borut Maričić
South Slavic Literature Library
www.borut.com/library/index.htm
- Linksammlung - Slovenisch
Korpus, Text nicht zugänglich, Suchverfahren
Fran Ramovš Institute of Slovenian Language ZRC-SAZU Corpus Laboratory
nova beseda
bos.zrc-sazu.si/a_beseda.html
- Inhalt: verschiedene Textsorten - Slovenisch
Korpus, reiner Text
Miran Hladnik
Zbirka slovenskih leposlovnih besedil
www.ijs.si/lit/leposl.html - Slovenisch
Korpus, Text nicht zugänglich, Suchverfahren
Philosophische Fakultät der Universität Ljubljana und Jožef-Stefan-Institut
Korpus slovenskega jezika FIDA
www.fidaplus.net
Vorgängerprojekt (mit einem kleineren Korpus)
www.fida.net
Ostslavische Sprachen
- Russisch
Korpus, Text nicht zugänglich, Suchverfahren
Nacional’nyj korpus russkogo jazyka
www.ruscorpora.ru - Russisch
Korpus, Textdateien
Universität Uppsala
The Uppsala Russian Corpus
www.slaviska.uu.se/korpus.htm - Russisch
Korpus, Text nicht zugänglich, Suchverfahren
SFB 441, Projekt B1, Universität Tübingen
Tübinger russische Korpora
www.sfb441.uni-tuebingen.de/b1/korpora.html
- Mit Onlineabfrage in kyrillischer Schrift oder Transliteration - Inhalt: Uppsala-Korpus, Interviewtexte, Artikel aus der Zeitschrift Ogonek, Literatur des 19. und 20. Jhs.
derzeit nicht zugänglich - Russisch
Korpus, Text nicht zugänglich, Suchverfahren
Bol’šoj korpus russkogo jazyka (BOKR)
www.comp.leeds.ac.uk/ssharoff/bokrcorpora - Russisch
Korpus, Text nicht zugänglich, Suchverfahren
AOT - Avtomatičeskaja obrabotka teksta
www.aot.ru - Russisch
Korpus, Text nicht zugänglich, Suchverfahren
Arto Mustajoki (Projektleiter)
Chanko - Chel'sinskij annotirovannyj korpus
www.ling.helsinki.fi/projects/hanco/
- Umfang: 100.000 Wörter aus der Zeitschrift „Itogi“ - Russisch
Korpus, Text nicht zugänglich, Suchverfahren
Institut für Slavistik, Universität Regensburg
Regensburger Diachrones Korpus des Russischen
www-korpus.uni-r.de/diakorp/ - Russisch
Textsammlung, reiner Text
Biblioteka Maksima Moškova
lib.ru
- sehr umfangreiche Textsammlung
- Inhalt: klassische und moderne Prosa und Lyrik, Texte von Liedermachern, Kriminalromane, Sachprosa, Übersetzungsliteratur u.v.m - Russisch
Textsammlung, reiner Text
Evgenij Peskin
Publičnaja ėlektronnaja biblioteka
public-library.narod.ru
- Inhalt: russische (v.a. klassische) Literatur - Russisch
Textsammlung, reiner Text
Maria Škol’nikova
Poėty na stichi
www.litera.ru/stixiya/poets.html
- Inhalt: umfangreiche Sammlung russischer Lyrik - Russisch
Textsammlung, reiner Text
Igor Sazonov
Klassika.ru
www.klassika.ru - Russisch
Textsammlung, reiner Text
Proza i poėzija
www.friends-partners.org/partners/afarber/proza.html, www.friends-partners.org/partners/afarber/poeziya.html
- Inhalt: Links zu russischen Prosa- und Lyriktexten im Internet (nach Autoren sortiert)
- Die Seite wird offenbar nicht mehr gepflegt, viele Links sind veraltet. - Russisch
Textsammlung, reiner Text
Biblioteka (Internet-izdatel'stvo)
www.magister.msk.ru/library/
- Inhalt: Prosa des 19. und 20. Jh., Texte zu Geschichte, Philosophie, Psychologie, Politik - Russisch
Textsammlung, reiner Text
Russkaja virtual'naja biblioteka
rvb.ru
- Inhalt: Belletristik vom 18.-20. Jh. - Russisch
Textsammlung, HTML-Text Text
Ostrovok
www.ostrovok.de
Sammlung zeitgenössischer russischer Prosa und Lyrik - Russisch
Textsammlung, reiner Text, Suchverfahren
Fundamental’naja ėlektronnaja biblioteka "Russkaja literatura i fol’klor"
http://feb-web.ru/
Inhalt: Literatur vom 11.–20. Jh., Folklore, Literaturwissenschaft und -kritik - Russisch
Zeitungsarchiv, Text nicht zugänglich, Suchverfahren
Laboratorii obščej i komp'juternoj leksikologii i leksikografii filologičeskogo fakulteta MGU
Komp'juternyj korpus tekstov russkich gazet konca XX-ogo veka
www.philol.msu.ru/~lex/corpus/ - Ukrainisch
Textsammlung, HTML-Text, Suchmöglichkeit vorhanden
Elektronnaja biblioteka ukraïns'koï literatury
www.utoronto.ca/elul/Main-Ukr.html
Enthält auch eine umfangreiche Linksammlung - Altweißrussisch
Textsammlung, reiner Text
The Old Belarusian Poetry
www.belarusguide.com/culture1/literature/Old_Poetry.html
Mehrsprachige Korpora
- Korpus
ParaSol: A Parallel Corpus of Slavic and other languages
http://parasol.unibe.ch
– Slavische, deutsche und englische Originaltexte mit verschiedenen slavischen und deutschen Übersetzungen, teilweise getaggt - Korpus, reiner Text
Multext-East “1984” Corpus
nl.ijs.si/ME/CD/docs/1984.html
- Inhalt: George Orwells „1984“ in Englisch und einigen osteuropäischen Sprachen - Korpus
Linguistisches Laboratorium (LiLab), Seminar für Slavistik, Universität Bochum
Akustische Datenbanken u.a.m.
www.ruhr-uni-bochum.de/lilab/ > Dokumentation ... > ..., > Landeskunde ... > ... - Korpus
SFB 441, Universität Tübingen
Korpora, Sammlung von Internetadressen
www.sfb441.uni-tuebingen.de/c1/corpora.html
Linksammlungen
(nicht nur zu slavistischen Korpora)
- Elektronische Volltextarchive
www.ub.uni-konstanz.de/fi/sla/e-volltexte.htm - Online-Korpora
www.uni-regensburg.de/Fakultaeten/phil_Fak_IV/Slavistik/institut/hansen/links.html
Informationen zur Korpuslinguistik
- Michael Barlow
Corpus Linguistics
www.athel.com/corpus.html - Elisabeth Seitz
Digital Corpora and Databases: New Horizons in Slavic Linguistics
www.fltr.ucl.ac.be/FLTR/GERM/ETAN/przemek/ftp/corpora.html - SFB 441, Projekt C1
Korpuslinguistikseite
www.sfb441.uni-tuebingen.de/c1/corp-ling.html


