Корпусы в сети Интернет
Приведем сетевые адреса и краткие сведения о некоторых корпусах. В Интернете можно получить доступ и найти списки самых различных корпусов — см., например, D. Lee. Bookmarks for Corpus-based Linguists (http://devoted.to/corpora), веб-страницы М. Барбера (Manuel Barbera) (http://www.bmanuel.org/index.html) или М. Барлоу (Michael Barlow) (http://www.athel.com/corpus.html), сайт Language and Speech Resources (http://www.elsnet.org/resources.html) и др.
Национальный корпус русского языка http://ruscorpora.ru
| 70 млн слов[1] См. поисковые формы и образцы выдачи на рис. 1, 2, 5–7.
| Компьютерный корпус текстов русских газет конца ХХ-го века http://www.philol.msu.ru/~lex/corpus
| 200 тыс. слов Система поиска по корпусу временно недоступна
| Корпус русского языка ХАНКО (Хельсинский университет) http://www.ling.helsinki.fi/projects/hanco/
| 100 тыс. слов Ручная морфологическая разметка
| Корпуса русских текстов на сайте Университета в Лидсе, Великобритания http://corpus.leeds.ac.uk
|
| Русские корпуса Тюбингенского Университета http://www.sfb441.uni-tuebingen.de/b1/en/korpora.html
| | Словарь-корпус языка А.С. Грибоедова http://www.inforeg.ru/electron/concord/concord.htm
| 120 тыс. слов
| Уппсальский корпус русских текстов Доступен для поиска на сайте http://www.sfb441.uni-tuebingen.de/b1/en/korpora.html
| 1 млн слов 600 текстов (публицистика 1985-1989; литературные произведения 1960-1988).
| Банк английского языка (Bank of English) http://www.collins.co.uk/books.aspx?group=153
Свободный доступ: http://www.collins.co.uk/Corpus/CorpusSearch.aspx
| 524 млн слов, 56 млн в свободном доступе (The Collins Wordbanks Online English corpus: 36 млн – брит. англ., 10 млн – амер. англ., 10 млн – брит. разговорн. англ.)
См. образец выдачи на рис. 4.
| Британский национальный корпус http://www.natcorp.ox.ac.uk/ или http://sara.natcorp.ox.ac.uk/
| 100 млн слов Корпусные менеджеры SARA и XAIRA (http://www.xaira.org)
| Венгерский национальный корпус http://corpus.nytud.hu/mnsz/
| 100 млн слов
| Корпус испанского языка (исторический) http://www.corpusdelespanol.org/
| 100 млн слов, тексты 13–20 вв. Создан в Иллинойском университете, США
| Корпус латинских текстов «Персей» http://www.perseus.tufts.edu
|
| Корпус современного датского языка http://www.korpus2000.dk/
| 50 млн слов Тексты 1998–2002 гг.
| Корпус современного итальянского языка CORIS/CODIS http://www.cilta.unibo.it/ricerca.htm
| 100 млн Слов
| Корпус современного китайского языка (LIVAC Synchronous Corpus) http://www.rcl.cityu.edu.hk/livac/
| 720 млн слов (150 млн иероглифов)
| Мангеймский корпус немецкого языка (Institut für Deutsche Sprache, Mannheim, Germany) http://corpora.ids-mannheim.de/~cosmas/
| 1610 млн слов Корпусный менеджер COSMAS
| Национальный корпус словенского языка http://www.fida.net/eng/
| Более 100 млн слов
| Польский национальный корпус http://korpus.ia.uni.lodz.pl/
| 93 млн слов
| Словацкий национальный корпус http://korpus.juls.savba.sk
| 180 млн слов Используется корпусный менеджер Manatee/Bonito.
| Хорватский национальный корпус http://www.hnk.ffzg.hr/
| 53 млн слов Корпусный менеджер Manatee/Bonito.
| Чешский национальный корпус http://ucnk.ff.cuni.cz
| 100 млн слов + 100 млн нового корпуса современной лексики Корпусный менеджер Manatee/Bonito. См. образец выдачи на рис. 3.
| Эстонский корпус http://test.cl.ut.ee/korpused/baaskorpus/1980/index.html.en
|
|
Рис. 1. Запросная форма НКРЯ для поиска по морфологическим признакам.
Слово 1: словоnom&pl расстояние между словами: 1 Слово 2: слово
------------------------------------------------------------------------------------------------------
Область поиска: основной корпус (со снятой и неснятой омонимией)
Найдено документов: 59, контекстов: 69
1. ЕСЛИ ЧИНОВНИКИ НАЧАЛИ БОРЬБУ С КОРРУПЦИЕЙ — БЕРЕГИ КАРМАНЫ // «Красноярский рабочий», 2003.01.01 [омонимия не снята] Все контексты(1)
Слова, слова, слова... [ЕСЛИ ЧИНОВНИКИ НАЧАЛИ БОРЬБУ С КОРРУПЦИЕЙ — БЕРЕГИ КАРМАНЫ // «Красноярский рабочий», 2003.01.01]
2. Юлия Рахаева. Две трети Аполлона Григорьева. Единственная профессиональная литературная премия назвала лауреатов // «Известия», 2003.01.26 [омонимия не снята] Все контексты(1)
Потом уже были слова, слова, слова... [Юлия Рахаева. Две трети Аполлона Григорьева. Единственная профессиональная литературная премия назвала лауреатов // «Известия», 2003.01.26]
3. Евгений Ясин. ИНТЕРЕСНЫЙ ВОПРОС // «Известия», 2003.07.08 [омонимия не снята] Все контексты(1)
Что это: слова словами, а команда пока не дана? [Евгений Ясин. ИНТЕРЕСНЫЙ ВОПРОС // «Известия», 2003.07.08]
…………………………………………………………………..
Страницы: ← 1 2 3 4 5 6 →
Поиск осуществлен системой Яndex.Server При цитировании примеров просим ссылаться на Национальный корпус русского языка
Рис. 2. Образец выдачи в НКРЯ
1. Поиск словоупотреблений слова holubí (голубиный).
(...) (...)
2. Поиск словосочетания «holubí vejce» (голубиное яйцо) в любой форме и в любом написании (строчные и прописные)
[lemma="holubí"] [lemma="vejce"]
(...) (...)
|