Поиск   Случайная задача
Подборки   Языки   Авторы   Явления
Логин:
Пароль:
    Регистрация     Восстановить пароль

Задача №1833

Автор: А. Ч. Пиперски

Явления: компьютерная лингвистика, поисковая система

Язык: английский / stan1293 / Indo-European; Germanic; Northwest Germanic; West Germanic; North Sea Germanic; Anglo-Frisian; Anglic; Later Anglic; Middle-Modern English; Macro-English; English

Условие

В таблице перечислены 18 лингвистических корпусов, которые представлены в системе Sketch Engine, и указано, какие из них находятся по запросам WELSH ‘валлийский’, TATAR ‘татарский’, DUTCH ‘нидерландский’ и RUSSIAN ‘русский’:

WELSH TATAR DUTCH RUSSIAN GERMAN
1 British Academic Written English Corpus (BAWE) + +
2 Cambridge Academic English
3 CHILDES German Corpus
4 Chinese GigaWord 2 Corpus: Mainland, simplified
5 Chinese Traditional Web (TaiwanWaC, Universal Sketch Grammar) + + +
6 CoPEP — The Corpus of Portuguese from Academic Journals (v. 1.4) + +
7 English Wikipedia sample with Error annotations +
8 EUR-Lex judgments Dutch 12/2016 +
9 Lektor (Learner corpus of proofread and translations) + +
10 New corpus for English (NCI English) +
11 Polish Web (PolishWac, Morfeusz and TaKIPI tagger) + +
12 Russian web corpus (v2 with lempos) +
13 Swahili Web 2014 (SwahiliWaC) +
14 Swedish Web 2014 (svTenTen14)
15 SwedishParole
16 Tatar News (2000-2014), version with lempos +
17 Welsh Web 2013 (WelshWaC) +
18 Welsh web corpus +

Задание 1. Опишите, как работает поиск по списку корпусов.

Задание 2. Уточните ваше правило, если известно, что по запросу TATAR не находится LatinISE historical corpus v2.2, а по запросу DUTCH — EUR-Lex judgments Czech 12/2016.

Задание 3. Укажите номера всех корпусов из списка, которые найдутся по запросу GERMAN ‘немецкий’.

Примечание. Знание английского языка для решения задачи НЕ ТРЕБУЕТСЯ.



Комментарии