Задача №1833
Автор: А. Ч. Пиперски
Явления: компьютерная лингвистика, поисковая система
Язык: английский / stan1293 / Indo-European; Germanic; Northwest Germanic; West Germanic; North Sea Germanic; Anglo-Frisian; Anglic; Later Anglic; Middle-Modern English; Macro-English; English
Задачи на «Элементах» (№128)
Условие
В таблице перечислены 18 лингвистических корпусов, которые представлены в системе Sketch Engine, и указано, какие из них находятся по запросам WELSH ‘валлийский’, TATAR ‘татарский’, DUTCH ‘нидерландский’ и RUSSIAN ‘русский’:
WELSH | TATAR | DUTCH | RUSSIAN | GERMAN | ||
1 | British Academic Written English Corpus (BAWE) | + | + | |||
2 | Cambridge Academic English | |||||
3 | CHILDES German Corpus | |||||
4 | Chinese GigaWord 2 Corpus: Mainland, simplified | |||||
5 | Chinese Traditional Web (TaiwanWaC, Universal Sketch Grammar) | + | + | + | ||
6 | CoPEP — The Corpus of Portuguese from Academic Journals (v. 1.4) | + | + | |||
7 | English Wikipedia sample with Error annotations | + | ||||
8 | EUR-Lex judgments Dutch 12/2016 | + | ||||
9 | Lektor (Learner corpus of proofread and translations) | + | + | |||
10 | New corpus for English (NCI English) | + | ||||
11 | Polish Web (PolishWac, Morfeusz and TaKIPI tagger) | + | + | |||
12 | Russian web corpus (v2 with lempos) | + | ||||
13 | Swahili Web 2014 (SwahiliWaC) | + | ||||
14 | Swedish Web 2014 (svTenTen14) | |||||
15 | SwedishParole | |||||
16 | Tatar News (2000-2014), version with lempos | + | ||||
17 | Welsh Web 2013 (WelshWaC) | + | ||||
18 | Welsh web corpus | + |
Задание 1. Опишите, как работает поиск по списку корпусов.
Задание 2. Уточните ваше правило, если известно, что по запросу TATAR не находится LatinISE historical corpus v2.2, а по запросу DUTCH — EUR-Lex judgments Czech 12/2016.
Задание 3. Укажите номера всех корпусов из списка, которые найдутся по запросу GERMAN ‘немецкий’.
Примечание. Знание английского языка для решения задачи НЕ ТРЕБУЕТСЯ.
Комментарии