Задача №1585
Автор: А. Ч. Пиперски
Язык: русский / russ1263 / Indo-European; Balto-Slavic; Slavic; East Slavic; Russian
«Высшая проба» по русскому языку (2014/2015) (№7; 10–11 классы, №1)
Условие
Для кодирования грамматической информации в компьютерной лингвистике применяются специальные системы помет, которые представляют лингвистические сведения в стандартизованной форме. Одна из таких систем, предназначенных, в частности, для русского языка, носит название MULTEXT-East. Даны некоторые пометы, используемые в этой системе для разметки существительных; к каждой помете приводится по примеру:
Ncmpay — участников
Ncfsnn — поддержка
Npmsgy — Владимира
Ncnsin — удовольствием
Ncmpln — пределах
Ncfply — уборщицах
Ncmsan — режим
Npfsay — Юлию
Ncfpdn — группам
1.1. Схематично опишите, как устроена система помет существительных в системе MULTEXT-East.
1.2. Некоторые из девяти слов, данных в условии, могли бы иметь в системе системе MULTEXT-East и другие пометы. Укажите эти слова и приведите эти пометы.
1.3. Как будут выглядеть в системе MULTEXT-East пометы существительных Иванову, животные, гордячкой? Если в каком-то случае возможны несколько вариантов, укажите их все.
Решение
3.1.
Каждая помета имеет постоянную длину и состоит из 6 символов. За каждой позицией закреплён определённый набор символов с определённым значением:
- N — всегда в начале пометы существительного (впрочем, пометы других частей речи нам и не даны)
- c / p — нарицательное / собственное (2 балла). За ответ «с большой буквы / с маленькой буквы» балл не ставился, так как это не грамматическая информация
- m / f / n — род (2 балла)
- s / p — число (2 балла)
- n / g / d / a / i / l — падеж (2 балла)
- y / n — одушевлённость (2 балла)
Для получения баллов необходимо было точно указать, на какой позиции используется какой из наборов символов. Кроме того, не засчитывались как правильные нерасчленённые описания (например, когда говорилось, что за падеж отвечают два последних символа). Обозначения категорий рода, числа и падежа не вызвали проблем у участников, однако оказалось, что многие не помнят термины «одушевлённость», «собственные» и «нарицательные». Такие решения оценивались полным (2 из 2) или частичным баллом (1 из 2) в зависимости от того, насколько успешно школьник сумел объяснить, что он имеет в виду, пусть даже не прибегая к термину.
Особую сложность вызвало определение падежа и одушевлённости. Кратко напомним несколько основных фактов, касающихся этих грамматических категорий:
- Одушевлённость в русской грамматике определяется строго формально, а не по смыслу; одушевлённым является такое существительное, у которого во множественном числе вин. = род. (вижу участников= выступления участников ≠ участникивыступают), а неодушевлённым — такое, у которого во множественном числе вин. = им. (вижу группы = группы выступают ≠ выступления групп); в единственном числе этот критерий применим к существительным мужского рода, за исключением слов I склонения (папа, воевода); кроме того, одушевлённость можно определять также по согласуемому слову (прилагательному / местоимению) во множественном числе и в единственном числе мужского рода. Из всего этого следует, что слово группа не может быть одушевлённым, даже если группа, о которой идёт речь, состоит из живых людей (мы всё равно скажем вижу студенческие группы, а не *вижу студенческих групп), а слово участник не может быть неодушевлённым (вижу участника/участников, а не *вижу участник/участники) — соответственно, вторые варианты разбора в этих случаях предлагать не следовало, баллы за это снижались.
- Из-за наличия категории одушевлённости в русском языке не всегда просто различить именительный, родительный и винительный падежи. Практический способ решения этой проблемы таков: нужно подставить на место определяемого слова любое слово I склонения в единственном числе (кошка, страна, папа, дисциплина, …), поскольку такие слова различают эти три формы. Например, форма режим может употребляться в тех же контекстах, что формы дисциплина и дисциплину (царит строгий режим / строгая дисциплина, соблюдать режим / дисциплину), но не дисциплины,а значит, это может быть только именительный или винительный падеж единственного числа.
♦ Как справедливо отметили многие участники олимпиады, в основе системы помет лежат английские слова. При этом для решения задачи знать английский язык вовсе необязательно: например, число могло бы обозначаться не буквами s и p, а любыми другими символами (например, q и w), но мы могли бы точно так же расписать все примеры на две группы и понять, что раз знак q стоит на 4-м месте в пометах слов поддержка, Владимира, удовольствием, режим, Юлию, а знак w — на 4-м месте в пометах слов участников, пределах, уборщицах, группам, то q обозначает единственное число, а w — множественное. Многие участники пытались приводить английские (а иногда — немецкие, французские или латинские) слова, от которых образованы обозначения в помете, но мало кому удавалось сделать это правильно. Разумеется, ошибки в словах иностранных языков никак не наказывались на олимпиаде по русскому языку, но всё же приведём правильный перечень английских грамматических терминов, легших в основу этой системы — они могут пригодиться при чтении лингвистических научных работ:
- N — noun ‘существительное’ (а не name ‘имя’)
- c / p — common ‘нарицательное’ / proper ‘собственное’ (а не personal ‘личное’)
- m / f / n — masculine ‘мужской (о грамматическом роде)’ (а не male ‘мужской (о поле)’, man ‘мужчина’) / feminine ‘женский (о грамматическом роде)’ (а не female ‘женский (о поле)’) / neuter ‘средний (о грамматическом роде)’ (а не neutral ‘нейтральный’, none ‘никакой’, no ‘нет’)
- s / p — singular ‘единственное’ / plural ‘множественное’
- n / g / d / a / i / l — nominative ‘именительный’ / genitive ‘родительный’ / dative ‘дательный’ / accusative ‘винительный’ / instrumental ‘творительный (букв. инструментальный)’ / locative ‘предложный (букв. местный, т. к. предложный падеж часто выражает значение места)’
- y / n — yes ‘да’ / no ‘нет’ (а ‘одушевлённый’ / ‘неодушевлённый’ на английском языке будет animate / inanimate).
3.2. В этом задании требовалось предложить пометы для омонимичных форм, используя имеющуюся систему (а не усовершенствовать систему помет, например, добавив в неё тип склонения, как предлагали некоторые участники). Заметить все возможные случаи омонимии оказалось непросто. Для получения полного балла было необходимо указать пять основых случаев:
- Ncmpgy — участников (род., а не вин.)
- Npmsay — Владимира (вин. мужского имени, а не род.)
- Npmsgn — Владимира (род. неодушевлённого названия города, а не одушевлённого мужского имени)
- Ncmsnn — режим (им., а не вин.)
- Npmsdy — Юлию (дат. мужского имени Юлий, а не вин. женского имени Юлия)
2 балла × 5 = max 10 баллов; если в помете допущена ошибка хотя бы на 1 букву, ставится 0 баллов. Давались дополнительные 2 балла за редкое женское имя Владими́ра (Npfsny), но его упоминание не считалось обязательным.
3.3.
- Иванову — Npmsdy (дат. мужской фамилии Иванов);
- Иванову — Npfsay (вин. женской фамилии Иванова);
- Иванову — Npnsdn (дат. названия города Иваново); засчитывался также вариант Npmsdn, если указывалось, что это дат. падеж топонима Иванов. Этот вариант оказался даже более популярным, чем дат. от Иваново. По крайней мере один населённый пункт с названием Иванов действительно существует (в Винницкой области Украины), хотя едва ли он известен многим участникам олимпиады; вероятно, многие школьники сочли, что слово Иваново не изменяется по падежам, поэтому этот вариант вспомнили далеко не все;
- животные — Ncnpny; это слово является одушевлённым (об одушевлённости см. выше), так как вин. мн. у него совпадает с род. мн. (вижу животных = детёныши животных ≠ животные бегают). Соответственно, последним символом пометы должно быть y, а разбора с винительным падежом эта форма не имеет.
- гордячкой — Ncfsiy; это слово обозначает гордую женщину и является одушевлённым (вижу гордячек = лица гордячек ≠ гордячки идут); многие участники предлагали также неодушевлённый разбор, однако такого неодушевлённого слова в русском языке нет: по всей вероятности, они перепутали слова гордячка и горячка (а чрезмерная гордость называется гордыней, а не гордячкой).
2 балла × 5 = max 10 баллов; если в помете допущена ошибка на 1 букву, ставится 1 балл; если допущены ошибки более чем на 1 букву, ставится 0 баллов.
Комментарии