Автор: Б. Л. Иомдин
Язык: русский / russ1263 / Indo-European; Balto-Slavic; Slavic; East Slavic; Russian
В Национальном корпусе русского языка содержатся тексты общим объёмом более 500 млн слов. В нём можно осуществлять разные поисковые запросы. Ниже дана верхняя часть списка, полученная по некоторому запросу. Одно слово при этом заменено на X.
Решение
Национальный корпус русского языка (НКРЯ, www.ruscorpora.ru) – большое собрание текстов в электронной форме, наделенное широкими возможностями поиска благодаря специально разработанной разметке. Многие участники по каким-то причинам сочли, что в НКРЯ есть лишь научные тексты, однако там есть тексты самых разных жанров: проза, поэзия, драматургия, техническая и научная литература, публицистика, личная переписка, блоги и др.
3.1. Запрос был сформулирован так. Выдать в порядке убывания частотности самые частотные из встретившихся в НКРЯ цепочки слов следующего вида: «прилагательное (1 балл) среднего рода (1 балл) в краткой форме (1 балл)» плюс слово что в именительном падеже.
Во многих работах говорилось о наречиях. Действительно, все приведенные в списке слова можно интепретировать и как наречия (почти все русские краткие прилагательные омонимичны наречиям). Однако если бы в запросе было задано наречие, верхняя часть списка была бы другой: в нее попали бы и такие словосочетания, как потому что, только что, так что, пока что и др. (поскольку слова потому, только, так, пока имеют, помимо других, и функции наречий). Для правильного решения надо было заметить, что в результаты поиска не попали такие слова, которые нельзя интепретировать как прилагательные. По тем же причинам не ставились в этом пункте баллы за решения, где говорилось о вводных словах или вообще не отмечалась частеречная принадлежность («искали слова, стоящие перед что»).
3.2. Частота встречаемости соответствующих цепочек слов в НКРЯ (5 баллов).
3.3. Слово что (2 балла). Другие приводимые в работах слова (одно, всё, ли, было и др.), если бы были включены в запрос, дали бы другие результаты: вряд ли бы настолько частотными оказались словосочетания мало одно, похоже одно, очевидно всё, равно всё, странно ли, несомненно ли, хорошо было, равно было и т.п. Важно отметить, что поиск производился именно с указанным в условии порядком слов (то есть словосочетания одно хорошо, всё равно или было ясно не были бы найдены).
3.4. Среди других достаточно частотных словосочетаний данного типа можно указать следующие: важно, что; любопытно, что; неудивительно, что; замечательно, что; удивительно, что; приятно, что; жалко, что; характерно, что; обидно, что; примечательно, что; досадно, что; страшно, что; плохо, что; заметно, что; стыдно, что; немудрено, что; грустно, что; показательно, что; смешно, что; забавно, что; ужасно, что; общеизвестно, что; поразительно, что; нехорошо, что; бесспорно, что; существенно, что; отрадно, что; глупо, что и др. (по 2 балла за пример, максимум 6 баллов). Среди слов, не оказавшихся в списке или оказавшихся в нем низко, надо было привести любые краткие прилагательные, обычно не стоящие перед словом что (например: бело, старательно, сонно, огромно, постоянно и др.).
3.5. Во всех данных примерах, кроме двух, слово что — союз, который вводит придаточное изъяснительное предложение (Известно, что задача трудная; Хорошо, что я ее решил; Жалко, что не на полный балл и т.п.) (7 баллов). Однако два прилагательных попали в верхушку результатов по иной причине: равно — из-за частотного выражения все равно что (2 балла); мало — из-за частотного выражения мало что (2 балла). (Если эти слова приводились без объяснения, ставился 1 балл).Так получилось потому, что при поиске в НКРЯ, как видно, не учитываются знаки препинания (2 балла).
Комментарии