Задача №1642
Автор: Б. Л. Иомдин
Язык: русский / russ1263 / Indo-European; Balto-Slavic; Slavic; East Slavic; Russian
Условие
Дан отрывок из интервью:
«Как системе понять, что я говорю? Может быть, надо приписать словам вероятность: какие слова более вероятно будут звучать в моей речи, а какие менее. Например, слово «нагой» гораздо менее частотное в устной речи, в простом разговоре оно вряд ли появится. Нужно представить все способы произнесения слов, какие фонетические изменения происходят с ними в зависимости от соседства с другими словами в предложении. Этим занимаются лингвисты».
1.1. Чем занимается система, о которой идёт речь?
1.2. Какое слово, гораздо более частотное, чем слово «нагой», имеется в виду?
1.3. Когда автор этого текста написал его, компьютер предложил выделить в нём запятыми два словосочетания, состоящие из двух слов. О каких словосочетаниях идёт речь? Запишите их в том порядке, в котором они встречаются в тексте.
1.4. Почему это было предложено? Нужно ли внести эти исправления?
Решение
Вот фрагмент интервью, из которого взят отрывок, процитированный в задаче: «Например, существуют программы по расшифровке речи. Я могу нажать кнопочку на айфоне, и моя речь будет записываться в виде текста. Как система расшифровывает мои слова? Ее нужно научить. Ведь я говорю не нарочито медленно, не по слогам, есть помехи, шум, голоса бывают низкие и высокие. Для этого нужно разобраться, как устроена русская речь. За тем, что я говорю, могут скрываться разные слова. Допустим, я говорю слова, которые звучат одинаково: «ногой» и «нагой». Как системе понять, что я говорю? Может быть, надо приписать словам вероятность: какие слова более вероятно будут звучать в моей речи, а какие менее. Например, слово «нагой» гораздо менее частотное в устной речи, в простом разговоре оно вряд ли появится. Нужно представить все способы произнесения слов, какие фонетические изменения происходят с ними в зависимости от соседства с другими словами в предложении. Этим занимаются лингвисты».
1.1. Чем занимается система, о которой идёт речь?
Речь идёт о системах распознавания речи (встраиваемых в диктофоны, голосовые помощники, программы создания субтитров, переводчики в мобильных устройствах и т. п.) — 2 балла
1.2. Какое слово, гораздо более частотное, чем слово «нагой», имеется в виду?
Слово ногой (20 баллов). Это ключевое задание в задаче: важно было понять, что система распознавания речи имеет дело с омофонами (словами, звучащими одинаково), и в отсутствие контекста может опираться на частоту употребления.
1.3. Когда автор этого текста написал его, компьютер предложил выделить в нём запятыми два словосочетания, состоящие из двух слов. О каких словосочетаниях идёт речь? Запишите их в том порядке, в котором они встречаются в тексте.
Первое словосочетание: более вероятно (2 балла). Второе словосочетание: другими словами (10 баллов).
1.4. Почему это было предложено? Нужно ли внести эти исправления?
Эти слово обычно выступают как вводные и выделяются запятыми. Здесь они выступают в другой функции, поэтому исправление не нужно (1 балл).
Идея этого задания — показать, что системы распознавания речи и системы автоматической проверки орфографии и пунктуации имеют схожие принципы и руководствуются частотностью.
Комментарии