Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Давно уже замечено, что порой слово, заимствованное из того или иного языка, со временем меняет свое произношение и написание. Процесс этот вполне закономерен и обусловлен освоением заимствования, подчинением его нормам русского языка, в том числе нормам орфоэпическим и орфографическим.
...Давно уже замечено, что порой слово, заимствованное...
...Так, например, слово офис, заимствованное русским языком...
Ученый совет Института русского языка РАН утвердил к печати 30-й том «Этимологического словаря славянских языков» под редакцией академика О. Н. Трубачева, который реконструирует праславянский лексический фонд.
...Ученый совет Института русского языка РАН утвердил...
...Словарь, построенный на устных и письменных данных...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...
Пожилые люди часто жалуются на проблемы с памятью, вниманием и восприятием. Такие жалобы могут быть ранним признаком умеренных когнитивных нарушений (усиление которых, по мнению специалистов, в перспективе приводит к деменции). Однако не всегда сам человек адекватно оценивает, насколько нарушена его речь. Ученые из Центра языка и мозга НИУ ВШЭ и Психиатрической клинической больницы № 1 им. Н. А. Алексеева решили опытным путем установить, насколько информативны жалобы на речевую функцию ...
...Пожилые люди часто жалуются на проблемы с памятью,...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
23 января отмечается День ручного письма. Эта памятная дата была учреждена в 1977 году для повышения интереса к искусству калиграфии в эпоху, когда все меньше людей пишут от руки. Пожалуй, единственное место, где еще приходится постоянно пользоваться ручкой, — это школа. Большинство образовательных систем знакомят детей с письмом, предлагая им выводить буквы от руки. При этом школьное обучение активно цифровизируется, а использование ...
...23 января отмечается День ручного письма. Эта...
Филолог Лев Скворцов пишет в журнале «Вопросы языкознания» о личности профессора Сергея Ивановича Ожегова. Публикация приурочена к столетию со дня рождения ученого.
...Филолог Лев Скворцов пишет в журнале «Вопросы...
...Ожегов известен нам прежде всего как автор однотомного...
Подавляющее большинство (96%) женщин, участвовавших в опросе книжного сервиса «Литрес» и платформы для знакомств Mamba, считают привлекательной грамотную речь. Среди участников-мужчин это мнение разделяют 76%. Результаты опроса публикует ТАСС. 63% женщин и 53% мужчин называют уровень грамотности решающим фактором для выбора партнера. Только для 3% женщин этот момент оказался незначимым (среди мужчин таких 23%). Как можно объяснить разницу между мужчинами ...
...Подавляющее большинство (96%) женщин, участвовавших...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...