Сага «Звездные войны» давно стала культурным феноменом. При этом использование имен и понятий, присущих именно этой киновселенной, распространилось далеко за пределы фанатского сообщества. Сотрудница Хемницкого технического университета Кристина Санчес-Стокхаммер проверила, как терминология «Звездных войн» повлияла на современный английский язык. Ее интересовала частота появления выбранных ею слов в четырех разных корпусах английского языка, в том числе в Британском ...
...Сага «Звездные войны» давно стала культурным...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
В течение первого года жизни нейропластичность максимальна: в это время формируется больше всего новых нейронов и связей между ними. Исследователи давно предполагали, что с самого раннего возраста мозг младенцев, родившихся в монолингвальных и билингвальных семьях, работает по-разному в том, что касается обработки речи. Однако ограничения в технологиях не позволяли понять, что происходит непосредственно в мозге, когда ребенок слышит речь. Группа ...
...В течение первого года жизни нейропластичность...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Правительство РФ внесло в Госдуму законопроект о создании Национального словарного фонда — единого цифрового ресурса, содержащего данные словарей русского языка. Закон «О государственном языке РФ» предлагается дополнить статьей, которая будет регламентировать создание и работу Национального словарного фонда. Под ним понимается государственная информационная система, в которой будут представлены данные о нормах современного русского ...
...Правительство РФ внесло в Госдуму законопроект...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Школьники не могут освоить правописание из-за скудного словарного запаса, а сами учителя иногда перенимают сленг учеников. Таковы результаты опроса участников олимпиады «Хранители русского языка». Правописание считают самым сложным разделом для изучения в школе 40% опрошенных учителей русского языка. На втором месте пунктуация (24%), а на третьем — культура речи и стилистика (23%). Распространенные причины проблем с русским языком — бедный словарный запас и ...
...Школьники не могут освоить правописание из-за скудного...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов рассуждают об одной из загадок русского языка — образовании названий жителей разных городов, начиная с древнего наименования жителей Курска.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов говорят о падежных формах числительного «триста» и отвечают на вопрос о разном склонении слов «три» и «триста».
...Ведущий и главный редактор портала «Грамота.ру» Владимир...