Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
24 января отмечается Международный день образования. Это повод напомнить о том, что в России уже больше месяца идет обсуждение будущей Стратегии развития образования. Новый основополагающий документ, разрабатываемый по поручению президента, должен охватить период до 2036 года (с перспективой до 2040 года) и решить ряд назревших вопросов. За разработку отвечает правительство совместно с Администрацией Президента РФ и Российской академией наук. Как отметил министр просвещения Сергей ...
...24 января отмечается Международный день образования...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Распознавание рукописных текстов — задача, где пересекаются лингвистика, история и машинное обучение. Как научить программу понимать сотни тысячи документов, созданных больше ста лет назад — да к тому же не всегда грамотными и аккуратными людьми? С этой задачей призвана справиться новая разработка специалистов Новосибирского государственного университета. Магистрант факультета информационных технологий НГУ Степан Гудков под руководством ...
...Распознавание рукописных текстов — задача...
Известно, что владение двумя языками на одном уровне нагружает мозг дополнительной работой. Однако это может быть полезно для развития памяти. Ученые проверили эту гипотезу в играх на угадывание слов. В исследовании участвовали испано-англоязычные билингвы и англоязычные монолингвы. Услышав слово, участники должны были найти соответствующую картинку среди множества изображений на экране. При этом у них регистрировались движения глаз с помощью айтрекеров. Авторы выбирали изображения для ...
...Известно, что владение двумя языками на одном уровне...
В октябре — декабре 2022 года в Африке пройдет серия методических мероприятий «Современные методики преподавания русского языка как иностранного». Проект организован учебно-издательским центром «Златоуст» при содействии Российских центров науки и культуры в Александрии (Египет), Дар-эс-Саламе (Танзания), Лусаке (Замбия), Аддис-Абебе (Эфиопия) и реализуется с использованием гранта Федерального агентства по делам СНГ, соотечественников, проживающих за рубежом, и по ...
...В октябре — декабре 2022 года в Африке пройдет...
Азбука, буквица или букварь — это такой учебник, который позволяет запомнить написание печатных и рукописных букв. На выставке-калейдоскопе азбук «Не только буквы» в Доме культуры «ГЭС-2» прошла презентация книги «Азбукварь», в которой буквы русского алфавита представлены в стиле, похожем на сюрреализм.
...Азбука, буквица или букварь — это такой учебник...
...Родион Китаев — художник и иллюстратор, выпускник...
Этот вопрос мы задали трем лингвистам, которые не только исследуют русский язык научными методами, но и общаются со студентами и поэтому имеют непосредственное представление о том, как говорит сегодня молодежь. Во время дискуссии «В поисках грамотности», которая состоялась на 37-й Московской международной книжной ярмарке в начале сентября, мы услышали опровержение многих стереотипов.
...Этот вопрос мы задали трем лингвистам, которые не только...
...Недавно в одном научном журнале нам встретились...
За четыре года общая сумма штрафов за нарушение закона составила более 4,5 млн рублей. Редакции и учредители СМИ получили 18 письменных предупреждений за распространение материалов, содержащих нецензурную брань. Кроме того, сайты СМИ получили более восьми тысяч обращений от Роскомнадзора в связи с бранью в комментариях к материалам, на которые также распространяется закон. Запрет на сквернословие в средствах массовой информации был установлен в
...За четыре года общая сумма штрафов за нарушение закона...
Существуют слова, которые кажутся нам вполне «своими» — настолько, что мысль об их чужеродном происхождении не приходит в голову. Таковы, например, слова «трогательный», «насекомое» или «прохвост». Однако они не так просты. Как эти, по сути, иностранные слова оказались в русском языке и почему мы не замечаем в них ничего особенного? Об этом рассказывает филолог и переводчик Мария Елифёрова.
...Существуют слова, которые кажутся нам вполне «...
...Мы называем фото котенка в интернете трогательным...