Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Сколько слов существует в русском языке? Ответ на этот вопрос и сложен, и прост. Трудно назвать точную цифру, и на это есть несколько причин: язык постоянно развивается, обновляется (одни слова появляются в речи, другие исчезают, уходят); масса диалектных слов пока учеными просто не зафиксирована и ни в каких словарях не описана; почти все профессии и научные дисциплины обладают «собственными» лексиконами, которые не входят в общенародную литературную речь; есть и другие причины.
...Сколько слов существует в русском языке? Ответ на этот...
...Мир слов воистину огромен, безбрежен. Лексическое ядро...
Нужно ли защищать русский язык от заимствованных слов? Какие меры были бы эффективны? Можно ли обойтись без новых заимствований и какие слова вызывают самое большое раздражение? Эксперты Грамоты Ксения Киселева и Владимир Пахомов ответили на вопросы ведущих программы «ОТРажение».
...Нужно ли защищать русский язык от заимствованных слов...
...Ксения Киселева отметила, что современный период активного...
К Международному дню грамотности, который отмечают 8 сентября, аналитики контентной платформы «Дзен» и исследователи Грамоты провели масштабный опрос, чтобы выяснить мнение россиян о заимствованных словах. Ответы 1323 респондентов из разных регионов страны выявили противопоставление «полезных» иностранных слов и «загрязняющих» наш язык. Особенно негативно россияне относятся к молодежному сленгу. Лидером антирейтинга стало ...
...К Международному дню грамотности, который отмечают...
Занятия по подготовке к тесту на сертификат «Русский как иностранный» 1-го и 2-го уровня в нашей школе проходят третий год. Тест состоит из пяти разделов: «Лексика и грамматика», «Чтение», «Аудирование», «Письмо» и «Говорение». Русскоязычные дети без особых усилий справляются с заданиями раздела «Лексика и грамматика». Выполнение заданий разделов «Чтение» и «Аудирование» требует разъяснения и тренировки (навыка медленного чтения, концентрации внимания на деталях). Лексика и синтаксические конструкции текстов не вызывают особых затруднений.
...Занятия по подготовке к тесту на сертификат «...
...Подготовка к сертификату предполагает, прежде...
Арик Кершенбаум — зоолог из Кембриджского университета, специалист по коммуникации животных. Он изучает волков, гиббонов и дельфинов, чтобы «не только лучше понимать, как они живут и как их сохранить, но и больше узнать об эволюции нашего собственного языка». В его первой книге «Путеводитель зоолога по Галактике» речь шла о возможной жизни на других планетах. В начале 2024 года вышла в свет новая книга — «Почему животные разговаривают». Грамота перевела его интервью, опубликованное в британском издании The Guardian.
...Арик Кершенбаум — зоолог из Кембриджского...
...Почему вы решили написать эту книгу? Моя предыдущая...
Онлайн-словарь диалектизмов «Русским языком говорю» должен объединить сотни слов, бытующих в разных регионах России. Это совместная инициатива портала «Культура.РФ» и социальной сети «Одноклассники». Например, словом сморщ в Брянской области называют борщ, а словом гостинка в Приморском крае — маленькую квартиру. Поиск по сайту позволяет найти диалектные слова по первой букве, по региону или по значению. Любой ...
...Онлайн-словарь диалектизмов «Русским языком говорю...
В этих словах нет ничего необычного. Они называют простые, привычные предметы. Блюдце и молоток. Кусок и мешок. Линейка и булавка. Так можно перечислять долго. Лавка, цепочка, цветок... Что общего у всех этих слов? Можно заметить, что у них у всех есть уменьшительный суффикс. О том, что еще их объединяет, рассказывает лингвист Ирина Фуфаева.
...В этих словах нет ничего необычного. Они называют простые...
...Суффиксы в этих словах уже не воспринимаются как уменьшительные...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...