Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...
Сто баллов за единый государственный экзамен (ЕГЭ) по русскому языку получили 2636 выпускников. Такие данные привел руководитель комиссии разработчиков контрольных измерительных материалов ЕГЭ Роман Дощинский на пресс-конференции Рособрнадзора. Это на 12,5% меньше, чем в прошлом году: тогда высший балл получили 3014 человек. Впрочем, в 2022 году стобалльников было еще меньше — 2375 человек. Роман Дощинский обратил внимание на высокий уровень освоения ...
...Сто баллов за единый государственный экзамен (ЕГЭ)...
Традиционная лекция о найденных в 2023 году грамотах была прочитана не только в Москве, но и в Новгороде, где она уже в пятый раз вызвала интерес у археологов, историков и других новгородцев. В интервью лингвист, доктор филологических наук, академик РАН Алексей Алексеевич Гиппиус рассказывает о результатах новгородских раскопок.
...Традиционная лекция о найденных в 2023 ...
...По словам Алексея Гиппиуса, берестяные грамоты ...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Летняя лингвистическая школа — это выездное научное мероприятие, в котором участвуют школьники, студенты и преподаватели. В течение десяти дней несколько десятков человек, интересующихся лингвистикой, учатся, общаются, отдыхают и работают над научными проектами. Преподают в Летней школе ведущие ученые-лингвисты и популяризаторы науки. Кроме собственно лингвистических лекций на ЛЛШ проводятся лекции по математике, антропологии, переводоведению и
...Летняя лингвистическая школа — это выездное...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Обычно дети за несколько лет легко переходят от лепета к построению сложных предложений, но это происходит не всегда равномерно. Специалисты уже исследовали связь между речевым развитием ребенка и его полом, а также социально-экономическим положением семьи. Например, в ряде прошлых работ было показано, что в обеспеченных семьях дети осваивают язык быстрее, чем в неблагополучных. Однако один из недостатков этих работ заключался в том, что они не охватывали повседневное использование языка ...
...Обычно дети за несколько лет легко переходят от лепета...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...