В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...
В 2024 году Грамота выбирала слово года в несколько этапов, опираясь на три источника данных: предложения наших пользователей, статистику (запросы на портале, данные поисковых систем и нашего партнера СКАН-Интерфакс) и голосование лингвистов. В первый список кандидатов вошли многие популярные слова, в итоге не попавшие в шорт-лист. Мы решили посмотреть, как сложилась судьба самых заметных слов прошлого года: подтверждают ли новые данные наш выбор?
...В 2024 году Грамота выбирала слово года в несколько...
...Финалисты и неудачники Напомним прошлогодний...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Мы пользуемся языком, чтобы делиться информацией и обмениваться идеями. Гораздо сложнее понять, насколько язык необходим, чтобы мыслить. Сегодня есть данные, которые позволяют ученым утверждать, что язык и мышление существуют достаточно обособленно друг от друга. О новом исследовании рассказывает новостной портал Массачусетского технологического института.
...Мы пользуемся языком, чтобы делиться информацией и&...
...Интуитивные представления и научные факты Американский...
Манускрипт, или Рукопись, Войнича — иллюстрированный кодекс XV века, написанный анонимным автором на неизвестном алфавите. Первые попытки расшифровки текста предпринимали еще в XVII веке, но сделать это не удалось до сих пор. Новые научные методы позволили получить интересные данные, пишет научно-популярное издание Naked Science.
...Манускрипт, или Рукопись, Войнича — иллюстрированный...
...Рукопись носит имя антиквара Вильфреда Войнича, который...
Многие из тех, кто учил иностранный язык в школе, признаются, что умеют рассуждать о мировой политике или защите окружающей среды, но теряются, когда нужно правильно назвать венчик для взбивания, определенный вид встроенного шкафа или шапочку с помпоном. В процессе перевода тоже возникают похожие трудности с конкретной лексикой, когда одним словом могут быть названы очень разные предметы. Переводчик с итальянского Анна Ямпольская рассказала Грамоте, на какие ухищрения приходится идти, чтобы отличить пиджак от куртки, а панаму от ушанки.
...Многие из тех, кто учил иностранный язык в школе, признаются...
...Как известно, костюм — одна из важнейших характеристик...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...1. Новое в русской лексике База данных снабжена...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...Общеизвестно, что на английском языке personal computer...