Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Исследование: внутренний язык больших языковых моделей...
...Иными словами, как пишут исследователи, внутренним языком модели следует считать не английский язык, а язык понятий, у которых есть явный перекос в сторону английского, а «английский язык играет роль посредника не столько на лексическом уровне, сколько на семантическом»...
Этот вопрос мы задали трем лингвистам, которые не только исследуют русский язык научными методами, но и общаются со студентами и поэтому имеют непосредственное представление о том, как говорит сегодня молодежь. Во время дискуссии «В поисках грамотности», которая состоялась на 37-й Московской международной книжной ярмарке в начале сентября, мы услышали опровержение многих стереотипов.
...Этот вопрос мы задали трем лингвистам, которые не только...
...Что вы думаете о речи молодежи?...
...Есть такой фактор, как «время контакта с книгой»: сколько я за свою жизнь видел письменных текстов. Если этих текстов было много, то, скорее всего, я буду грамотным....
...Мария Ровинская: «Стало больше разнообразия» Претензии старших к младшим существовали всегда, сколько хватает взгляда, и в смысле языка тоже, и мы это унаследовали в XXI веке....
Наш портал учредил премию «За творческое отношение к русскому языку и любовь к детям» для авторов наиболее доступных и интересных учебных пособий по русскому языку. Первым лауреатом стала Татьяна Рик — автор серии «Веселые учебники по русскому языку». Вручение премии состоялось 20 марта 2001 года в Библиотеке иностранной литературы им. М. И. Рудомино. Учебники Татьяны популярны в большинстве регионов России, в государствах бывшего СССР, в Европе — Германии, Англии, Франции, где по ним учатся студенты-слависты, — и, как говорят, даже в ЮАР.
...Наш портал учредил премию «За творческое отношение...
...Татьяна Рик — первый лауреат премии портала...
...Сколько их уже вышло? Т. Р.: Пять: про существительное, прилагательное, глагол, наречие и причастие. Готовится к изданию шестая (деепричастие). К новому учебному году, возможно, выйдет сборник игр на уроках русского языка в пятом классе....
Пол Грэм — американский программист, предприниматель, один из создателей бизнес-инкубатора Y Combinator для стартапов в сфере информационных технологий. А еще человек пишущий — автор нескольких книг по программированию и многочисленных эссе, например «Как начать стартап» и «Как правильно возражать». В октябре он опубликовал в своем блоге текст об умении писать тексты. Грамота перевела его для вас, воспользовавшись помощью нейросетевых технологий.
...Пол Грэм — американский программист, предприниматель...
...Пол Грэм: «Мир, разделенный на пишущих и не пишущих...
...Врачи знают, как много людей беспокоится о своих родинках; люди, которые умеют налаживать работу компьютеров, знают, сколько людей не умеют этого делать; писатели знают, какому количеству людей нужна помощь в написании текстов....
На нашей планете тысячи языков. Они относятся к разным языковым группам и семьям, а диалекты внутри них могут отличаться настолько сильно, что специалисты спорят, не стоит ли их считать отдельными языками. Почему это многообразие нас так завораживает? Возможно, одну из причин назвал Петр Вяземский: «Язык есть исповедь народа: в нем чудится его природа, его душа и быт родной».
...На нашей планете тысячи языков. Они относятся к разным...
...Почему языки такие разные...
...Сколько языков на Земле, как они устроены; как и по каким законам изменяются; почему одни из них — родственные, а другие нет; чем именно отличается русский язык от английского и других языков, а китайский от японского; зачем глаголу наклонение и вид, а существительному — падежи?...
В последние годы в России идет интенсивный поиск национальной идеи. Количество предлагаемых вариантов огромно — от «вливания» в Европу и евразийства до пития водки или пива. При всем обилии идей ни одна не становится пока доминирующей. В чем здесь дело?
...В последние годы в России идет интенсивный поиск национальной...
...Национальный язык и национальная идея...
...Норма — это не только и не столько учебники и словари, сколько самоцензура с целью адекватного понимания вас окружающими. В период «разнормирования» каждый из нас культивировал свою речь, не соотнося ее с языком....
На презентации издания, которая состоялась 5 апреля на книжной ярмарке NonFiction, выступили историк, доктор исторических наук, профессор кафедры истории России до XIX века исторического факультета МГУ им. М. В. Ломоносова Антон Горский и лингвист, доктор филологических наук, ведущий научный сотрудник отдела языков народов Азии и Африки Института востоковедения РАН Светлана Бурлак.
...На презентации издания, которая состоялась 5 апреля...
...Вышло новое издание исследования «„Слово о полку Игореве...
...Если человек захочет подделать текст другой эпохи, он неизбежно выдаст себя, потому что в том, что касается не столько лексики, сколько грамматических форм, будет автоматически использовать то, что соответствует его языковому опыту, если только он не профессиональный лингвист....
Сегодня миллионы книг могут быть доступны нам в три клика. Нынешнее поколение школьников и студентов выросло с гаджетами в руках и с детства привыкло читать с экранов, что не могло не заинтересовать исследователей. Собранные данные говорят о том, что изменение носителя информации влияет на понимание и усвоение прочитанного. Вопрос в том, как именно влияет.
...Сегодня миллионы книг могут быть доступны нам в ...
...Бумага или «цифра»? Влияние формата чтения на понимание...
... Когда мы держим в руках книгу, это наглядное напоминание о том, сколько страниц мы уже прочитали и сколько еще осталось. При необходимости мы можем перелистывать страницы, чтобы перечитать текст....
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Состоялся запуск масштабного цифрового проекта «Слово...
...Например, мы знаем, сколько именно слов в 90-томнике принадлежат Толстому: если говорить о русских словах, то около 8 млн слов. Также есть определенные технические решения, позволяющие понять, какое слово вызовет у современного читателя вопросы, а какое — нет....
В 2028 году Россия и мир будут отмечать двухсотлетие со дня рождения Льва Толстого. Цифровая эпоха, в которую мы живем, дает возможность посмотреть на его жизнь и наследие как на уникальную базу данных. Прочитать забытое и малоизвестное, присмотреться к языку, сопоставить источники, лучше понять его идеи и контекст, в котором они возникли. Руководитель группы Tolstoy Digital Фекла Толстая рассказала Грамоте о проекте «Слово Толстого», в котором соединились ее увлечение цифровыми методами в гуманитарных науках и интерес к семейной истории.
...В 2028 году Россия и мир будут отмечать...
...Фекла Толстая: «Мы можем создать не 3D, а 10D-картинку...
...Просто посмотрите сначала, сколько их, сколько места они занимают....