Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
31 августа 1925 года Всероссийский центральный исполнительный комитет и Совет народных комиссаров РСФСР приняли декрет «О введении в РСФСР всеобщего начального обучения и построении школьной сети». Этот документ заложил основу радикальных перемен в системе образования, которые предстояло пережить стране. О том, как учили в начальной школе в 1920-е и 1930-е годы, Грамоте рассказал историк образования, доктор педагогических наук, профессор МПГУ Михаил Гончаров.
...31 августа 1925 года Всероссийский центральный исполнительный...
...Обучение как часть социального эксперимента Чтобы...
Сколько слов существует в русском языке? Ответ на этот вопрос и сложен, и прост. Трудно назвать точную цифру, и на это есть несколько причин: язык постоянно развивается, обновляется (одни слова появляются в речи, другие исчезают, уходят); масса диалектных слов пока учеными просто не зафиксирована и ни в каких словарях не описана; почти все профессии и научные дисциплины обладают «собственными» лексиконами, которые не входят в общенародную литературную речь; есть и другие причины.
...Сколько слов существует в русском языке? Ответ на этот...
...Мир слов воистину огромен, безбрежен. Лексическое ядро...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...«Ремингтон» и скорописец Английский инженер...
Русский язык как школьный предмет в основном сводится к правилам орфографии и пунктуации, разбору по составу, диктантам и пересказам. Но на самом деле речь — метапредметный навык, а русский язык — это еще и инструмент освоения всех остальных предметов. Как богатый словарный запас, умение анализировать текст и формулировать мысли помогают на математике, географии, обществознании? И можно ли развивать языковые компетенции на других уроках, а не только на русском?
...Русский язык как школьный предмет в основном сводится...
...Расширять кругозор и словарный запас В бидоне...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО. Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного ...
...О начале работы над корпусом объявили участники...
Полвека назад все было просто и понятно: вот писатель, вот журналист, а вот — редактор. В начале XXI века все запуталось: появились копирайтеры, райтеры, блогеры и контент-менеджеры. И немедленно вступили в переписку друг с другом и с заказчиками. Это подборка о современных принципах работы с текстами — мы включили в нее самые актуальные книги.
...Полвека назад все было просто и понятно: вот писатель...
...С появлением интернета изменился не только процесс...
В старые времена люди переписывали книги пером: «что написано пером, не вырубишь топором»... Относительно недавно многие писали от руки большие тексты и только потом печатали их на пишущей машинке. Сегодня мы всё реже оказываемся в ситуации, когда без ручного письма не обойтись. Значит ли это, что скоро оно отомрет за ненадобностью? Или у него есть ценные стороны, которые дадут шанс на долгую жизнь?
...В старые времена люди переписывали книги пером...
...Как развивалась письменность Изначально для передачи...