Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Совсем скоро выпускники будут сдавать ЕГЭ по русскому языку. Показывают ли результаты этого экзамена уровень знания предмета? Каких умений не хватает филологам-первокурсникам? Можно ли в школе научить не только грамотно писать, но и убедительно говорить? Об этом мы поговорили с экспертом Грамоты, кандидатом филологических наук, доцентом МПГУ Станиславом Викторовичем Ивановым.
...Совсем скоро выпускники будут сдавать ЕГЭ по русскому...
...Грамота: К вам приходят учиться люди, которые...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Workspace Digital Awards — престижная отраслевая премия в сфере digital. Ежегодно участие в ней принимают лучшие агентства, дизайн-студии и команды. В рамках конкурса оцениваются кейсы, поданные агентствами через личный кабинет Workspace. Победители определяются в три этапа посредством народного голосования и голосования жюри, в которое входят лидеры отрасли: представители известных брендов, арт-директора, владельцы компаний. Грамота соревновалась ...
...Workspace Digital Awards — престижная отраслевая...
Институт Пушкина, Институт русского языка им. В. В. Виноградова РАН, кафедра русского языка Томского государственного университета и Международная лаборатория языковой конвергенции НИУ ВШЭ проводят уже второй международный симпозиум, посвященный лексикографии в условиях цифровой эпохи. Симпозиум пройдет под эгидой Комиссии по лексикологии и лексикографии Международного комитета славистов и Российского общества преподавателей русского языка и литературы ...
...Институт Пушкина, Институт русского языка им. ...
Как бы преподаватель ни относился к заимствованным словам, он должен научить студента правильно и уместно пользоваться этой лексикой. Для этого нужно объяснять не только значения заимствованных слов, но и их сочетаемость, системно-языковые отношения с синонимами, антонимами, родо-видовыми и тематическими включениями в родственные лексические группы.
...Как бы преподаватель ни относился к заимствованным...
...В последние десятилетия русский литературный язык испытывает...
Комитет по внешним связям Санкт-Петербурга и учебно-издательский центр «Златоуст» совместно организовали и провели масштабную программу мероприятий «Современные методики преподавания русского языка как иностранного. Теория и практика». Грамота публикует репортаж наших коллег.
...Комитет по внешним связям Санкт-Петербурга и учебно-издательский...
...Программа стала частью просветительских программ повышения...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...