Чтобы понять, как люди пользуются языком, лингвисты не только наблюдают. В этой науке тоже есть место эксперименту. О том, какой путь проделала экспериментальная лингвистика и какие есть современные способы организовать и провести эксперимент, рассказывает статья в журнале «Системный Блокъ».
...Чтобы понять, как люди пользуются языком, лингвисты...
...Когда-то лингвисты-теоретики основывали свои суждения...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
Корнский (Kernowek, англ. Cornish) — потомок древнего бриттского языка, на котором говорило коренное население острова Корнуэлл до прихода англосаксов. С V века число носителей языка постепенно сокращалось, а последние корноговорящие жители (для кого этот язык был первым и главным) умерли в конце XVIII века, хотя, по некоторым данным, язык в какой-то степени сохранялся и в течение XIX века. В 2009 году ООН признала язык ...
...Корнский (Kernowek, англ. Cornish) — потомок...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Обычно дети за несколько лет легко переходят от лепета к построению сложных предложений, но это происходит не всегда равномерно. Специалисты уже исследовали связь между речевым развитием ребенка и его полом, а также социально-экономическим положением семьи. Например, в ряде прошлых работ было показано, что в обеспеченных семьях дети осваивают язык быстрее, чем в неблагополучных. Однако один из недостатков этих работ заключался в том, что они не охватывали повседневное использование языка ...
...Обычно дети за несколько лет легко переходят от лепета...
В 1780-х годах императрица Екатерина II поручила ученому-энциклопедисту, путешественнику, академику Берлинской и Санкт-Петербургской академий наук Петру Симону Палласу (1741–1811) составить сравнительный словарь языков народов России и всего мира. Первое издание (в двух частях, которые вышли в 1787 и 1789 годах) включало 273 понятия, которые были представлены (с лакунами) на 149 языках Азии и 51 языке Европы.
...В 1780-х годах императрица Екатерина ...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...