Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Зачем вообще люди ругаются нецензурными словами? Что такое языковые табу? Как возникла и развивалась табуированная лексика в русском языке? Почему люди стали чаще пользоваться эвфемизмами вместо мата и хорошо ли это? Все эти волнующие общество темы лингвист, член Орфографической комиссии РАН, доцент кафедры русского языка Московского архитектурного института и эксперт Грамоты Мария Ровинская обсудила с ведущим подкаста Григорием Тарасевичем.
...Зачем вообще люди ругаются нецензурными словами? Что...
...Ведущий сразу предупредил, что матерные слова будут...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...Александр Антонов, руководитель группы оценки качества...
Существование и функционирование русского языка в российском сегменте интернета, безусловно, и заслуживает, и требует особого внимания. Хотя эта тема является во всех отношениях новой, неизученной, однако уже сейчас становится понятно, что в ближайшие годы она займет существенное место в языковедческих исследованиях.
...Существование и функционирование русского языка в российском...
...Прежде всего, необходимо определиться с терминологией...
Жестикуляция выполняет в спонтанной речи множество разных функций. Она помогает расставлять акценты, дополнять слова визуальными подсказками, делает речь более живой и динамичной. Кроме того, жесты могут говорить о разных подходах к выстраиванию устной речи, свойственных носителям разных языков. Ученые из Лундского университета в Швеции решили выяснить, чем отличается жестикуляция итальянцев и шведов. Итальянский и шведский были выбраны как характерные ...
...Жестикуляция выполняет в спонтанной речи множество...
Появление языка — один из поворотных моментов эволюции, выделивший человека среди других видов. Но можно ли считать язык исключительно нашим ноу-хау? Последние научные данные говорят о том, что элементы довольно сложных систем коммуникации есть и у других животных. Например, недавно у кашалотов выделили нечто похожее на алфавит. И вот теперь на очереди — слоны. Ранее было известно, что бутылконосые дельфины способны привлекать внимание конкретного ...
...Появление языка — один из поворотных моментов...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
В Год семьи Российский книжный союз совместно с Русской школьной библиотечной ассоциацией запустил проект «Читающая мама», направленный на популяризацию традиций семейного чтения. Родителей призывают уделять этому занятию хотя бы десять минут в день. Авторы перечисляют те задачи, которые можно решить благодаря регулярному чтению детям; в их числе — развитие речи, развитие навыков чтения и воображения, формирование эмоционального ...
...В Год семьи Российский книжный союз совместно с ...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...