Ответы справочной службы
При цитировании желательно ставить кавычки независимо от того, на каком языке идет цитата.
Относительно наименований единое правило для всех дать невозможно. Общий подход: если название дается в кириллическом тексте на английском (без транслитерации), то оно пишется так, как в языке-источнике. При этом нужно различать нарицательные понятия, которые пишутся со строчной (напр., helicopter view, soft skills), и наименования компаний, мероприятий и т. п. — с прописной.
Да, в слове data-аналитик дефис необходим.
Правильно: с взрывом (каким?) возникающим — творительный падеж. Ср.: о взрыве (каком?) возникающем — предложный падеж.
Слово пока не фиксируется академическим орфографическим словарем. По правилу о сложных словах с иноязычной первой частью, которая оканчивается на гласную и самостоятельно не употребляется, нужно писать слитно: датасет (дата- от англ. data 'данные'), ср. датаграмма.
Правильно будет использовать термин технологии больших данных.
Журнал
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...говорят специалисты, the only thing better than big data...
...is bigger data....
В новом номере журнала «Русская речь» наше внимание привлекли три статьи: о киргизском варианте русского языка, об акцентуации фразеологизмов и о происхождении слова инфохомяк. Также из этого номера можно узнать о частице чай в среднерусском говоре, заимствованиях из китайского и истории выражения хоть (матушку) репку пой.
...В новом номере журнала «Русская речь»...
...Английское слово состоит из двух частей: data...