Служебные элементы (артикли, предлоги) ван, да, де, ле и т. п., входящие в состав иноязычной фамилии, могут быть ее неотъемлемой частью, и обычно в этих случаях мы не употребляем фамилию без служебного элемента. Ср.: мы говорим Ван Гог (не Гог), Ди Каприо (не Каприо), Де Костер (не Костер). Но при этом обычно употребляют: Бальзак (не де Бальзак), Бетховен (не ван Бетховен).
Это различие сказывается, как Вы, наверное, обратили внимание, и на написании. Служебные элементы, входящие в состав иноязычных фамилий, обычно пишутся со строчной буквы: Людвиг ван Бетховен, Оноре де Бальзак, Гёц фон Берлихинген. Однако если служебный элемент «спаян» с фамилией, он пишется с прописной буквы: Ван Гог, Шарль Де Костер, Леонардо Ди Каприо.
От «спаянности» служебного элемента с фамилией (и, соответственно, написания его с прописной или строчной буквы) зависит и алфавитный порядок. Например, в «Словаре собственных имен русского языка» Ф. Л. Агеенко: БАЛЬЗАК Оноре де, БЕРЛИХИНГЕН Гёц фон, БЕТХОВЕН Людвиг ван – на букву Б; но: ВАН ГОГ Винсент – на букву В, ДЕ КОСТЕР Шарль и ДИ КАПРИО Леонардо – на букву Д.
Как произносится фамилия, решает носитель этой фамилии. В именах собственных буква ё используется непоследовательно, строгой регламентации ее употребления нет. Поэтому фамилия Алехин может быть прочитана и как А[л'э]хин, и как А[л'о]хин.
В «Правилах русской орфографии и пунктуации» 1956 года такая орфографическая ситуация прямо не оговаривается, хотя есть правила, под которые можно было бы подвести написание имен собственных:
«Буква ё пишется в следующих случаях:
1. Когда необходимо предупредить неверное чтение и понимание слова, например: узнаём в отличие от узнаем; всё в отличие от все; вёдро в отличие от ведро; совершённый (причастие) в отличие от совершенный (прилагательное).
2. Когда надо указать произношение малоизвестного слова, например: река Олёкма.
В справочнике «Правила русской орфографии и пунктуации. Полный академический справочник» под ред. В. В. Лопатина букву ё в именах собственных рекомендуется писать, но о ее обязательности не говорится:
«В обычных печатных текстах буква ё употребляется выборочно. Рекомендуется употреблять ее в следующих случаях.
3. В собственных именах — фамилиях, географических названиях, напр.: Конёнков, Неёлова, Катрин Денёв, Шрёдингер, Дежнёв, Кошелёв, Чебышёв, Вёшенская, Олёкма».
Никакие знаки препинания здесь не нужны. Так и пишется: решил было уходить, собрался было спать.
Интересна история подобных форм. Формы с было представляют собой остатки сложной древнерусской формы прошедшего времени – плюсквамперфекта. Плюсквамперфект обозначал прошедшее действие, которое завершилось раньше другого прошедшего действия, а также отнесенный к прошлому результат еще ранее совершенного действия (ср. англ. Past Perfect). Пример: у ярополка жена грекини бе и бяше была черницею – «у Ярополка жена была гречанка (прошлое состояние), которая (еще раньше) была монахиней». В поздний этап своего существования в русском языке (XVI–XVII века) плюсквамперфект образовывался путем сочетания изменяемого по родам и числам причастия на -л от глагола быть и причастия на -л смыслового глагола: Земля была высохла, да опять промокла – «Земля стала (в прошлом) мокрой, хотя (еще раньше) высохла». Впоследствии плюсквамперфект пережил в истории русского языка несколько преобразований. Причастие на -л от быть превратилось в неизменяемую форму было. А значение стало таким: действие, готовящееся в прошлом, но не осуществившееся или начавшееся в прошлом, но прерванное другим действием. Отсюда формы: решил было уходить (но передумал); собрался было спать (но расхотелось).
Ответ на Ваш вопрос содержится в академическом «Русском орфографическом словаре» под ред. В. В. Лопатина и О. Е. Ивановой (М., 2023), размещенном на нашем портале. В этом словаре закреплены в нормативном написании не только отдельные слова, но и различные неоднословные единицы — устойчивые обороты, имена, названия. Конечно, орфографический словарь не является словарем собственных имен и не может вместить в себя все имена и названия, но он стремится охватить самые разнообразные модели, которые даются через достаточно известные примеры. По таким примерам можно определить, как пишется другое название такой же структуры.
Как найти неоднословную единицу в словаре? Она может даваться в заголовке словарной статьи, а может включаться в текст статьи, заголовком которой является ключевое слово искомого выражения. К первому типу относятся, например, Новый год и старый Новый год, а ко второму — название года по восточному календарю, о котором был задан вопрос (посмотрите также статьи мышь, змея, кролик и под.).
Чтобы найти в словаре сочетание слов — заголовок словарной статьи, его нужно набрать в поисковой строке в кавычках (см., например, високосный год).
Вряд ли возможно на вопрос, сформулированный именно так, дать универсальный ответ, который будет охватывать все возможные случаи.
Члены Орфографической комиссии РАН Е. В. Арутюнова, Е. В. Бешенкова и О. Е. Иванова в «Русском правописании с комментариями» указывают: «Существует различие между словами, входящими в состав имени собственного, и словами, сопровождающими имя собственное. Нарицательные слова, полностью сохраняющие свое словарное значение и служащие не для характеристики, а для идентификации субъекта, не входят в имя собственное (дед лесовик, дед Щукарь, Юлиан-отступник, курочка Ряба, Снежная королева). Нарицательные слова входят в состав имени собственного, если они становятся референтно прикрепленными к конкретному лицу и, соответственно, полностью или частично теряют свое нарицательное значение (Дед Мороз, Юлиан Отступник, Курочка Ряба). Для некоторых сложных переходных случаев требуются пояснения».
Сочетание дядя Сэм (об американце) зафиксировано «Академосом». В сочетании генерал Мороз слово генерал сохраняет свое значение (передает образ военного, помогающего побеждать врагов), его уместно писать со строчной.
Но в каких-то других случаях условия текста могут продиктовать иное написание имен тех или иных персонажей, и автор будет вправе присвоить статус имени собственного всему сочетанию, а не только второму слову.
Слово бот обозначает программу, которая действует автоматически, без участия человека. В русском языке такие слова, как правило, приобретают статус неодушевленного существительного и соответствующим образом склоняются: использовать боты, подключить бот, подписаться на бот. Вместе с тем отдельные группы имен существительных могут изменяться по падежам вариативно; см. примеры и объяснения в статье «Между эмбрионом и покойником: где расположены роботы на шкале одушевленности».
В дополнение отметим своеобразие синтаксической конструкции с глаголом используют. Если в предложении отсутствует подлежащее, то вариант конструкции используют ботов служит на пользу однозначности; ср.: Ботов используют для рассылки спама. Форма винительного падежа ботов ясно указывает на зависимый статус существительного (управляемый глаголом компонент со значением объекта действия). Это важный показатель, поскольку возможно предложение с сочетанием боты используют (и с обратным порядком слов используют боты), в котором существительное боты является подлежащим и обозначает субъект действия: боты могут взаимодействовать друг с другом и используют для этого интернет-сервисы. Наблюдения показывают, что всё чаще используются обороты, в которых слово бот склоняется по типу одушевленного существительного: мы создавали чат-ботов, создали продвинутого бота, разработаем бота.
Приводим формулировки правил.
В названиях, начинающихся на Северо- (и Северно-), Юго- (и Южно-), Восточно-, Западно-, Центрально-, с прописной буквы пишутся (через дефис) оба компонента первого сложного слова, напр.: Северо-Байкальское нагорье, Восточно-Китайское море, Западно-Сибирская низменность, Центрально-Черноземный район, Юго-Западный административный округ. Так же пишутся в составе географических названий компоненты других пишущихся через дефис слов и их сочетаний, напр.: Индо-Гангская равнина, Волго-Донской канал, Военно-Грузинская дорога, Алма-Атинский заповедник.
В названиях учреждений, организаций, начинающихся географическими определениями с первыми компонентами Северо- (и Северно-), Юго- (и Южно-), Восточно-, Западно-, Центрально-, а также пишущимися через дефис прилагательными от географических названий, с прописной буквы пишутся, как и в собственно географических названиях, оба компонента первого сложного слова, напр.: Северо-Кавказская научная географическая станция, Западно-Сибирский металлургический комбинат, Санкт-Петербургский государственный университет, Орехово-Зуевский педагогический институт, Нью-Йоркский филармонический оркестр.
Прилагательные, образованные от географических названий, пишутся с прописной буквы, если они являются частью составных наименований – географических и административно-территориальных, индивидуальных имен людей, названий исторических эпох и событий, учреждений, архитектурных и др. памятников, военных округов и фронтов. В остальных случаях они пишутся со строчной буквы. Например: северокавказская природа и Северо-Кавказский регион, Северо-Кавказский военный округ.
См.: Правила русской орфографии и пунктуации. Полный академический справочник / Под ред. В. В. Лопатина. М., 2006 (и более поздние издания).
Вот что пишет о происхождении этого названия известный ученый-топонимист Евгений Михайлович Поспелов (словарь «Географические названия России»): «Наличие в названии притяжательного суффикса -ин позволяет считать, что в его основе находится прозвищное личное имя Пушка, которое имело довольно широкое распространение: в своде древнерусских имен С. Б. Веселовского (1974), составленном по источникам XV-XVII вв., упомянуто около 30 Пушкиных. В их числе и Григорий Александрович Пушка Морхинин (середина XVI в.), от которого пошел тот род Пушкиных, к которому принадлежал и поэт А. С. Пушкин. По предположению акад. С. Б. Веселовского, этот Григорий Пушка мог владеть селом, получившим по его имени название Пушкино. Документальных доказательств связи ойконима с Григорием Пушкой нет, но его образование от Пушка или Пушкин сомнению не подлежит: именование селений по владельцам было обычным для вотчинного и поместного землевладения. Но среди краеведов распространено мнение, что название села образовано от названия р. Уча, на которой оно расположено. Образование предполагается по схеме: По Уче > По Уше > По Ушке > Поушкино > Пушкино. Понятно, что ни предполагаемая исходная форма По Уче, ни одна из промежуточных форм никакими источниками не зафиксированы, и совершенно очевидно, что эта фантастическая этимология представляет собой невежественный, искусственный домысел».