...
Чтобы измерить воздействие ИИ на выбросы CO2, а следовательно, и на работу графических процессоров в центре обработки данных, необходимо учитывать все типы выбросов. Существует 3 типа, они называются 3 областями: Область 1: напрямую из центра обработки данных: аварийные генераторы, работающие на топливеОбласть 2: косвенно связана с типом энергии, используемой центром обработки данных: ядерная, ветровая, угольная, газовая и т. д.Область 3: косвенно связана со строительством центра обработки данных, производством графических процессоров, транспортировкой всех этих деталей в центр обработки данных и т.д. Это определение содержится в Протоколе по парниковому эффекту. Тема выбросов CO2 сложна, и очень быстро можно прочитать много ерунды. Например: тепловой автомобиль выбрасывает около 1 кг CO2 на расстояние 5 км. Да, но это только область 2, косвенные выбросы, связанные с энергией, дизельным топливом, бензином. Сколько CO2 выбрасывается в атмосферу в зоне 3 при строительстве этого автомобиля? Затем нам необходимо амортизировать этот объем 3 на протяжении 100 000 км и добавить к нему объем 2, 1 кг на 5 км. А потом… Настоящая головная боль! В OVHcloud мы в течение 2 лет усердно работали над тем, чтобы всесторонне измерить все наши выбросы, и теперь мы сертифицируем наши результаты внешним органом. Мы измеряем его в кг CO2, выбрасываемых в месяц (кг CO2/мес) по категории 1+2+3. Таким образом, мы смогли сравнить выбросы по категории 1+2+3 между всеми нашими центрами обработки данных в Европе, Северной Америке и Азии. Во-первых, различия связаны с энергетическим балансом страны. Например, во Франции у нас много атомной энергетики: 38 кг CO2/месяц, в Квебеке много гидроэнергетики: 28 кг CO2/месяц, в Индии и Польше уголь: 318 кг CO2/месяц и 350 кг CO2/месяц (рисунок 1) В Европе и Канаде за два года компания OVHcloud перешла на зеленую энергию. В результате во Франции мы сократили выбросы категории 1+2+3 до 30 кг CO2/месяц, а в Польше — до 20 кг CO2/месяц. Мы делаем это в США (рисунок 1). На рисунке 2 мы видим влияние CO2 на область 1+2+3 между самой маленькой виртуальной машиной (ВМ) B3-8 и самой большой T2 с графическим процессором NVidia H100. Конечно, это связано с потреблением электроэнергии, но также и с выбросами CO2 нашими поставщиками при производстве электронных компонентов. Для создания виртуальной машины с графическим процессором, безусловно, требуется больше CO2, чем для создания виртуальной машины без графического процессора. В заключение необходимо выбрать, в какой стране, в каком центре обработки данных запускать ИИ, графические процессоры, какой тип энергии использовать (смешанную или зеленую энергию страны), какой тип охлаждения использовать (воздушное или водяное). Все это оказывает огромное влияние на выбросы CO2 ИИ в процессе обучения и вывода. Мы можем себе представить, что выберем подходящее место в мире для обучения моделей LLM, например, Францию или Квебек в Канаде, но каждая страна должна приложить собственные усилия для снижения воздействия CO2 в Inference, которое обязательно будет максимально локальным...
Чем короче полоска, тем, вероятно, больше вас переподписывают или более старое железо предлагают. Что это за график — ниже Идея очень простая: покупаю одинаковые тарифы на одинаковом железе и гоняю тесты. Удивляюсь, немного охреневаю, снова гоняю тесты. Ну и вот теперь показываю вам. Задача: понять, насколько одинаковый тариф с одинаковым количеством vCPU и RAM выражается в реальную производительность у разных провайдеров. Забегая вперёд — у меня нет вопросов к Селектелу, Клауд.ру (Сберу) и Яндексу (почти). У них переподписки, вроде, нет. А вот дальше начинается дичь. Разница такая, что я чувствую, что оставлю свою инсталляцию и сделаю из этого сервис, чтобы можно было прогнать тесты каждому самостоятельно. Но пока давайте покажу результаты. Какие тесты гонял Обычный Geekbench 6. То есть это проверка CPU + RAM, но не дисковой подсистемы. Это синтетический тест, он не показывает производительность в реальных задачах вроде задёрганной 1С или реальной работы веб-сервера под нагрузкой, но считается, что его результаты достаточно показательны, чтобы админы могли ориентироваться на них. Со временем, возможно, я добавлю тесты дисковых подсистем и сети, но пока только вычисления. В тест попали компании, которые предоставляют услугу публичного облака как основную или одну из основных. Везде я брал виртуальную машину с одинаковой конфигурацией — 2 vCPU и 4 Гб оперативной памяти. Оговорка: у Рег.ру такой конфигурации нет, пришлось взять 2vCPU и 2Гб RAM. Тест запускался одновременно на всех облаках, чтобы избежать разных оценок из-за разной нагрузки в разное время дня. Тест гонялся больше суток, каждый час, чтобы увидеть возможную разницу. Каждый замер можно проверить по ссылке в таблице. Тест запускался на трёх разных машинах у каждого провайдера, чтобы не упереться в ограничения какого-то конкретного локального проблемного сервера. Результаты Singe Core теста Тут всё чётко:
Здесь зависит от машины, с одной не повезло:
Аналогично:
Тут график пожевало:
Вопросов нет:
Вопросов больше, чем ответов:
Сводная:
Сводный средний балл:
Из расчёта на затраченный рубль (больше — лучше):
Коротко — лучше всего идти в Селектел, Сбер или Яндекс, а вот на ВК, Рег.ру и Таймвебе есть устойчивое ощущение переподписки. В случае Рег.ру — ПЕРЕПОДПИСКИ, которую пытаются компенсировать низкой ценой. Результаты Multicore Странный результат показывает Яндекс — показатели тестов почти как на SingleCore:
Облако ВК — есть просадки:
Клауд.ру — очень хорошие результаты, но была непонятная просадка:
Таймвеб — график попердолило:
Селектел — вопросов нет:
Рег.ру удивляет:
Сводная:
Сводный средний балл:
И вот из расчёта на затраченный рубль (больше — лучше):
Ссылки на сырые данные pastebin.com/JK4i6wcC static.h3llo.cloud/bench_final.xlsx Результаты словами Как я говорил, нет вопросов к Сберу, Селектелу и с натяжкой — к Яндексу. К остальным есть. Облако ВК в среднем ниже на 15‐20%, а отдельные инстансы — на 30%, и может показать внезапную просадку на такой же конфигурации с таким же процессором, и это, похоже, рандом. Дальше очень много вопросов к Таймвебу, но у них есть оговорка — они продают линейку «Стандарт» и нигде не указывают, что она переподписанная. Есть отдельная линейка Dedicated, где они говорят, что закрепляют одно ядро за пользователем без переключений. Там с производительностью всё более-менее, но цена примерно в два раза выше, чем у других провайдеров. То есть вы покупаете переподписанный тариф, но у вас складывается ощущение, что нормальный. Производительность MultiCore тестов Яндекса сильно удивила — там, где другие провайдеры честно показали x2, результаты Яндекса почти идентичны Single Core-тестам. У ряда других «публичных» сервисов мы не смогли попасть в консоль или вовсе не нашли публичного прайс-листа. У ряда облаков мы заполнили формы, и дальше с нами связался менеджер, который начал предлагать индивидуальное ценообразование. Также мы не включили 1cloud.ru, потому что у них нет ни последних образов ОС, ни адекватного механизма тестирования, честной почасовой оплаты тоже не нашли — при создании ВМ консоль просит пополнить баланс на месяц. Этим, кстати, и Таймвеб грешит. Cloud4Y перезвонили и на пожелание разместиться в хостинге с прозрачной почасовой оплатой предложили «идти туда, где такое есть». В общем, из рейтинга CNews мы не тестировали провайдеров, если у них не было публичного ценника, механизма доступа по регистрации без диалога с менеджером и т.п., то есть их сложно отнести к настоящим публичным облакам, которыми можно просто прийти и воспользоваться. RUVDS мы не включали, так как они позиционируют себя не как облачный хостинг, а как виртуальные машины VDS. Основной вывод Есть провайдеры, которые сильно переподписывают ресурсы, при этом ничего об этом не говорят (или говорят незаметно), когда вы покупаете за среднерыночную цену. Вы, возможно, ожидаете получить примерно то же самое, а получаете в два раза меньше производительности. Ещё ограничение теста Мы не проверяли две следующие гипотезы: Новые пользователи в первый месяц получают грейс-период, когда их не переподписывают. Это мы узнаем позже, потому что будем гонять тесты регулярно и оставим это как публичный сервис.Машзалы ряда провайдеров ещё не полностью загружены, переподписка есть, но не чувствуется. Это тоже мы узнаем по мере развития событий со временем. Но уже сейчас видно, что у некоторых провайдеров разные инстансы одинаковой конфигурации, созданные в одно и то же время, показывают разный результат. Зачем я это делаю Мы строим публичное облако в России. Хочется строить его сразу прозрачно, честно и чтобы было понятно, за что пользователи платят. Мы оставим этот набор тестов, плюс, вероятно, сделаем позже дашборд и для публичных провайдеров, и для себя, чтобы можно было сравнить. Пока же мне было просто интересно, кто насколько реально отдаёт 1 vCPU, и я получил числа. Что с ними делать и делать ли — решать уже вам. Относительно нас самих — не думаю, что мы покажем плохие результаты в категории «производительность за вложенный рубль». Я точно не планирую так сильно переподписывать ресурсы. Кроме того, у меня стоят Xeon 4 на DDR5, которые в 2–3 раза производительнее того, что стоит у других. Когда через несколько лет это оборудование устареет, мы планируем его ротировать в проекты, где оплата ведётся за конкретные операции, а не за ресурс. Конечно, оплаты за выполненные операции — это идеальная модель, но у нас в России всё же пока стандарт — за время. Да и Serverless Horrors — жанр, получающий всё более широкое распространение. Мы задались амбициозной целью изменить эту историю. Соответственно, цикл жизни, который я строю для облака, такой: vCPU, продаваемые как самые топовые, когда проживают какое-то время и устаревают, уходят на PaaS-сервисы, где не тарифицируется само железо. h3llo.cloud auth.h3llo.cloud/register...