Искусственному интеллекту нужны все ресурсы планеты - и даже больше. Когда лопнет мыльный пузырь ИИ

Все выглядит достаточно просто: спросите что-нибудь у ChatGPT - и он ответит. Но, копнув вглубь, вы обнаружите, что каждый запрос ChatGPT и каждая решенная задача от Microsoft Copilot потребляют огромные ресурсы. 

Миллионы людей проектируют, корректируют и обучают модели ИИ, которые потребляют столько тераватт-часов электроэнергии, которых бы хватило для обеспечения крупнейших стран. Мегацентры обработки данных по всему миру. Сети линий электропередач и интернет-кабели. Вода, земля, металлы и минералы. Искусственному интеллекту нужно все это и понадобится еще больше, пишет Bloomberg.

Исследователи подсчитали, что для обработки одного запроса ChatGPT требуется почти в 10 раз больше электроэнергии, чем для традиционного поиска Google. Типичная поисковая система сканирует интернет в поисках контента, который хранится в огромном индексе. Но новейшие продукты ИИ полагаются на так называемые большие языковые модели, или LLM, которые загружаются миллиардами слов текста — от собраний сочинений Уильяма Шекспира до последних прогнозов Федеральной резервной системы. Модели обнаруживают закономерности и ассоциации и разрабатывают миллиарды и миллиарды так называемых параметров, которые помогают им имитировать человеческое поведение. Используя эти модели, ChatGPT и подобные им создают новый контент — отсюда и термин генеративный ИИ.

Ресурсоемкая природа ИИ создаст победителей и проигравших. Те, у кого больше всего ресурсов, будут иметь самые передовые системы ИИ. Это приводит к столкновениям из-за все более дефицитных товаров, а также доступа к чипам, мотивируя технологические компании искать более эффективные способы разработки ИИ. Они вкладывают миллиарды долларов в альтернативные энергетические решения, такие как ядерный синтез, которые годами, если не десятилетиями, топтались на месте без крупных расходов и технологических прорывов. В то же время требования ИИ усиливают давление, заставляющее продолжать сжигать ископаемое топливо для питания электросети, даже когда мир находится на пути к тому, чтобы превзойти важнейшие целевые показатели выбросов в борьбе с изменением климата.

Хотя развитие ИИ представляет собой колоссальную возможность для инвесторов, предприятий и обществ, есть и опасность. Многие подняли вопрос о потенциальном вреде и предвзятости таких систем. Тем временем Уолл-стрит устал ждать, когда технология ИИ превратится в значимую прибыль. Даже акцент на эффективности может обернуться против тех, кто чрезмерно инвестирует в инфраструктуру. Вот подробный взгляд на все, что нужно индустрии ИИ для поддержания работы ее моделей.

Еще 1000 тераватт-часов электроэнергии

ИИ в основном живет и работает в центрах обработки данных, гудящих от материнских плат, чипов и устройств хранения данных. Спрос на электроэнергию в этих центрах в настоящее время превышает доступное предложение во многих частях мира. В США, по прогнозам, центры обработки данных будут потреблять 8% от общей мощности к 2030 году, что почти в три раза больше доли в 2022 году, когда начался ажиотаж вокруг ИИ. По данным Goldman Sachs Group Inc., которая описала это как «рост потребления электроэнергии, которого не было за поколение». Аналогичные всплески спроса прогнозируются для Швеции и Великобритании. Ожидается, что к 2034 году ежегодное мировое потребление энергии центрами обработки данных превысит 1580 тераватт-часов — примерно столько же, сколько потребляет вся Индия — в сравнении с примерно 500 сегодня.

Центры обработки данных, управляемые Alphabet Inc., использовали более 24 тераватт-часов электроэнергии в 2023 финансовом году, что на 31% больше, чем в 2021 году. Общее потребление Microsoft Corp. было примерно таким же, что на 70% больше, чем два года назад. Крупнейшие мировые технологические компании остро осознали, что электроэнергия может стать самым разрушительным звеном в цепочке работы ИИ, спешат закрепить ее долгосрочные поставки. В мае Microsoft и подразделение зеленой энергетики Brookfield Asset Management Ltd. подписали крупнейшее корпоративное соглашение о покупке чистой энергии.

В октябре крупнейший в мире производитель солнечной и ветровой энергии NextEra Energy Inc. заявил, что заключил сделки о потенциальной разработке 10,5 гигаватт возобновляемой энергии и ее хранении к 2030 году всего для двух компаний из списка Fortune 50. И это даже не технологические компании.

Ему нужны все ископаемые виды топлива, которые он может получить — и даже больше

Уголь, один из самых углеродоемких источников энергии в мире, по-прежнему сжигается для производства примерно трети поставок электроэнергии. Природный газ, который также создает выбросы, вызывающие глобальное потепление, является топливом для 20% электроэнергии. Ветряные и солнечные электростанции набрали популярность в последние годы, но из-за отсутствия гигантских батарей, которые могли бы выровнять поставки для центров обработки данных, прерывистый характер возобновляемой энергии стал серьезной проблемой, поскольку необходим постоянный поток энергии.

Метод, который впервые применила Google, стал решением: использовать программное обеспечение для поиска чистой электроэнергии в частях мира с избытком солнца и ветра, а затем наращивать там работу центров обработки данных. В противном случае, возможно, единственным надежным круглосуточным источником энергии с нулевым уровнем выбросов на данный момент является ядерная энергия. Это объясняет, почему Microsoft заключила в сентябре сделку, которая позволит снова открыть реактор на атомной электростанции Three Mile Island в Пенсильвании, где в 1979 году произошел печально известный частичный расплав. 

Примерно через месяц Amazon.com Inc. подписала три соглашения о разработке малогабаритных ядерных реакторов, а Google инвестировала и взяла на себя обязательство покупать электроэнергию у компании, которая аналогичным образом разрабатывает модульные реакторы. «Я имею в виду, Боже мой, ядерные реакторы. Вы шутите?» — сказал председатель Oracle Corp. Ларри Эллисон аналитикам на встрече в сентябре. «Это звучит как полная выдумка, но это не так. … Случалось ли что-то подобное раньше?».

Ему нужно в сто раз больше пропускной способности сети

Линии электропередач и подстанции — самые недооцененные звенья в цепочке ИИ. Все новые центры обработки данных должны будут быть подключены к сети, которая уже устарела, находится под нагрузкой и часто уязвима из-за природных катаклизмов. В апреле Брайан Вентуро, соучредитель поставщика облачных услуг CoreWeave Inc., сказал, что такие компании, как его, разрабатывают гигантские центры обработки данных, которые будут сильно нагружать сеть. Представьте себе подстанцию ​​в промышленной зоне, которая выдает 30 мегаватт, а центру обработки данных, расположенных там, может потребоваться, скажем, 5 мегаватт.

Остальное идет в другие офисы и на заводы. Сегодня такие компании, как CoreWeave, говорят: «Я хочу 500», — сказал Вентуро. «Вам нужно построить новые линии электропередач. Вам нужно построить новые подстанции». И вам понадобятся трансформаторы на этих подстанциях, которые, возможно, придется заказывать за несколько лет вперед.

И это только для 500 мегаватт. Соучредитель и генеральный директор OpenAI Сэм Альтман говорит о центрах обработки данных, которым может потребоваться 5000 мегаватт. Создание энергосистемы, способной поддерживать такую ​​нагрузку в одном месте с нуля в короткие сроки, «функционально невозможно», считает генеральный директор Constellation Energy Corp. Джо Домингес. Constellation — владелец атомной электростанции Three Mile Island, которая восстанавливает реактор, чтобы снабжать электроэнергией Microsoft. 

Домингес говорит, что строителям центров обработки данных нужно подумать о совместном размещении вокруг гигантских, уже существующих источников энергии, таких как его атомные электростанции. Постройте мегакампус рядом с парой ядерных реакторов, окружите их возобновляемыми источниками энергии и батареями, соедините их все вместе новыми проводами и переключателями нагрузки, и тогда вы сможете создать автономную сеть.

Ему нужны миллиарды литров воды ежедневно

Каждый ватт электроэнергии, подаваемой на сервер, генерирует тепло. Слишком высокая температура может разрушить оборудование и замедлить работу систем. Сейчас некоторые из самых энергоэффективных и экономически эффективных способов охлаждения воздуха в вычислительных центрах используют воду. Bluefield Research подсчитала, что центры обработки данных потребляют более миллиарда литров воды в день, включая воду, используемую для выработки энергии.

 Этого достаточно, чтобы обеспечить 3,3 миллиона человек в течение дня. В одном исследовании 2023 года подсчитано, что для разговора с ChatGPT, состоящего примерно из 10–50 вопросов и ответов, требуется стандартная поллитровая бутылка воды. По оценкам, обучение только одной более ранней модели ИИ, лежащей в основе ChatGPT, потребовало почти миллион литров воды. Что еще хуже: большая часть воды должна быть питьевого качества, чтобы избежать проблем с окружающей средой и отказа оборудования.

В Западном Де-Мойне, штат Айова, сеть центров обработки данных Microsoft, которую использовал OpenAI, превратила технологического гиганта в крупнейшего потребителя воды в регионе, использовав ее больше, чем сам город, согласно данным водного округа. (Округ заявляет, что компания также расследовала утечку, которая значительно увеличила ее потребление.) В Талавера-де-ла-Рейна, небольшом городе, затерянном среди ячменных и пшеничных полей Испании, Meta Platforms Inc. столкнулась с недовольством местных жителелей из-за плана строительства центра, который будет потреблять около 665 миллионов литров воды в год.

Ему необходимо в два раза больше пропускной способности Интернета

Большие языковые модели, лежащие в основе генеративного ИИ, обучаются, переваривая огромные объемы данных через Интернет, а использование инструментов ИИ, в свою очередь, только увеличат спрос. Генеральный директор AT&T Inc. Джон Стэнки заявил в мае, что спрос на беспроводную связь в сети уже вырос на 30% в год и не замедлится с ростом использования ИИ. «Если вы собираетесь продолжать видеть рост использования на 30–35% в год, вам нужно строить более крупные магистрали, чтобы справиться с ним», — сказал он.

За последние пять лет рост сетевого трафика в Verizon Communications Inc. более чем удвоился благодаря людям, смотрящим и транслирующим видео, сказал генеральный директор Verizon Consumer Group Соумьянараян Сампат. Он предсказал, что в ближайшие пять лет рост снова удвоится из-за подсказок и данных, вводимых в модели ИИ. Технологические компании так жаждут немедленно закрепиться в оптоволоконных сетях, что телекоммуникационная компания Lumen Technologies Inc. в августе объявила, что она получила 5 миллиардов долларов (и ведет переговоры о получении еще 7 миллиардов долларов) в новом бизнесе, связанном со спросом на подключение, обусловленным ростом ИИ.

Ему нужна недвижимость для тысяч центров обработки данных

Во всем мире построено или находится на разных стадиях разработки более 7000 центров обработки данных, по сравнению с 3600 в 2015 году. И этого все равно, вероятно, будет недостаточно. Спрос на услуги центров обработки данных резко вырос еще до ChatGPT, в основном потому, что компании все чаще перемещают обработку данных за пределы помещения и обращаются к удаленным облачным сервисам. И каждая крупная страна хочет иметь собственные домашние центры искусственного интеллекта, что запускает глобальную гонку за инфраструктуру.

Центрам обработки данных нужна земля. Для справки: инвестиционный фонд недвижимости, ориентированный на центры обработки данных Equinix Inc. купил 80 гектаров для кампуса мощностью в несколько сотен мегаватт. Другая компания недавно подписала договор аренды на 800 гектаров для строительства гигаваттного центра обработки данных. Найти землю, которая идеально подходит для энергетических потребностей центра обработки данных, сложно, что приводит к ценовым войнам. 

Этим комплексам также нужны строительные материалы и бригады. Материалы находятся в стадии ожидания, и ощущается нехватка рабочих. Между тем, Вентуро из поставщика облачных услуг CoreWeave говорит, что некоторые из его клиентов хотят, чтобы он посвятил целые кампусы только их бизнесу. «Рынок движется намного быстрее, чем были созданы цепочки поставок, которые исторически поддерживали физический бизнес», — говорит Вентуро.

Ему нужны чипы, чипы, и еще раз чипы

Графические процессоры, или GPU, являются рабочими лошадками для обучения моделей ИИ. Они предназначены для одновременной обработки тысяч задач, концепция, известная как параллелизм данных. Центр обработки данных может использовать сотни или даже тысячи таких процессоров, каждый из которых стоит больше, чем средний автомобиль. Практически каждая крупная технологическая компания столкнулась с нехваткой этого типа чипов, когда впервые начался бум генеративного ИИ. Microsoft и Google были среди тех, кто в прошлых отчетах о доходах назвали проблемой низкий уровень запасов графических процессоров.

Корпорация Nvidia подняла ставки для всех, перейдя к ежегодному внедрению новых технологий. Это еще больше напрягло и без того растянутую цепочку поставок. В ноябре компания заявила, что ее новый продукт Blackwell снова в строю и опережает прогнозы по объему выпуска. Но, что самое важное, пройдет еще много кварталов, прежде чем их будет выпущено достаточно, чтобы удовлетворить весь спрос.

Ему нужен кремний, сталь, кварц и медь

Многие из перечисленных выше товаров требуют металлов и минералов. Рассмотрим кремний, основу для чипов, схем и процессоров. Китай является крупнейшим производителем сырого кремния и очищенных кремниевых материалов, что вызывает беспокойство по мере роста напряженности между ним и США. Последняя паника в цепочке поставок возникла в Северной Каролине. В октябре ураган Хелен, помимо того, что убил десятки людей и застрял на востоке США, нарушил работу двух рудников в штате, которые вместе производят около четырех пятых кварца высочайшего качества. Он используется для создания тиглей, в которых кремний нагревается, плавится и преобразуется в монокристаллическую структуру, которая является идеальной основой для производства полупроводников.

Полупроводники содержат золото, серебро, алюминий и олово. Этих металлов достаточно, чтобы поддерживать работу заводов. Но два малоизвестных металла для чипов стали камнем преткновения: галлий и германий. В декабре Китай объявил о запрете на экспорт металлов в США — часть обостряющейся технологической войны. Медь присутствует во всем, включая чипы, центры обработки данных, электрооборудование и охлаждающие устройства, что потенциально создает условия для столкновения между требованиями ИИ, возобновляемой энергии и электротранспорта. А еще есть сталь, которая имеет решающее значение для строительства центров обработки данных и для инфраструктуры, такой как кабели.

Ему нужно больше людей, чем вы думаете

Многое было сказано о рабочих местах, которые может ликвидировать ИИ. В феврале шведская финтех-компания Klarna Bank AB произвела фурор, заявив, что ее помощник на основе ИИ выполняет работу, эквивалентную работе 700 штатных агентов по обслуживанию клиентов. Глобальные исследовательские и аналитические компании предупредили, что занятость в таких секторах, как финансы, юриспруденция и обслуживание клиентов, сильно пострадает. Международный валютный фонд подсчитал, что ИИ может заменить почти до 40% рабочих мест во всем мире.

Но сами компании, занимающиеся ИИ, сегодня напрямую нанимают миллионы людей. Среди работников ИИ есть специалисты по информатике, архитекторы данных, исследователи, математики, инженеры-программисты, проектировщики микросхем, менеджеры по продуктам и программам, а также юристы по вопросам соответствия. Не говоря уже об армиях внутренних аналитиков, маркетологов и продавцов. В начале ноября Salesforce Inc. объявила о планах нанять более 1000 сотрудников для продажи своего нового продукта генеративного ИИ.

Во многих из этих профессий возникли узкие места в плане талантов на фоне ажиотажа по набору персонала для ИИ. Технологические инвесторы и стартапы в области ИИ сетуют на нехватку должным образом образованных и опытных кандидатов. Фраза «искусители ИИ» — игра слов «Лига плюща» — появилась в Кремниевой долине для обозначения нескольких компаний (среди них Alphabet, Microsoft и OpenAI), которые обучили таланты, и которые все остальные хотят переманить. Еще больше было нанято за границей, в таких странах, как Индия, для создания и очистки высококачественных наборов данных, необходимых для обучения систем ИИ.

Ему нужно больше (хороших) данных, чем может быть в мире

Модели генеративного ИИ нуждаются в высококачественных данных так же, как люди нуждаются в еде. Большие языковые модели «обучаются» путем приема текста, разбитого на небольшие единицы, называемые токенами. Из этого текста LLM выявляют закономерности, которые помогают предсказать — в процессе, повторяющемся снова и снова — текст, который должен следовать за другим набором текста. Ведущие в мире LLM обучались более чем на триллионе токенов каждый. Чтобы представить это в контексте, учтите, что 2048 токенов примерно эквивалентны 1500 словам. Оценки того, сколько именно токенов кумулятивных текстовых данных существует в мире, варьируются от нескольких триллионов до тысяч триллионов.

Удивительно, но этого обилия данных может быть недостаточно, чтобы поддерживать развитие ИИ так быстро, как некоторые надеются. Некоторые из самых мощных в мире разработчиков моделей ИИ, такие как OpenAI, уже сталкиваются с тем, что все труднее находить новые, неиспользованные источники высококачественных данных для обучения, созданных человеком, для совершенствования своих моделей.

Данные на языках, отличных от английского, ограничены, и еще меньше данных, которые не ориентированы на западные или белые сообщества. Такое отсутствие разнообразия грозит привести к продуктам ИИ, которые демонстрируют предвзятость в отношении меньшинств, женщин и других недостаточно представленных групп населения.

Производители данных и контента, от медиаорганизаций до финансовых учреждений, начинают осознавать, что их информация становится все более ценной для разработчиков ИИ. Голливудские актеры и писатели в 2023 году устроили забастовку, чтобы защитить свое ремесло от этой технологии. The New York Times, а также крупные звукозаписывающие компании подают в суд на компании ИИ за обучение своих данных на защищенных авторским правом работах. Компании ИИ заявляют, что обучение на общедоступных материалах является законно разрешенным добросовестным использованием.

В недавнем разговоре с инвесторами генеральный директор S&P Global Inc. Мартина Чунг подытожила: «Большая языковая модель хороша лишь настолько, насколько хороши данные, на которых она обучена, а у нас много высококачественных данных». Только за последний год OpenAI заключила сделки на использование контента от News Corp., Condé Nast, Hearst, Reddit, издателя журнала People.

Технологические компании экспериментируют с моделями обучения на «синтетических» наборах данных, контенте, созданном самим ИИ. Теоретически это помогает компаниям ИИ удовлетворять свою бездонную потребность в данных, избегая при этом юридических, этических и связанных с конфиденциальностью проблем. Но некоторые исследователи предупреждают, что модели ИИ могут «рухнуть», если их обучать на контенте, созданном ИИ, а не людьми. В одной из статей 2023 года о так называемом коллапсе модели показано, что изображения людей, созданные ИИ, стали все более искаженными после того, как модель переобучилась на «даже небольших количествах его собственного творения».

Его питают как страхи, так и надежды

Инвесторы, операторы центров обработки данных, энергетические компании и другие предприятия вкладывают сотни миллиардов долларов в различные части цепочки поставок, которая питает ИИ. Каждый крупный банк и частный финансист позиционирует себя в части предполагаемых расходов в размере 1 триллиона долларов на инфраструктуру ИИ. Капитальные затраты Alphabet, Amazon, Microsoft должны в совокупности превысить 200 миллиардов долларов в 2024 году. Индекс сектора коммуникационных услуг S&P 500 вырос на 22% за последний год, а ориентированный на центры обработки данных REIT Equinix почти удвоил свою рыночную капитализацию с конца 2022 года. Акции Nvidia выросли почти на 700% за последние два года, превратив компанию в одну из самых дорогих на Земле.

И все же, в конечном счете, никто не знает, продолжит ли ИИ процветать. Некоторые аналитики Уолл-стрит начинают предсказывать конец этого безумия. Инвесторы начали сомневаться, приведут ли крупные расходы на Big Tech когда-нибудь к прибыли от ИИ, которую они представляли. Вероятно, самая большая угроза сотням миллиардов долларов, которые инвестируются в ИИ, заключается в том, что разработчики самых передовых моделей в мире и их поставщики стали так одержимы эффективностью.