NVIDIA только что выпустила свои новейшие системы GB300 NVL72. Они могут обрабатывать в 50 раз больше работы на мегаватт электроэнергии по сравнению со старой платформой Hopper. Это означает, что затраты снижаются в 35 раз на каждый обработанный фрагмент информации.
Signal65 провела отдельное тестирование GB200 NVL72 и обнаружила, что она обрабатывает более чем в 10 раз больше информации на ватт, снижая затраты до одной десятой от прежних.
Улучшения продолжаются. Только обновления библиотеки TensorRT-LLM от NVIDIA обеспечили GB200 пятикратное повышение производительности всего за четыре месяца для задач, требующих мгновенных ответов. Команды, работающие над инструментами Dynamo, Mooncake и SGLang, повышают эффективность еще выше.
Эти инструменты ИИ-агента ломаются, если есть задержка или они не могут запомнить достаточно контекста. Компаниям нужно, чтобы они действительно работали в реальных бизнес-ситуациях, а не только в демонстрациях.
Инструменты искусственного интеллекта, которые пишут код и работают как цифровые помощники, теперь составляют почти половину всех поисковых запросов, связанных с ИИ, по сравнению с всего лишь 11% год назад.
Цифры взяты из отчета OpenRouter State of Inference и показывают, как быстро меняется эта область.
Этот внезапный скачок заставляет компании спешить создавать аппаратное обеспечение, которое сможет не отставать. Эти ИИ-помощники должны реагировать немедленно и запоминать контекст из целых программных проектов, что предъявляет серьезные требования к вычислительной мощности.
Взрыв рынка подстегивает борьбу технологических гигантов за доминирование
Вовлеченные деньги огромны. Рынок ИИ-агентов стоил 4,92 миллиарда $ в 2024 году. Оценки определяют его в 6,016 миллиарда $ на 2025 год, а затем раздувающимся до 44,97 миллиарда $ к 2035 году. Это рост на 22,28% каждый год в течение следующего десятилетия. Банки, больницы, магазины и фабрики — ранние последователи.
Компании внедряют этих агентов в системы управления клиентами, инструменты планирования и настройки безопасности, чтобы экономить деньги и делать больше. То, что началось как дополнительная технология, становится базовой инфраструктурой.
Как сообщает Cryptopolitan, Alibaba только что запустила Qwen3.5, ориентированную на рынок Китая, заявляя о снижении затрат на обработку на 60% по сравнению с предыдущим. Модель может смотреть на экраны и выполнять задачи на телефонах и компьютерах. Она идет лицом к лицу с приложением Doubao от ByteDance, и также ожидается обновление DeepSeek.
OpenAI наняла Питера Стайнбергера 15-го числа. Он создал OpenClaw, ИИ-агент с открытым исходным кодом. Генеральный директор Сэм Альтман сказал, что Стайнбергер будет руководить работой над агентами следующего поколения для личного использования и назвал его гением с отличными идеями о умных помощниках, которые могут выполнять полезные вещи.
Кадровый кризис, который никто не может решить
94% бизнес-лидеров говорят, что им не хватает навыков в области ИИ. К 2028 году 44% ожидают, что все еще будут иметь нехватку от 20 до 40%. Workera утверждает, что эти пробелы могут стоить мировой экономике 5,5 триллиона $ в 2026 году из-за задержек продуктов, проблем с качеством и потерянных продаж.
Прямо сейчас спрос на ИИ-таланты превышает предложение 3,2 к одному по всему миру. Работа в сфере ИИ платит на 67% больше, чем обычные позиции в области программного обеспечения. Тем не менее, 85% офисных работников изучают это в свое личное время, и 83% говорят, что в основном обучают себя сами, а не получают формальное обучение.
Когда компании покупают инструменты ИИ у специализированных поставщиков, они добиваются успеха в 67% случаев. Внутренние разработки работают только примерно в трети случаев.
Salesforce продемонстрировала рост агентов на 119% в начале 2025 года и превысила 500 миллионов $ в регулярных доходах от этих продуктов. Они добавили 6 000 корпоративных клиентов за три месяца.
Компании, вероятно, будут покупать решения вместо того, чтобы создавать их. Это указывает на концентрацию рынка вокруг нескольких крупных игроков, которые могут предоставить то, что действительно работает.
Источник: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


