Najważniejsze punkty:
- Pamięć pozostaje jednym z kluczowych wąskich gardeł w obszarze AI, ale inwestowanie w ten obszar nie jest już prostą i oczywistą tezą inwestycyjną. Popyt związany z AI nadal wspiera dostawców pamięci, jednak rosnące koszty pamięci i przechowywania danych zaczynają odbijać się w całym łańcuchu wartości — od urządzeń konsumenckich po nakłady inwestycyjne hiperskalerów.
- „Podatek od AI” zaczyna być widoczny w elektronice konsumenckiej. Ostatnie podwyżki cen u Apple, Sony i Nintendo oraz w segmencie konsol Xbox pokazują, że presja kosztowa związana z pamięcią wykracza poza wyniki producentów półprzewodników i przekłada się na ceny sprzętu, jego dostępność dla konsumentów oraz tempo wymiany i aktualizacji urządzeń.
- Kolejna faza AI może premiować efektywność zamiast samej „pojemności”. Wraz ze wzrostem kosztów budowy i utrzymania systemów AI uwaga rynku prawdopodobnie przesunie się w stronę firm i technologii, które obniżają koszty wnioskowania (inferencji), usprawniają przepływ danych, zmniejszają zużycie energii i zapotrzebowanie na chłodzenie, lepiej wykorzystują możliwości oprogramowania oraz umożliwiają większy udział przetwarzania AI bezpośrednio na urządzeniach.
Pamięć była jedną z najsilniejszych sił napędowych w łańcuchu wartości AI.
To miało sens: obciążenia obliczeniowe AI wymagają większych zasobów pamięci o wysokiej przepustowości, DRAM i NAND, dysków SSD klasy enterprise oraz większej pojemności do przechowywania danych. Pamięć przestała być typowym cyklicznym komponentem półprzewodnikowym, stając się strategicznym ograniczeniem w rozbudowie infrastruktury AI.
Ten obraz jest już jednak powszechnie znany.
Ważniejsze pytanie brzmi: Kiedy wąskie gardło po stronie pamięci staje się problemem po stronie popytu dla reszty ekosystemu AI?
Pamięć nadal ma solidne, strukturalne wsparcie, ale oczekiwania wobec niej są bardzo wysokie. Kolejna faza dyskusji o AI może przesunąć akcent na efektywność — na firmy i technologie, które pozwalają osiągnąć więcej przy niższych nakładach inwestycyjnych, mniejszym zużyciu energii, niższym zapotrzebowaniu na pamięć i niższym koszcie wnioskowania.
Inwestowanie w pamięć wciąż wygląda dobrze, ale nie jest już grą na jedną stronę.
Dostawcy pamięci nadal mają po swojej stronie kilka wyraźnych, korzystnych czynników:
- Popyt na sztuczną inteligencję pozostaje silny
- Podaż jest nadal ograniczona
- Zdolność dostawców do kształtowania cen wzrosła
- Duzi klienci starają się zabezpieczyć dostawy
- Pamięć stała się krytyczną warstwą infrastruktury AI
Jednak stosunek ryzyka do zysku staje się bardziej zrównoważony.
Ryzyko nie polega na tym, że popyt na AI zniknie. Chodzi o to, że wyższe koszty pamięci zaczną zmieniać zachowania:
- Konsumenci opóźniają wymianę urządzeń
- Producenci sprzętu podnoszą ceny lub obniżają parametry techniczne
- Popyt na PC, smartfony i konsole staje się bardziej wrażliwy na cenę
- Firmy bardziej selektywnie podchodzą do uruchamianych zadań AI
- Hiperskalerzy uważniej planują nakłady inwestycyjne
- Firmy tworzące oprogramowanie AI odczuwają presję na marże, jeśli koszty obliczeń rosną szybciej niż przychody
W tym miejscu narracja o wąskim gardle staje się opowieścią o marżach.
Konsumenci zaczynają płacić „podatek od AI”
„Ścisk” na rynku pamięci na potrzeby AI nie przejawia się już wyłącznie w wynikach producentów półprzewodników — zaczyna się ujawniać również w cenach dla konsumentów.
Niedawne przykłady pokazują, że presja rozlewa się:
- Apple podniosło ceny wybranych modeli MacBooków i iPadów, wskazując na wyższe koszty pamięci i przechowywania danych;
- Microsoft ogłosił globalne podwyżki cen konsol Xbox od sierpnia, w tym wyższe ceny wariantów 512 GB i 1 TB, jednocześnie wycofując wariant 2 TB;
- Sony podniosło w tym roku ceny PlayStation 5; wśród głównych czynników presji wskazywano rosnące koszty układów pamięci;
- Nintendo ogłosiło korekty cen konsoli Switch 2 na głównych rynkach. Oficjalnie powodem były zmieniające się warunki rynkowe, a nie same koszty pamięci, jednak i tak wskazuje to na presję na opłacalność konsol.
Na metce nie zobaczymy napisu „niedobór pamięci spowodowany przez AI”, jednak odczujemy go w postaci:
- Wyższych cen urządzeń
- Mniejszej pojemności pamięci lub przestrzeni dyskowej w wersjach podstawowych
- Dłuższych cykli wymiany sprzętu
- Wycofywania modeli o wyższej specyfikacji
- Mniejszej przystępności cenowej w segmencie gier, komputerów i tabletów
To istotne, bo AI nie tylko tworzy nowy popyt — podnosi również koszt zaspokajania już istniejących potrzeb.
Jeśli koszty pamięci wzrosną zbyt mocno, klienci dostosują się. To nie przekreśla narracji o AI, ale sprawia, że kolejna faza będzie bardziej selektywna.
Hiperskalerzy stają przed trudniejszym testem zwrotu z inwestycji
Hiperskalerzy wciąż należą do najsilniejszych graczy w gospodarce AI. Mają skalę, solidne bilanse, dystrybucję chmurową i większą zdolność do zabezpieczania dostaw.
Nie są jednak odporni na inflację kosztów komponentów.
Coraz dobitniej brzmi pytanie: czy przychody z AI rosną wystarczająco szybko, by uzasadnić wydatki na infrastrukturę AI?
Wyższe koszty pamięci utrudniają tę układankę.
Możliwe odpowiedzi to m.in.:
- Wchłanianie wyższych kosztów i godzenie się na presję na marże
- Podnoszenie cen usług chmurowych i AI
- Priorytetyzacja zadań o wyższej stopie zwrotu
- Inwestowanie w układy projektowane na zamówienie
- Poprawa efektywności wnioskowania (inferencji)
- Ostrożniejsze fazowanie nakładów inwestycyjnych, gdy zwroty nie spełniają oczekiwań
Dlatego inwestowanie w AI przesuwa się z „pojemności za wszelką cenę” w stronę „zwrotu z kapitału w AI”.
Rynek zapewne pozostanie przychylny liderom AI, ale z większym naciskiem na monetyzację, efektywność i wolne przepływy pieniężne.
Efektywność staje się kolejnym kluczowym motywem w obszarze AI
Jeśli pamięć jest droga, pytanie brzmi nie tylko: kto ją dostarcza? Ważniejsze staje się pytanie: kto pomaga obniżyć koszt jej użycia?
Dlatego właśnie efektywność będzie centralnym tematem kolejnej fazy rozwoju AI. Poniższe wzmianki o spółkach to wyłącznie przykłady ilustrujące, gdzie w łańcuchu wartości mogą pojawiać się korzyści — nie są to rekomendacje inwestycyjne.
1. Efektywność obliczeń
Gdy środek ciężkości przesuwa się z trenowania modeli do ich uruchamiania, coraz istotniejszy staje się koszt pojedynczego zapytania. Uwaga przesuwa się z „dokładamy kolejne układy” na poprawę wydajności w przeliczeniu na dolara, wat i jednostkę pamięci.
Obszary warte obserwacji:
- Niestandardowe akceleratory AI projektowane na zamówienie
- Układy do wnioskowania
- Procesory o niskim poborze mocy
- Architektury chipletowe
- Zaawansowane pakowanie układów
- Narzędzia do projektowania układów półprzewodnikowych
Przykładowe spółki:
- Nvidia — nie tylko GPU, lecz także cały stos oprogramowania do optymalizacji wnioskowania, m.in. TensorRT i TensorRT-LLM
- Broadcom — akceleratory AI i układy ASIC tworzone dla dużych klientów chmurowych i firm AI
- AMD — akceleratory AI i procesory do AI PC; alternatywna platforma obliczeniowa dla klientów szukających większej podaży i niższych kosztów
- TSMC — zaawansowane procesy technologiczne i pakowanie, które umożliwiają budowę bardziej efektywnych chipów AI
Najważniejsze: Efektywność obliczeń może stać się równie ważna jak sama moc obliczeniowa.
2. Sieci i przepływ danych
Klastry AI mają sens tylko wtedy, gdy układy, pamięć i magazyny danych sprawnie się komunikują. Jeśli przesył danych jest wolny, drogie zasoby obliczeniowe stoją niewykorzystane.
Obszary warte obserwacji:
- przełączniki sieciowe o wysokiej przepustowości
- sieci optyczne
- Interkonektory dla układów AI
- retimery (układy do regeneracji sygnału)
- układy interfejsów i łączności
- optymalizacja sieci w centrach danych
Przykładowe spółki:
- Broadcom — przełączniki, łączność i układy projektowane na zamówienie
- Arista Networks — sieci Ethernet dla dużych klastrów AI
- Marvell — infrastruktura danych, łączność optyczna i układy projektowane na zamówienie
- Astera Labs — rozwiązania połączeniowe, które ograniczają wąskie gardła między procesorami, pamięcią i akceleratorami
Najważniejsze: W miarę skalowania systemów AI liczy się wykorzystanie zasobów co najmniej tak samo jak ich nominalna pojemność.
3. Zasilanie i chłodzenie
W AI coraz częściej ograniczeniami stają się moc i ciepło. Więcej GPU i więcej pamięci oznacza większy pobór prądu, większe zapotrzebowanie na chłodzenie i większą presję na infrastrukturę centrów danych.
Obszary warte obserwacji:
- chłodzenie cieczą
- zarządzanie energią
- aparatura elektryczna
- infrastruktura sieci elektrycznej
- systemy termiczne
- zasilanie awaryjne
Przykładowe spółki:
- Vertiv — zarządzanie ciepłem, systemy zasilania i infrastruktura chłodzenia cieczą dla centrów danych
- Schneider Electric — zasilanie, chłodzenie, zarządzanie energią i rozwiązania infrastrukturalne dla centrów danych
- Eaton — aparatura elektryczna i rozwiązania do zarządzania zasilaniem
- Siemens — sieci, elektryfikacja i automatyka powiązane z infrastrukturą centrów danych
Najważniejsze: Infrastruktura AI staje się tematem efektywności przemysłowo‑energetycznej, a nie tylko półprzewodników.
4. Optymalizacja oprogramowania
Najbardziej niedocenianą warstwą efektywności może być oprogramowanie.
Firmy potrzebują nie tylko większych modeli — potrzebują wdrożeń AI tańszych, mierzalnych i pod większą kontrolą. Wraz ze skalą użycia rośnie nacisk na ograniczanie marnowania tokenów (jednostek rozliczeniowych), lepsze kierowanie zadań do właściwych modeli, monitorowanie kosztów i wykazywanie zwrotu z inwestycji.
Obszary warte obserwacji:
- Kompresja modeli;
- Kwantyzacja;
- Optymalizacja wnioskowania;
- Trasowanie zadań;
- Obserwowalność (monitorowanie) AI;
- Zarządzanie danymi;
- Generowanie wspomagane wyszukiwaniem
- Koordynacja agentów.
Przykładowe spółki:
- Nvidia — TensorRT-LLM i pokrewne narzędzia pomagają optymalizować wnioskowanie na GPU Nvidii;
- Cloudflare — AI Gateway zapewnia buforowanie, limity zapytań, przełączanie na model zastępczy i wgląd w koszty u różnych dostawców AI;
- Datadog — obserwowalność LLM: monitorowanie opóźnień, zużycia tokenów, kosztów i wydajności;
- Microsoft — Azure AI i narzędzia korporacyjne pomagają zarządzać wykorzystaniem modeli i wdrożeniami; jednocześnie Microsoft pozostaje jednym z największych inwestorów w infrastrukturę AI;
- ServiceNow — automatyzacja procesów i agenty AI powiązane z mierzalną produktywnością, nie tylko z „mocą” modelu.
Najważniejsze: Adopcja AI będzie coraz bardziej zależała od kontroli kosztów i zwrotu z inwestycji, a nie tylko od parametrów modeli.
5. Brzegowa sztuczna inteligencja (Edge AI) i AI na urządzeniach
Jeśli każde zadanie AI trafia do chmury, krzywa kosztów staje się trudna do opanowania. Przeniesienie większej części wnioskowania na urządzenia może obniżyć koszty chmury, zmniejszyć opóźnienia i wspierać prywatność.
Tu liczy się selektywność: producenci urządzeń, tacy jak Dell, HP czy Lenovo, mogą z czasem skorzystać na cyklu AI PC, ale jako pierwsi odczuwają presję kosztów pamięci i komponentów. To nie są najczystsze ekspozycje na motyw efektywności.
Obszary warte obserwacji:
- Układy AI w smartfonach
- Procesory AI do komputerów PC
- Obliczenia o niskim poborze mocy
- Jednostki NPU (neural processing units)
- Wnioskowanie na urządzeniach
Przykładowe spółki:
- Apple — ścisła integracja układów scalonych, oprogramowania i AI na urządzeniach może z czasem zmniejszać zależność od wnioskowania w chmurze, choć w krótkim terminie wysokie koszty pamięci pozostają czynnikiem negatywnym
- Qualcomm — platformy Snapdragon i NPU bezpośrednio związane z przetwarzaniem AI na urządzeniach
- Arm — energooszczędna architektura dla urządzeń mobilnych i brzegowych oraz wbudowanych systemów AI
- AMD — procesory do AI PC i lokalnego wnioskowania; powodzenie zależy od adopcji praktycznych zastosowań AI w komputerach PC
Najważniejsze: Brzegowa sztuczna inteligencja zyskuje na wartości, gdy AI w chmurze drożeje.
Gdzie warto zachować ostrożność
Temat sztucznej inteligencji się nie kończy, on dojrzewa i staje się bardziej zdyscyplinowany.
Dostawcy pamięci pozostają ważni, ale to już nie jest wczesna faza tej historii. Nie można też w ciemno zakładać, że ceny będą rosnąć w nieskończoność bez reakcji po stronie popytu.
Obszary, w których ostrożność może być uzasadniona:
- Spółki pamięciowe, których wyceny już zakładają trwałą siłę cenową, m.in. Micron, SK Hynix, Samsung Electronics, Western Digital i SanDisk
- Firmy produkujące sprzęt konsumencki borykają się z presją związaną z kosztami komponentów, w tym Apple, Sony, Nintendo, HP, Dell Technologies i Lenovo
- Producenci elektroniki i urządzeń niskomarżowych, w których podwyżki cen szybko hamują popyt — zwłaszcza w komputerach PC, smartfonach i sprzęcie do gier
- Hiperskalerzy, u których nakłady na AI rosną szybciej niż postępuje monetyzacja, m.in. Microsoft, Alphabet, Amazon, Meta i Oracle
- Spółki z obszaru oprogramowania i aplikacji AI, którym rosną koszty mocy obliczeniowej, ale nie jest jasne, w jakim stopniu mogą te koszty przerzucić na klientów — szczególnie gdy funkcje AI są „dorzucane” do istniejących produktów zamiast być osobno monetyzowane
- Wysoko wyceniane spółki z obszaru infrastruktury AI, w przypadku których oczekiwania mogą już zakładać bezproblemową realizację planów, silną pozycję cenową i brak istotnego spadku popytu.
Użyteczny podział nie przebiega już między „ekspozycją na AI” a jej brakiem.
Lepsze ramy myślenia to:
- Kto korzysta na wąskim gardle;
- Kto ponosi koszt tego wąskiego gardła;
- Kto pomaga obniżyć ten koszt;
- Kto potrafi zmonetyzować AI na tyle szybko, by uzasadnić wydatki.
To rozróżnienie jest ważne, bo kolejna faza AI może mniej dotyczyć niedoboru, a bardziej — produktywności.
Podsumowując
Dostawcy pamięci byli pierwszymi beneficjentami wąskiego gardła w obszarze AI.
Następną fazę może zdefiniować efektywność.
„Zagranie na AI” przesuwa się z narracji o niedoborze ku narracji o produktywności. Kolejny etap nagrodzi nie tylko pojemność. Coraz większy nacisk będzie kładziony na technologie, które czynią AI tańszą w utrzymaniu, łatwiejszą do skalowania i szybciej monetyzowaną.
Najważniejszy wniosek dla inwestorów:
Ekspozycja na AI musi być bardziej selektywna. Nastawienie powinno w mniejszym stopniu polegać na pogoni za „wąskim gardłem”, a bardziej na identyfikowaniu technologii, które realnie obniżają koszt tego wąskiego gardła.