SageMaker AI pridáva cache kontajnerov, aby zrýchlil škálovanie inferencie
AWS predstavil ukladanie kontajnerových obrazov do cache pre SageMaker AI inference. Cieľom je skrátiť škálovanie modelových endpointov a obmedziť studené štarty pri náraste prevádzky.