Amazon SageMaker unterstützt jetzt die Bereitstellung großer Modelle durch konfigurierbare Volume-Größe und Timeout-Kontingente

Mit Amazon SageMaker können Kunden ML-Modelle bereitstellen, um für jeden Anwendungsfall Vorhersagen (auch Inferenz genannt) zu treffen. Sie können für die Echtzeit- und Asynchrone-Inferenz-Optionen von Amazon SageMaker jetzt große Modelle (bis zu 500 GB) bereitstellen, indem Sie die maximalen EBS-Volume-Größe und Timeout-Kontingente konfigurieren. Mit dieser Einführung können Kunden die vollständig verwalteten Echtzeit- und Asynchrone-Inferenz-Fähigkeiten von SageMaker nutzen, um große ML-Modelle, wie Varianten von GPT und OPT, bereitzustellen und zu verwalten.
Quelle: aws.amazon.com

Published by