Amazon SageMaker unterstützt jetzt Amazon FSx for Lustre und Amazon EFS für ein schnelleres und einfacheres Modelltraining

Amazon SageMaker unterstützt jetzt die Dateisysteme Amazon Elastic File System (Amazon EFS) und Amazon FSx for Lustre und verwendet sie als Datenquelle für das Training von Machine Learning-Modellen in SageMaker. Amazon FSx for Lustre ist ein hochleistungsfähiges Dateisystem, das für Workloads wie Machine Learning, Analysen und High Performance Computing optimiert ist. Amazon EFS ist ein einfaches, skalierbares und elastisches Dateisystem für Linux-basierte Workloads zur Verwendung mit AWS Cloud-Services und standortbasierten Ressourcen. Der Support dieser Dateisysteme beschleunigt und vereinfacht den Einsatz von Amazon SageMaker, um Modelle mithilfe von Datensätzen zu trainieren. Die Datenquelle des Dateisystems reduziert die Anlaufzeit, indem sie den Schritt des Datendownloads abschafft und die zahlreichen Vorteile bzgl. Performance und Durchsatz des Dateisystems zur schnelleren Ausführung des Trainingsjobs nutzt.
Quelle: aws.amazon.com

AWS Systems Manager Parameter Store stellt Intelligent-Tiering zur Aktivierung der automatischen Auswahl des Parameterkontingents vor

Heute stellte AWS Systems Manager Parameter Store das Intelligent-Tiering zur Aktivierung der automatischen Auswahl des Parameterkontingents vor. Wenn Sie unbekannte oder sich ändernde Muster für die Parameteranzahl, die Wertegröße oder die Parameterrichtlinien haben, können Sie die Einstellung für das Intelligent-Tiering verwenden, damit Parameter Store das Kontingent auf der Standard- oder Advanced-Ebene für Sie auswählt. Diese Auswahl basiert auf der Erstellungs- oder Aktualisierungsanforderung und erübrigt die Notwendigkeit, den Anwendungscode zu ändern.  
Quelle: aws.amazon.com

Amazon ElastiCache unterstützt jetzt bis zu 50 Zeichen im Clusternamen

Mit Amazon ElastiCache können Sie Ihren Clustern jetzt einen Namen mit bis zu 50 Zeichen für CacheCluster und bis zu 40 Zeichen für Replikationsgruppen geben. Durch Aufheben der vorherigen Beschränkung auf 20 Zeichen können Sie längere Namen verwenden, die für Ihre Namensstandards eindeutig sind. Der Clustername muss alphanumerische Zeichen oder Bindestriche enthalten, sollte mit einem Buchstaben beginnen und darf nicht mit einem Bindestrich enden oder zwei aufeinanderfolgende Bindestriche enthalten.
Diese Funktion ist in allen AWS-Regionen verfügbar. Melden Sie sich zum Einstieg bei derAWS Managementkonsole an.
Quelle: aws.amazon.com

Amazon CloudFront weitet Präsenz im Mittleren Osten mit einem ersten Edge-Standort in Bahrain aus

Details: Amazon CloudFront kündigt seinen ersten Edge-Standort in Manama, Bahrain an. Mit diesem neuen Edge-Standort verbessern sich die Latenzzeiten für Anwender in Bahrain jetzt um bis zu 40 %, wenn diese über CloudFront auf Inhalte zugreifen. CloudFront hat jetzt 189 Präsenzpunkte in 71 Städten und in 32 Ländern.
Eine vollständige Liste der weltweiten Infrastruktur von CloudFront finden Sie unter CloudFront – Funktionen.
Quelle: aws.amazon.com

Die Amazon EMR-Version 5.26.0 bietet eine um bis zu 16 Mal höhere Spark-Performance

Mit der EMR-Version 5.26.0 profitieren Spark-Nutzer von allen neuen Performance-Verbesserungen, die bei den EMR-Versionen 5.24.0 und 5.25.0 eingeführt wurden – ohne dafür Konfigurationen oder Codes aktualisieren zu müssen. Die folgenden Optimierungen werden standardmäßig in der Version 5.26.0 aktiviert:

Dynamisches Partition Pruning – Ermöglicht es Spark, relevante Partitionen während der Laufzeit abzuleiten. So werden Zeit und Datenverarbeitungsressourcen gespart, da weniger Daten aus dem Speicher ausgelesen werden müssen und die Anzahl der zu verarbeitenden Datensätze reduziert wird.
DISTINCT before INTERSECT – Verhindert doppelte Werte in jeder Eingabesammlung bereits vor dem Berechnen der Schnittmenge. Dadurch können die Menge der zwischen den Hosts gemischten Daten reduziert und die Performance erhöht werden.
Glätten skalarer Unterabfragen – Hilfreich in Situationen, in denen mehrere unterschiedliche Bedingungen auf Zeilen einer einzigen Tabelle angewendet werden müssen, sodass die Tabelle nicht für jede Bedingung einzeln ausgelesen werden muss.
Optimierte Join-Neuanordnung – Ordnet Joins dynamisch neu an. So können kleinere Joins mit Filtern zuerst ausgeführt werden, wodurch sich die für größere nachfolgende Joins erforderliche Verarbeitung reduziert.
Bloomfilter für Joins – Filtert Tabellenverknüpfungen dynamisch, sodass anschließend nur relevante Zeilen enthalten sind. Dadurch wird die Menge der von Spark verarbeiteten Daten verringert, wodurch sich die Laufzeit-Performance der Abfrage verbessert.

Weitere Informationen zu diesen Optimierungen finden Sie in der Dokumentation zur Optimierung der Spark-Performance und in den Versionshinweisen zu EMR 5.26.0. Auch in EMR 5.26.0 enthalten ist eine Beta-Integration mit AWS Lake Formation und neuen Versionen von Apache HBase 1.4.10 sowie Apache Phoenix 4.14.2. Weitere Informationen zur Integration finden Sie unter Integrieren von Amazon EMR mit AWS Lake Formation (Beta). Amazon EMR Version 5.26.0 ist nun in allen Regionen, in denen Amazon EMR unterstützt wird, verfügbar.
Die Integration zwischen AWS Lake Formation und Amazon EMR liegt als Betaversion vor und ist in den Regionen USA Ost (Nord-Virginia) und USA West (Oregon) erhältlich. Bleiben Sie bezüglich der neuesten EMR-Versionen auf dem neuesten Stand, indem Sie den Feed für EMR-Versionshinweise abonnieren. Verknüpfen Sie die Feed-URL über das Symbol oben im EMR Release Guide direkt mit Ihrem bevorzugten Feed-Reader.
Quelle: aws.amazon.com