Amazon mengumumkan ketersediaan umum Amazon SageMaker Lakehouse, sebuah kemampuan yang menyatukan data di seluruh data lake Amazon Simple Storage Service (Amazon S3) dan gudang data Amazon Redshift, yang membantu Anda membangun analitik canggih dan aplikasi kecerdasan buatan dan pembelajaran mesin (AI/ML) pada satu salinan data. SageMaker Lakehouse adalah bagian dari generasi Amazon SageMaker berikutnya, sebuah platform terpadu untuk data, analitik, dan AI, yang menyatukan kemampuan pembelajaran mesin dan analitik AWS yang diadopsi secara luas dan memberikan pengalaman terintegrasi untuk analitik dan AI.
Pelanggan ingin melakukan lebih banyak hal dengan data. Untuk bergerak lebih cepat dengan perjalanan analitik mereka, mereka memilih penyimpanan dan basis data yang tepat untuk menyimpan data mereka. Data tersebar di seluruh data lake, gudang data, dan aplikasi yang berbeda, menciptakan silo data yang menyulitkan akses dan pemanfaatan. Fragmentasi ini menyebabkan salinan data duplikat dan alur data yang kompleks, yang pada gilirannya meningkatkan biaya bagi organisasi. Selain itu, pelanggan dibatasi untuk menggunakan mesin dan alat kueri tertentu, karena cara dan tempat data disimpan membatasi pilihan mereka. Pembatasan ini menghambat kemampuan mereka untuk bekerja dengan data seperti yang mereka inginkan. Terakhir, akses data yang tidak konsisten membuat pelanggan kesulitan untuk membuat keputusan bisnis yang terinformasi.
SageMaker Lakehouse mengatasi tantangan ini dengan membantu Anda menyatukan data di seluruh data lake Amazon S3 dan gudang data Amazon Redshift. Ini menawarkan Anda fleksibilitas untuk mengakses dan membuat kueri data di tempat dengan semua mesin dan alat yang kompatibel dengan Apache Iceberg. Dengan SageMaker Lakehouse, Anda dapat menentukan izin terperinci secara terpusat dan memberlakukannya di beberapa layanan AWS, menyederhanakan berbagi data dan kolaborasi. Membawa data ke SageMaker Lakehouse Anda mudah. Selain mengakses data secara mulus dari data lake dan gudang data Anda yang ada, Anda dapat menggunakan zero-ETL dari basis data operasional seperti Amazon Aurora, Amazon RDS untuk MySQL, Amazon DynamoDB, serta aplikasi seperti Salesforce dan SAP. SageMaker Lakehouse cocok dengan lingkungan Anda yang ada.
Saya sangat terkesan dengan integrasi SageMaker Lakehouse dengan layanan AWS lainnya. Integrasi ini sangat menyederhanakan manajemen dan analitik data, membuatnya jauh lebih mudah dan lebih efisien. Saya yakin layanan ini akan sangat berharga bagi perusahaan yang ingin meningkatkan kemampuan analitik dan AI mereka.