亚马逊云科技陈晓建:构建端到端数据战略的三个核心

亚马逊云科技在2022 re:Invent全球大会上发布了涵盖底层基础架构、计算、数据库、数据分析、AI/ML、安全、行业应用等一系列新的服务及功能。
硬件设备 亚马逊
2023-01-12 07:17:31  |   作者:果青  |   来源:转载 TechWeb

亚马逊云科技陈晓建:构建端到端数据战略的三个核心

亚马逊云科技在2022 re:Invent全球大会上发布了涵盖底层基础架构、计算、数据库、数据分析、AI/ML、安全、行业应用等一系列新的服务及功能。
硬件设备 亚马逊
2023-01-12 07:17:31
作者:果青
来源:转载 TechWeb

亚马逊云科技在2022 re:Invent全球大会上发布了涵盖底层基础架构、计算、数据库、数据分析、AI/ML、安全、行业应用等一系列新的服务及功能。

“今年是亚马逊云科技第11年举办re:Invent。来自全球的5万多客户和合作伙伴参加了在拉斯维加斯举办的线下盛会,还有超过30万人线上参会。亚马逊云科技在会上发布了许多重磅新服务、功能和应用,来支持遍及全球各地、来自千行百业的客户进行不断的创新和重塑”,亚马逊云科技大中华区产品部总经理陈晓建近日在跟国内媒体分享时表示:“面临全球经济的不确定性,各种规模的客户都希望能进一步削减成本、增强业务的灵活性并加速创新。我们希望能通过技术的不断创新,让全球包括中国的客户能凌云驭势、重塑未来。”

20230112-5.jpg

分析人士预测,未来五年产生的数据量将会是数字时代开始以来的两倍多。如何管理海量数据、挖掘数据价值,对每个企业组织来说都是巨大的挑战。

在陈晓建看来,数据是企业业务决策流程的中心,是构建数字化转型的基石。随着数据规模和增长的不断加速,企业需要一整套完整的数据工具来应对海量的多样化数据;需要整合来自于不同部门、不同服务和不同应用中的所有数据,以获取更全面的数字洞察;需要通过数据治理保障人员和应用快速访问所需数据并同时确保数据安全;还需要改善发现和分享数据的方式以提升获取洞察的效率。

亚马逊云科技一直致力于建设一个云原生的数据战略,通过提供端到端的全面数据解决方案,帮助客户打造从数据的摄入,数据存储与查询,到数据分析,商业智能,再到人工智能与机器学习创新,并通过安全合规的方式进行集团内或公司之间的共享和输出,帮助客户更安全、更高效地挖掘数据价值。

陈晓建强调,亚马逊云科技在构建端到端数据战略时有三个核心:第一,要建立面向未来的云原生数据基础设施;第二,要实现高效、跨组织的数据一体化融合;第三,借助教育和工具,使数据普惠化。

其中,面向未来的云原生的数据基础设施应具备四方面能力:一是,应具备适用于任意工作负载和任何数据类型的工具;二是,能够持续优化以适应客户业务发展带来的更多数据和更大业务规模,并能够保持高性能;三是,面对客户日益复杂的业务逻辑能够提供尽可能多的工具,帮助用户在整个数据使用过程中降低门槛、降低复杂性,提升使用效率;四是,应该具备最高级别的可靠性。

围绕上述三个核心,亚马逊云科技不断完善产品和服务。目前,亚马逊云科技拥有最完整的数据库,包括关系数据库(如 Amazon Aurora)和 8 个专用数据库为客户的应用程序提供数据工作负载支持。亚马逊云科技在2022 re:Invent全球大会发布了全新的数据管理服务Amazon DataZone,助力客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理,同时提供更精细的控制工具,管理和治理数据访问权限,确保数据安全。企业中的各类人员都可以通过Amazon DataZone轻松访问整个组织的数据以提升企业的数据洞察力。

针对ETL(数据的提取、转换和加载过程),亚马逊云科技在本次大会上发布了两项全新的集成功能,帮助客户实现“Zero-ETL”(零ETL)。业务数据往往需要通过ETL才能进行分析从而提供洞察,但这一过程往往耗时且枯燥。现在,客户可以使用Amazon Redshift近乎实时地分析Amazon Aurora中的数据,无需在不同服务之间进行ETL。客户还可以使用亚马逊云科技的分析和机器学习服务在Amazon Redshift的数据上轻松运行 Apache Spark应用程序。

同时,亚马逊云科技还新推出五项数据库和分析服务全新功能,让客户能够更快、更轻松地管理和分析PB级数据。Amazon DocumentDB Elastic Clusters可将客户的文档工作负载扩展到支持每秒数百万次请求,并支持PB级数据存储; Amazon OpenSearch推出了Serverless无服务器功能,可帮助客户在无需配置、扩展或管理底层基础设施的情况下运行搜索和分析工作负载,这一更新也标志着亚马逊云科技数据分析服务的全面无服务器化;Amazon Athena for Apache Spark能让客户开始使用Apache Spark进行交互式分析的时间从数分钟缩短到一秒以内;Amazon Glue Data Quality可以跨数据湖和数据管道自动管理数据质量; Amazon Redshift现在支持跨多个亚马逊云科技可用区(AZ)的高可用配置。Amazon MSK和Amazon Redshift可以直接打通,数据同步从分钟级别提高到了秒级,极大地提升了实时性。

此外,亚马逊云科技在本次大会上推出了机器学习服务Amazon SageMaker的八项新功能以及Amazon QuickSight的五项全新功能。其中,新的 Amazon SageMaker 治理功能可以在整个机器学习生命周期中提供对模型性能的可见性; Amazon QuickSight 新功能可以支持业务人员直接用自然语言提问各类预测问题,并能够给出预测依据,大大降低了企业从数据中获取业务洞察的门槛。

同时,本次大会亚马逊云科技推出低代码机器学习:Amazon SageMaker Data Wrangler、Amazon SageMaker Canvas、Amazon SageMaker AutoPilot、Amazon SageMaker JumpStart,可以帮助使用者从数据准备到模型构建和开发,到训练和调整直到部署和运营管理,全生命周期的每个阶段轻松上手,快速进行业务需要的机器学习。

艾瑞咨询研究总监、SaaS/云服务产业研究部门负责人王成峰表示,亚马逊云科技re:Invent作为业界最值得关注的大会之一,继续保持其领先的产品视角和前沿的技术探索。此次大会有侧重于关注客户在“云上”的新需求,尤其是将作为云上核心生产要素的“数据”置于更重要的地位,通过Amazon DataZone、Zero ETL等新产品或新特性的发布,在数据集成、治理、安全等方面提供了面面俱到的产品和服务。