我们使用机器学习技术将英文博客翻译为简体中文。您可以点击导航栏中的“中文(简体)”切换到英文版本。
拜耳在 亚马逊云科技 上为数据科学家创建安全的自助服务解决方案
本博客由拜耳跨部门数据科学平台首席产品负责人 斯特凡·施密茨 博士 和埃森哲高级技术中心的亚马逊云科技架构师 Maciej Wroblewski 撰写。
全球领先的生命科学组织
拜耳构建了一个跨职能的数据科学平台,为一系列
为数据科学家创建自助服务平台
作为业务遍及83个国家的全球最大的生命科学组织之一,拜耳的数据科学团队需要提高运营效率和优化成本。拜耳的集中式自助服务数据分析平台允许数据科学家访问一组精选的所需技术和IT功能,同时遵守企业合规和安全标准。
拜耳跨部门数据科学平台首席产品负责人斯特凡·施密茨博士说:“使用这个平台,团队不再需要重复为单个项目设置基本基础设施组件和服务所花费的工作和成本。”“没有必要一遍又一遍地重塑方向盘。”此外,数据科学家可以通过使用预配置的工具启动可自定义的实例,控制其模型的整个生命周期并管理计算密集型项目。
该平台基于 亚马逊云科技 构建,可使用 Amazon EC2 访问安全且可调整大小的计算容量。它在
该平台还使用
埃森哲高级技术中心的亚马逊云科技架构师Maciej Wroblewski说:“在与拜耳合作设计平台时,我们的首要任务是简化数据科学家执行的典型操作。” 埃森哲高级技术中心与拜耳合作设想、实施和支持该平台的开发。“借助这个平台,拜耳使其数据科学家能够专注于数据处理,而不是部署基础设施组件。”
拜耳将其计算资源托管在 遍布全球的三个
通过亚马逊 API Gateway 控制对单个模型的访问权限
随着平台规模和规模的扩大,拜耳的技术团队意识到,数据科学家正在通过缺乏一致的网址结构且无法很好地扩展到大量并行部署的API与大量的生产模型进行交互。施密茨说:“我们意识到,API部署的可扩展性和API的访问管理变得越来越重要。”“数据科学家需要对单个模型 API 的使用方式进行更多的管理和控制。”
然后,该团队开发了自助服务API管理服务,以满足数据科学家的需求。该平台使用
使用 Amazon API Gateway 中的自定义授权器功能,可以自定义基于身份的策略,控制谁可以访问特定模型的特定 API 端点。Amazon API Gateway 不仅可以授权传入的请求,还可以提取详细的记录信息,例如请求的模型、URL、HTTP 方法和用户信息。该平台集成了拜耳的企业安全标准,允许通过其Active Directory群组进行访问控制。专用的
该解决方案完全自动化了底层资源和服务的调配和配置。模型开发人员自行注册自己的 API 端点,以便可以调用它们进行推理。作为该过程的一部分,开发人员可以将其模型与由专门的策略管理员设计和维护的访问策略关联起来。Amazon EKS 命名空间和 IAM 策略可促进安全访问许多租户可以访问的 亚马逊云科技 账户中的模型和数据,从而使它们相互隔离。
Wroblewski说:“拜耳科学家拥有力量。”“他们有权创建、修改和删除所有API端点,而无需联系任何技术团队来维护平台。他们可以自己做。”
采用率增长和未来展望
尽管该平台已经在制药、消费者健康和赋能功能部门取得了巨大成功,但其利益相关者群体在多个领域仍在增长。例如,拜耳制药研究最近决定采用上面讨论的新的模型API管理平台功能来维护和管理其分析模型。拜耳制药公司机器学习研究组的研究科学家安德烈亚斯·波尔曼博士说:“这种设置简化了我们在内部部署模型API的方式,使拜耳的研究人员可以轻松使用它们,同时确保合规性。有了这个集中的数据科学平台,我们可以快速地从原型过渡到生产,并让我们专注于解决科学问题。例如,我们已经在使用它为我们的科学家提供内部开发的开源分子表征提取工具,该工具允许从分子微笑(简化分子输入行输入规范)字符串中提取 CDDD(连续和数据驱动的分子描述符)。拜耳通过统一和集中的平台在内部提供这些数据科学服务真是太好了。”
拜耳的跨部门数据科学平台将继续发展。2023 年路线图包括整合
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。