本次分享将会介绍生成式 AI 应用架构面临的挑战与优化方案,并演示如何使用 Amazon Bedrock 与 Amazon SageMaker Large Model Inference 镜像构建端到端的生成式应用。
演讲提纲:
- 大模型推理面临的挑战
- 通过 Amazon SageMaker 和 Amazon Bedrock 降低大模型推理复杂度
- 构建端到端的生成式 AI 应用与 Demo 演示
听众收益:
- 了解如何通过 Amazon Bedrock 快速构建云原生生成式 AI 应用
- 了解如何优化大模型推理延迟与吞吐
评论