Malize's blog Malize's blog
首页
  • 设计模式

    • 设计模式总览
    • 工作中用到的设计模式
  • 并发编程

    • 死锁
  • Git 工具

    • Git 笔记总览
    • Git 使用手册
    • Git 修改分支名
  • 技术文档

    • Docker 核心命令大全
    • Markdown 使用教程
    • npm 常用命令
    • yaml 语言教程
    • Nodejs 递归读文件
  • 构造问答系统

    • 项目背景
    • 构建答疑机器人
    • 扩展知识范围
    • 优化提示词
    • 自动化评测
    • 优化 RAG 应用
  • 构建 Agent 系统

    • Agent 基础与工具调用
    • 规划与执行
    • 多 Agent 团队协作
    • Memory 积累经验
    • Skill 可复用流程
    • Qwen Code 实践
  • 交付上线

    • 走向生产环境
    • 模型蒸馏
    • 部署模型
    • 生产实践
    • 安全合规
  • 规范 & 实践

    • 代码规范
    • sharding-jdbc
    • CIM 半导体行业
    • HTML 常用 meta
    • CSS 技巧收藏
  • GitHub & 博客

    • GitHub 高级搜索技巧
    • GitHub Actions 自动部署
    • 博客搭建 - 百度收录
  • 优质网站
  • 前端库推荐
  • 成长学习

    • 学习方法
    • 敏捷开发实战
    • 提示词工程
  • 生活

    • 实用技巧
    • 心情杂货
    • 梦境与灵感
  • 索引

    • 分类
    • 标签
    • 按年归档
GitHub (opens new window)

Malize

持续学习,持续成长
首页
  • 设计模式

    • 设计模式总览
    • 工作中用到的设计模式
  • 并发编程

    • 死锁
  • Git 工具

    • Git 笔记总览
    • Git 使用手册
    • Git 修改分支名
  • 技术文档

    • Docker 核心命令大全
    • Markdown 使用教程
    • npm 常用命令
    • yaml 语言教程
    • Nodejs 递归读文件
  • 构造问答系统

    • 项目背景
    • 构建答疑机器人
    • 扩展知识范围
    • 优化提示词
    • 自动化评测
    • 优化 RAG 应用
  • 构建 Agent 系统

    • Agent 基础与工具调用
    • 规划与执行
    • 多 Agent 团队协作
    • Memory 积累经验
    • Skill 可复用流程
    • Qwen Code 实践
  • 交付上线

    • 走向生产环境
    • 模型蒸馏
    • 部署模型
    • 生产实践
    • 安全合规
  • 规范 & 实践

    • 代码规范
    • sharding-jdbc
    • CIM 半导体行业
    • HTML 常用 meta
    • CSS 技巧收藏
  • GitHub & 博客

    • GitHub 高级搜索技巧
    • GitHub Actions 自动部署
    • 博客搭建 - 百度收录
  • 优质网站
  • 前端库推荐
  • 成长学习

    • 学习方法
    • 敏捷开发实战
    • 提示词工程
  • 生活

    • 实用技巧
    • 心情杂货
    • 梦境与灵感
  • 索引

    • 分类
    • 标签
    • 按年归档
GitHub (opens new window)
  • 课程准备

  • 构造问答系统

  • 构建Agent系统

  • 交付上线

    • 走向生产环境
    • 用蒸馏让小模型掌握专业能力
    • 部署模型
    • 大模型应用生产实践
    • 大模型应用安全合规
  • 总结与展望

  • 大模型
  • 交付上线
malize
2026-03-01

走向生产环境

# 4.0 走向生产环境

经过前几个阶段的打磨,你的AI系统已经在开发环境中运行得相当稳定了。评测数据持续向好,Harness Engineering让各组件协同工作,团队对这套系统充满信心。

123

公司领导看到了成果,决定让这套系统正式上线服务全公司。但从"在你的电脑上跑得通"到"全公司每天都在用",中间还隔着几座大山。

成本:每次调用大模型API都要花钱。100个人同时使用,每月的Token费用是多少?能不能通过微调一个更小的模型来降低成本、提升速度?

123

部署:系统只在你的笔记本电脑上跑。IT部门问你——怎么部署到服务器上?怎么保证高可用?怎么监控运行状态?

123

安全合规:安全团队也来了——用户输入会不会泄露敏感信息?模型会不会输出不当内容?系统是否符合行业合规要求?

123

接下来,你将逐一解决这些问题,让系统从开发环境走进真实的生产环境。

本阶段课时:

课时 标题 说明
4.1 用蒸馏让小模型掌握专业能力 模型蒸馏实战
4.2 部署模型 模型部署与推理服务
4.3 大模型应用生产实践 生产环境最佳实践
4.4 大模型应用安全合规 安全防护与合规要求
编辑 (opens new window)
#大模型#ACP认证#阿里云
Qwen Code 实践
用蒸馏让小模型掌握专业能力

← Qwen Code 实践 用蒸馏让小模型掌握专业能力→

最近更新
01
Docker 核心命令大全
07-04
02
CIM半导体行业业务流程详解 原创
07-04
03
死锁 原创
04-15
更多文章>
Theme by Vdoing | Copyright © 2023-2026 Malize | GitHub | 桂ICP备2024034950号 | 桂公网安备45142202000030
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式