课程简介
本课程是基于金融行业信创技术实践和业务应用场景,结合当前企业级应用场景进行综合性课程设计。从专业知识,专业技能,通用技能多维度全面培养信创技术人才的的综合能力。
目标收益
培训对象
课程大纲
1.数据库部分 TDSQL、达梦数据库优缺点对比 |
集群架构设计 高可用性:分布式架构,数据分散存储,容错性强 高性能:垂直切分、水平切分、分布式索引等优化技术 强一致性:满足金融级需求 扩展性:支持水平扩展,灵活增加节点 复杂业务场景:OLTP和OLAP 国密算法以及三权分立权限模型 特殊场景性能:HTAP能力等 数据库资源管理和多租户 智能化管理平台,降低运维成本 弹性伸缩和负载均衡 |
TDSQL、达梦数据库体系架构 |
体系架构 组件概述 负载均衡策略 内存管理 数据库部署 环境要求 硬件要求 软件要求 内核参数配置 TDSQL、达梦系统表解读 TDSQL、达梦数据库参数解读 TDSQL、达梦数据库扩展特性(扩展功能、扩展接口)以及案例实践 |
TDSQL、达梦数据库执行计划解读 |
优化器实现 多表连接的执行计划、适用场景与优劣势 嵌套循环 合并连接 哈希连接 SQL调优方法论-执行计划深度分析 从案例中辨别低效执行计划 索引技术:应用场景以及对业务数据查询的影响 索引碎片导致执行计划问题分析和解决 锁的实现方式 理解SQL的执行过程与性能瓶颈 |
优化实践(实操,主要针对国产化数据后,业务使用如何避坑) |
实际案例讲解 分布式兼容与限制 分布式表连接 分布式事务 部署服务器需要注意的事项总结 最佳实践 Explian SQL执行计划相关的成本因子 Trace信息 分布式更新操作原理 跨节点分布式查询优化 逻辑优化、条件下推、隔离 引擎如何优雅处理海量SQL逻辑 分布式事务实现 优化实践 数据库优化方法论 全链路性能调优实战 业务模型优化 先整体再局部 先解阻塞性问题 热点SQL优化 慢SQL优化 减少数据访问次数(减少磁盘访问) 返回更少数据(减少网络传输或磁盘访问) 减少交互次数(减少网络传输) 减少服务器CPU开销 利用更多资源(增加资源) 联接顺序 索引回表 数据表优化 核心数据表设计 数据分布策略 分库分表调优 数据均衡设计之初 数据表片键设计 多表连接查询优化 表膨胀优化实践 字段类型设计 对表逻辑更新 添加创建和修改时间列 如何查找慢查询:为什么会对业务造成危害 优化大表总要性:多大是最优的 为什么不要使用大字段类型 为什么要限制DML操作的数据大小 并发控制和锁的实现方式 理解分布式数据库并发机制 隔离级别对分布式数据库影响 减少锁的竞争,优化事务的粒度 乐观锁实现策略(那些场景使用) 生产场景监控问题定位 生产环境慢、测试环境快,如何定位 |
Oracle、MySQL、DB2数据库迁移TDSQL、达梦数据库实战 |
Oracle迁移TDSQL、达梦迁移实战-主要内容:数据库、用户移植 Oracle 数据迁移 应用程序移植 关键移植步骤 确定移植目标 评估移植任务 数据库、用户迁移 数据迁移 迁移前准备 在线迁移 源端数据库备份 存量数据迁移 启动迁移工具完成数据追平 多次迁移 应用代码迁移 (开发框架、编程接口) 服务器应用代码迁移 客户端应用代码迁移 ODBC 移植 Oracle OCI 应用程序 其它应用框架 测试与调试移植系统 功能测试和排错 性能测试和调优 |
案例实践:程序模拟转账业务场景和数据库设计(基于金融账务系统模拟业务转账测试(Java代码+数据库(TDSQL、达梦))实操演示) |
数据库实践案例 需求分析与规划(需求收集/风险评估) 测试设计(测试工具/准备数据) 初步测试(功能验证/性能初步评估) 分析与优化(问题分析/优化方案) 再次测试(用户体验) 持续监控与维护(性能健康/定期检查) 数据库异常诊断(慢查询、并发、锁、阻塞等) 结合要点 表设计(分表依据) 锁设计(乐观锁/悲观锁) 事物设计(如何控制事物大小) 索引设计(最佳设计原则) 连接池设计(使用连接池要注意事项) SQL优化(小表变大表/改写) 服务器性能(CPU/IO/内存/NUMA) 网络性能 参数配置 监控 关键问题 数据库性能分析问题 SQL影响:慢查询和慢查询收集工具 SQL事务监控 SQL阻塞监控 CPU抖动监控 通过慢日志或监控平台获取某一个时刻SQL 业务并发访问问题 业务压力突增全链路监控 界定每个部分是否有问题 定位问题所在 性能问题:小数据量下性能良好,但在大数据量下性能急剧下降 基准测试:在小数据量下进行基准测试,记录性能指标。 压力测试:使用工具如 JMeter、LoadRunner 进行压力测试,模拟大数据量和高并发场景。 长时间测试:进行长时间的稳定性测试,观察系统在长时间高负载下的表现。 并发问题:在单用户或少量用户情况下表现良好,但在多用户并发访问时出现死锁、数据不一致等问题 并发测试:使用工具模拟多用户并发访问,观察系统的响应时间和错误率。 事务测试:特别关注涉及多个事务的操作,确保事务的隔离性和一致性。 数据一致性问题:数据在不同模块之间不一致,尤其是在分布式系统中。 数据校验:在不同模块之间进行数据校验,确保数据的一致性。 日志分析:分析系统日志,查找数据不一致的原因。 事务管理:确保事务的正确管理和回滚机制。 异常处理问题:异常处理不当,导致系统崩溃或数据丢失。 异常测试:模拟各种异常情况,如网络中断、数据库连接失败等。 日志记录:确保所有异常都被记录下来,便于后续分析。 恢复测试:测试系统的恢复机制,确保系统在异常后能够恢复正常运行。 资源泄漏问题:内存泄漏、文件句柄泄漏等。 内存分析:使用工具如Valgrind、VisualVM 进行内存分析。 文件句柄检查:检查系统中打开的文件句柄数量,确保没有泄漏。 性能监控:持续监控系统的资源使用情况,及时发现异常。 日志和监控问题:日志记录不完整,监控机制不健全 日志审计:定期审计日志文件,确保日志记录的完整性和准确性。 监控工具:部署性能监控工具,持续监控系统的运行状态。 报警机制:设置合理的报警阈值,及时发现和处理异常。 分布式事务处理能力 分布式存储能力 分布式事务能力 数据可靠性 数据分片操作 服务高可用 水平扩展能力 系统层面 针对ARM服务器中NUMA和JDK版本结合优化 |
2.业务上云 业务迁移上云准备 |
业务上云的整体评估/调研/可行性分析(一云多芯实践(鲲鹏、海光等)) 迁移上云的规划设计 稳态业务 敏态业务 依据业务形态选择容器平台还是CVK虚拟机平台 技术规划 企业级容器云、IaaS平台 重点关注:Kubermetes、容器网络、存储、集群、负载均衡、虚拟化、分布式存储等 创新云原生应用开发 重点关注:开发管理、Spring Cloud/Service Mesh等技术栈、开源技术栈等 基于云原生架构快速迭代的设计方法 微服务是云原生落地的重要技术支撑手段 引入微服务架构的优缺点分析 现有应用上云: 重点关注:应用容器化、业务分析、拆分、割接、回滚 现有应用向云原生迁移的具体路线 单体应用 模块拆分 无状态化 微服务化 应用上云状态的四象限 第一象限:传统业务,在改造之前,架构以传统ESB总线/单点应用为主 第二象限:微服务经过改造,运行在虚拟机环境上,但资源调度、快速响应的存在问题 第三象限:评估是否可以通过一次重新部署快速构建完成容器化\虚拟化改造,使用云原生容器\虚拟化带来的自动化管理、运维 第四象限:全面使用云原生架构重构应用,提升敏捷性、灵活性和可移植性,实现业务自动化运维 评估迁移优先级 评估迁移方式:直接迁移、局部调整、深度改造、整体重构 多云下的应用管理 重点关注:多集群管理、双活容灾、兼容性适配 如何充分利用容器特性屏蔽底层技术栈差异 虚拟化、容器化改造具体步骤 |
业务迁移上云实施 |
迁移阶段要素 迁移设计 应用改造设计 应用代码迁移 数据、接口和依赖项迁移 代码改造 执行的配置代码更改 设计部署流程(CD) 执行单元测试,验证程序 制定验收测试计划及方案 确认总体迁移时间表 测试和认证 执行验收测试(根据需要) 集成测试 回归测试 UAT测试 性能测试 接口测试 OTA测试 自动化部署(CD)测试 计划切换 提交上线请求 切换和总结 获得上线批准 部署执行(上线) 线上环境验证验证 执行迁移后审查以收集经验教训 释放原始资源 |
业务上云后管理 |
运维管理关键要素 如何组织交付IT服务 如何执行IT 如何保证长期一致的服务质量? 如何保证有关IT服务有效支持业务需求? 责任如何分工? 如何衡量IT服务质量? 服务交付过程中我们如何选择合适的技术以及工具? 变更及退出 风险、BUG、漏洞管理 |
实践案例:商业银行私有云上云实践(基于虚拟化、容器以及微服务改造) |
分布式架构转型实践 整体设计 网络架构 和现有网络的集成 IP 方案和地址 云的虚拟网路技术 安全架构 认证 风险管理 审计管理 合规性管理 资产管理 日志管理 监管 支付管理 成本管理 资产管理 内审需求 架构标准 SLA/SLO 采购管理 数据管理、中间件 RPO/RTO 保留周期 副本管理 存储优化 消息队列 数据库 缓存 监控运维 通知/警告 应用层监控 监控阈值 迁移阶段要素 迁移设计 应用改造设计 应用代码迁移 数据、接口和依赖项迁移 代码改造 执行的配置代码更改 设计部署流程(CD) 执行单元测试,验证程序 制定验收测试计划及方案 确认总体迁移时间表 测试和认证 执行验收测试(根据需要) 集成测试 回归测试 UAT测试 性能测试 接口测试 OTA测试 自动化部署(CD)测试 计划切换 提交上线请求 切换和总结 获得上线批准 部署执行(上线) 线上环境验证验证 执行迁移后审查以收集经验教训 释放原始资源 |
整体业务连续性建设和管理方法以及应用详解 |
业务连续性管理概述 制定灾难恢复规划的目的 进行灾难恢复规划的主要步骤 项目的组织结构及各部门的职责 计划的技术要求 制定计划的方法 风险分析及业务影响分析 灾难恢复策略的制定 制定详细的恢复流程 编制计划 计划的测试、培训和演练 灾难时期的危机沟通 计划的贯彻实施及其维护和更新 灾难恢复计划的启动执行 |
业务连续性技术架构规划(深度剖析网络、存储、服务器、数据库、缓存、中间件、消息队列、web部署、负载均衡、域名解析) |
如何规划整体架构建设?灾备需求分析及规则 应用架构规划 业务同城双活--数据库单写(多读) 业务异地灾备-数据库单写(多读) 业务两地三中心部署-数据库多活(单写,多读) 业务异地多活(单元元改造)(数据库多写多读) 网络安全架构规划 数据中心多站点选择 基于全局DNS解析服务的双活建设 内网业务容灾/多活方案 外联业务容灾方案 计算存储架构规划 从IT架构看传统两地三中心 核心双活技术存储组网 两地三中心方案 |
数据库架构规划(针对集中式/分布式/缓存/文档等) |
数据库同城双活架构设计 数据库异地灾备架构设计 数据库两地三中心架构设计 业务单元化 数据库异地多活架构设计 数据库和缓存数据一致性 消息中间件一致性保障 |
云平台架构规划 |
云业务面临挑战 云主备容灾方案 多云模式建设 一云多芯架构 异构计算架构 |
分布式存储/数据库应用 |
国产分布式存储/数据库介绍 分布式存储/数据库实践建设标准 容量评估 |
实践案例 |
上述业务实践内容 概要设计(业务架构设计、分布式应用架构设计、分布式技术架构设计) 平台设计(应用计算虚拟化资源池建设方案、数据库/中间件计算虚拟化资源池建设方案等) 数据库设计(数据架构设计、数据库集成) 业务迁移上云(业务规划、上云优先级确定、技术规划、上云方案制定、方案设计(应用架构设计<接入层、应用层 、数据层>、数据架构设计、技术架构设计、存储设计、单元化设计、安全架构设计、灾备管理设计)) 实施方案规划(业务模块梳理,测试与演练、全链路压测、系统割接等) 低延迟方案设计 |
中间件认知讲解 |
中间件对分布式架构体系重要性 有哪些类型的中间件 同类型中间件如何进行选型 |
宝兰德、东方通、Nginx、消息队列 |
技术选型:如何根据应用场景选择合适的消息中间件 中间件高性能设计 中间件优化实践 排查消息发送超时故障 排查消息消费积压问题 运维千万级/亿级消息集群 |
技术解析、最佳实践和高级使用 |
中间件对分布式架构体系重要性 有哪些类型的中间件 同类型中间件如何进行选型 应用服务器软件 消息队列平台服务软件 分布式缓存数据库软件 分布式交易中间件软件 消息中间件 如何对接行内现有监控系统 分析jvm 搭建负载均衡 需要注意的地方,通过案例讲解商用和XC对比 技术选型:如何根据应用场景选择合适的消息中间件 中间件高性能设计 中间件优化实践 排查消息发送超时故障 排查消息消费积压问题 运维千万级/亿级消息集群 如何在生产环境中全链路压测 |
openEuler、统信操作系统 |
操作系统概述以及平台架构 运行环境 创新场景 内核创新 低延时虚拟化方案 智算加速方案 提升存储协议栈关键路径性能与IO调度算法 内核优化与NUMA绑定机制 NUMA与JVM优化机制 国产处理器调度算法,智能调整调度颗粒与优先级 如何构建数据中心服务器硬件驱动 适配云计算,数据库,AI智算等场景 |
5.缓存技术 Reids生产实践 |
Redis架构选型依据 Redis生产建议 内存线程配置 快照同步配置 内存线程配置 AOF配置 Cluster配置 慢监控配置 事件通知 Redis数据类型 Redis持久化 Redis开发规范设计规范及案例分析 |
Redis数据类型与应用场景 |
Redis应用之抢购代金券 Redis解决超卖问题 Redis原生实现分布式锁 Redisson分布式锁的应用 Redis应用之好友功能_共同关注列表 Bitmap高阶数据类型详解及案例分析 Redis实现TOPN积分排行榜 GEO需求分析 缓存及分布式缓存概念 |
Redis特性 |
Redis中的管道原理 Redis的发布与订阅 Redis中的流技术 Redis中的过期策略 Redis内存淘汰策略 Redis中的Lua编程 Redis中的事务 Redis中的锁介绍 |
Redis中常用运维管理和备份迁移 |
配置修改&查看 安全认证之密码 ACL开启方式 键值权限规则 订阅&发布 安全认证之TLS 数据备份与恢复 线上扩容子集群 线上缩容子集群 线上置换节点 Redis的故障与恢复 运维常用命令 在线迁移 集群在线迁移 |
Redis性能优化和通用因素 |
CPU对Redis的影响 磁盘对Redis影响 网络对Redis影响 wap对Redis影响 Redis性能分析定位 复杂度过高的命令 RDB和AOF重写 大内存页性能影响 Redis绑定CPU Redis内存碎片 参数优化—[影响业务可用性] 存储低成本(层次化存储&冷热数据分离) 热点key优化思路 Key集中过期问题 淘汰策略性能问题 Redis单实例不亦太大 应用场景中缓存穿透 应用场景中缓存击穿 应用场景中缓存雪崩 应用场景中bigKey问题 Redis与本地缓存平衡 |
Redis缓存和数据库一致性 |
引入缓存提高性能 缓存利用率和一致性问题 并发引发的一致性问题 删除缓存如何保障一致性 如何保障Redis缓存和数据库都执行成功 主从库延迟和延迟双减问题 如何做到强一致性 |
原生redis弊端的优化思路 |
断点续传、数据一致性校验、延迟校验 RDB持久化优化 Gossip选主慢 RESP协议进行扩展 |
1.数据库部分 TDSQL、达梦数据库优缺点对比 集群架构设计 高可用性:分布式架构,数据分散存储,容错性强 高性能:垂直切分、水平切分、分布式索引等优化技术 强一致性:满足金融级需求 扩展性:支持水平扩展,灵活增加节点 复杂业务场景:OLTP和OLAP 国密算法以及三权分立权限模型 特殊场景性能:HTAP能力等 数据库资源管理和多租户 智能化管理平台,降低运维成本 弹性伸缩和负载均衡 |
TDSQL、达梦数据库体系架构 体系架构 组件概述 负载均衡策略 内存管理 数据库部署 环境要求 硬件要求 软件要求 内核参数配置 TDSQL、达梦系统表解读 TDSQL、达梦数据库参数解读 TDSQL、达梦数据库扩展特性(扩展功能、扩展接口)以及案例实践 |
TDSQL、达梦数据库执行计划解读 优化器实现 多表连接的执行计划、适用场景与优劣势 嵌套循环 合并连接 哈希连接 SQL调优方法论-执行计划深度分析 从案例中辨别低效执行计划 索引技术:应用场景以及对业务数据查询的影响 索引碎片导致执行计划问题分析和解决 锁的实现方式 理解SQL的执行过程与性能瓶颈 |
优化实践(实操,主要针对国产化数据后,业务使用如何避坑) 实际案例讲解 分布式兼容与限制 分布式表连接 分布式事务 部署服务器需要注意的事项总结 最佳实践 Explian SQL执行计划相关的成本因子 Trace信息 分布式更新操作原理 跨节点分布式查询优化 逻辑优化、条件下推、隔离 引擎如何优雅处理海量SQL逻辑 分布式事务实现 优化实践 数据库优化方法论 全链路性能调优实战 业务模型优化 先整体再局部 先解阻塞性问题 热点SQL优化 慢SQL优化 减少数据访问次数(减少磁盘访问) 返回更少数据(减少网络传输或磁盘访问) 减少交互次数(减少网络传输) 减少服务器CPU开销 利用更多资源(增加资源) 联接顺序 索引回表 数据表优化 核心数据表设计 数据分布策略 分库分表调优 数据均衡设计之初 数据表片键设计 多表连接查询优化 表膨胀优化实践 字段类型设计 对表逻辑更新 添加创建和修改时间列 如何查找慢查询:为什么会对业务造成危害 优化大表总要性:多大是最优的 为什么不要使用大字段类型 为什么要限制DML操作的数据大小 并发控制和锁的实现方式 理解分布式数据库并发机制 隔离级别对分布式数据库影响 减少锁的竞争,优化事务的粒度 乐观锁实现策略(那些场景使用) 生产场景监控问题定位 生产环境慢、测试环境快,如何定位 |
Oracle、MySQL、DB2数据库迁移TDSQL、达梦数据库实战 Oracle迁移TDSQL、达梦迁移实战-主要内容:数据库、用户移植 Oracle 数据迁移 应用程序移植 关键移植步骤 确定移植目标 评估移植任务 数据库、用户迁移 数据迁移 迁移前准备 在线迁移 源端数据库备份 存量数据迁移 启动迁移工具完成数据追平 多次迁移 应用代码迁移 (开发框架、编程接口) 服务器应用代码迁移 客户端应用代码迁移 ODBC 移植 Oracle OCI 应用程序 其它应用框架 测试与调试移植系统 功能测试和排错 性能测试和调优 |
案例实践:程序模拟转账业务场景和数据库设计(基于金融账务系统模拟业务转账测试(Java代码+数据库(TDSQL、达梦))实操演示) 数据库实践案例 需求分析与规划(需求收集/风险评估) 测试设计(测试工具/准备数据) 初步测试(功能验证/性能初步评估) 分析与优化(问题分析/优化方案) 再次测试(用户体验) 持续监控与维护(性能健康/定期检查) 数据库异常诊断(慢查询、并发、锁、阻塞等) 结合要点 表设计(分表依据) 锁设计(乐观锁/悲观锁) 事物设计(如何控制事物大小) 索引设计(最佳设计原则) 连接池设计(使用连接池要注意事项) SQL优化(小表变大表/改写) 服务器性能(CPU/IO/内存/NUMA) 网络性能 参数配置 监控 关键问题 数据库性能分析问题 SQL影响:慢查询和慢查询收集工具 SQL事务监控 SQL阻塞监控 CPU抖动监控 通过慢日志或监控平台获取某一个时刻SQL 业务并发访问问题 业务压力突增全链路监控 界定每个部分是否有问题 定位问题所在 性能问题:小数据量下性能良好,但在大数据量下性能急剧下降 基准测试:在小数据量下进行基准测试,记录性能指标。 压力测试:使用工具如 JMeter、LoadRunner 进行压力测试,模拟大数据量和高并发场景。 长时间测试:进行长时间的稳定性测试,观察系统在长时间高负载下的表现。 并发问题:在单用户或少量用户情况下表现良好,但在多用户并发访问时出现死锁、数据不一致等问题 并发测试:使用工具模拟多用户并发访问,观察系统的响应时间和错误率。 事务测试:特别关注涉及多个事务的操作,确保事务的隔离性和一致性。 数据一致性问题:数据在不同模块之间不一致,尤其是在分布式系统中。 数据校验:在不同模块之间进行数据校验,确保数据的一致性。 日志分析:分析系统日志,查找数据不一致的原因。 事务管理:确保事务的正确管理和回滚机制。 异常处理问题:异常处理不当,导致系统崩溃或数据丢失。 异常测试:模拟各种异常情况,如网络中断、数据库连接失败等。 日志记录:确保所有异常都被记录下来,便于后续分析。 恢复测试:测试系统的恢复机制,确保系统在异常后能够恢复正常运行。 资源泄漏问题:内存泄漏、文件句柄泄漏等。 内存分析:使用工具如Valgrind、VisualVM 进行内存分析。 文件句柄检查:检查系统中打开的文件句柄数量,确保没有泄漏。 性能监控:持续监控系统的资源使用情况,及时发现异常。 日志和监控问题:日志记录不完整,监控机制不健全 日志审计:定期审计日志文件,确保日志记录的完整性和准确性。 监控工具:部署性能监控工具,持续监控系统的运行状态。 报警机制:设置合理的报警阈值,及时发现和处理异常。 分布式事务处理能力 分布式存储能力 分布式事务能力 数据可靠性 数据分片操作 服务高可用 水平扩展能力 系统层面 针对ARM服务器中NUMA和JDK版本结合优化 |
2.业务上云 业务迁移上云准备 业务上云的整体评估/调研/可行性分析(一云多芯实践(鲲鹏、海光等)) 迁移上云的规划设计 稳态业务 敏态业务 依据业务形态选择容器平台还是CVK虚拟机平台 技术规划 企业级容器云、IaaS平台 重点关注:Kubermetes、容器网络、存储、集群、负载均衡、虚拟化、分布式存储等 创新云原生应用开发 重点关注:开发管理、Spring Cloud/Service Mesh等技术栈、开源技术栈等 基于云原生架构快速迭代的设计方法 微服务是云原生落地的重要技术支撑手段 引入微服务架构的优缺点分析 现有应用上云: 重点关注:应用容器化、业务分析、拆分、割接、回滚 现有应用向云原生迁移的具体路线 单体应用 模块拆分 无状态化 微服务化 应用上云状态的四象限 第一象限:传统业务,在改造之前,架构以传统ESB总线/单点应用为主 第二象限:微服务经过改造,运行在虚拟机环境上,但资源调度、快速响应的存在问题 第三象限:评估是否可以通过一次重新部署快速构建完成容器化\虚拟化改造,使用云原生容器\虚拟化带来的自动化管理、运维 第四象限:全面使用云原生架构重构应用,提升敏捷性、灵活性和可移植性,实现业务自动化运维 评估迁移优先级 评估迁移方式:直接迁移、局部调整、深度改造、整体重构 多云下的应用管理 重点关注:多集群管理、双活容灾、兼容性适配 如何充分利用容器特性屏蔽底层技术栈差异 虚拟化、容器化改造具体步骤 |
业务迁移上云实施 迁移阶段要素 迁移设计 应用改造设计 应用代码迁移 数据、接口和依赖项迁移 代码改造 执行的配置代码更改 设计部署流程(CD) 执行单元测试,验证程序 制定验收测试计划及方案 确认总体迁移时间表 测试和认证 执行验收测试(根据需要) 集成测试 回归测试 UAT测试 性能测试 接口测试 OTA测试 自动化部署(CD)测试 计划切换 提交上线请求 切换和总结 获得上线批准 部署执行(上线) 线上环境验证验证 执行迁移后审查以收集经验教训 释放原始资源 |
业务上云后管理 运维管理关键要素 如何组织交付IT服务 如何执行IT 如何保证长期一致的服务质量? 如何保证有关IT服务有效支持业务需求? 责任如何分工? 如何衡量IT服务质量? 服务交付过程中我们如何选择合适的技术以及工具? 变更及退出 风险、BUG、漏洞管理 |
实践案例:商业银行私有云上云实践(基于虚拟化、容器以及微服务改造) 分布式架构转型实践 整体设计 网络架构 和现有网络的集成 IP 方案和地址 云的虚拟网路技术 安全架构 认证 风险管理 审计管理 合规性管理 资产管理 日志管理 监管 支付管理 成本管理 资产管理 内审需求 架构标准 SLA/SLO 采购管理 数据管理、中间件 RPO/RTO 保留周期 副本管理 存储优化 消息队列 数据库 缓存 监控运维 通知/警告 应用层监控 监控阈值 迁移阶段要素 迁移设计 应用改造设计 应用代码迁移 数据、接口和依赖项迁移 代码改造 执行的配置代码更改 设计部署流程(CD) 执行单元测试,验证程序 制定验收测试计划及方案 确认总体迁移时间表 测试和认证 执行验收测试(根据需要) 集成测试 回归测试 UAT测试 性能测试 接口测试 OTA测试 自动化部署(CD)测试 计划切换 提交上线请求 切换和总结 获得上线批准 部署执行(上线) 线上环境验证验证 执行迁移后审查以收集经验教训 释放原始资源 |
整体业务连续性建设和管理方法以及应用详解 业务连续性管理概述 制定灾难恢复规划的目的 进行灾难恢复规划的主要步骤 项目的组织结构及各部门的职责 计划的技术要求 制定计划的方法 风险分析及业务影响分析 灾难恢复策略的制定 制定详细的恢复流程 编制计划 计划的测试、培训和演练 灾难时期的危机沟通 计划的贯彻实施及其维护和更新 灾难恢复计划的启动执行 |
业务连续性技术架构规划(深度剖析网络、存储、服务器、数据库、缓存、中间件、消息队列、web部署、负载均衡、域名解析) 如何规划整体架构建设?灾备需求分析及规则 应用架构规划 业务同城双活--数据库单写(多读) 业务异地灾备-数据库单写(多读) 业务两地三中心部署-数据库多活(单写,多读) 业务异地多活(单元元改造)(数据库多写多读) 网络安全架构规划 数据中心多站点选择 基于全局DNS解析服务的双活建设 内网业务容灾/多活方案 外联业务容灾方案 计算存储架构规划 从IT架构看传统两地三中心 核心双活技术存储组网 两地三中心方案 |
数据库架构规划(针对集中式/分布式/缓存/文档等) 数据库同城双活架构设计 数据库异地灾备架构设计 数据库两地三中心架构设计 业务单元化 数据库异地多活架构设计 数据库和缓存数据一致性 消息中间件一致性保障 |
云平台架构规划 云业务面临挑战 云主备容灾方案 多云模式建设 一云多芯架构 异构计算架构 |
分布式存储/数据库应用 国产分布式存储/数据库介绍 分布式存储/数据库实践建设标准 容量评估 |
实践案例 上述业务实践内容 概要设计(业务架构设计、分布式应用架构设计、分布式技术架构设计) 平台设计(应用计算虚拟化资源池建设方案、数据库/中间件计算虚拟化资源池建设方案等) 数据库设计(数据架构设计、数据库集成) 业务迁移上云(业务规划、上云优先级确定、技术规划、上云方案制定、方案设计(应用架构设计<接入层、应用层 、数据层>、数据架构设计、技术架构设计、存储设计、单元化设计、安全架构设计、灾备管理设计)) 实施方案规划(业务模块梳理,测试与演练、全链路压测、系统割接等) 低延迟方案设计 |
中间件认知讲解 中间件对分布式架构体系重要性 有哪些类型的中间件 同类型中间件如何进行选型 |
宝兰德、东方通、Nginx、消息队列 技术选型:如何根据应用场景选择合适的消息中间件 中间件高性能设计 中间件优化实践 排查消息发送超时故障 排查消息消费积压问题 运维千万级/亿级消息集群 |
技术解析、最佳实践和高级使用 中间件对分布式架构体系重要性 有哪些类型的中间件 同类型中间件如何进行选型 应用服务器软件 消息队列平台服务软件 分布式缓存数据库软件 分布式交易中间件软件 消息中间件 如何对接行内现有监控系统 分析jvm 搭建负载均衡 需要注意的地方,通过案例讲解商用和XC对比 技术选型:如何根据应用场景选择合适的消息中间件 中间件高性能设计 中间件优化实践 排查消息发送超时故障 排查消息消费积压问题 运维千万级/亿级消息集群 如何在生产环境中全链路压测 |
openEuler、统信操作系统 操作系统概述以及平台架构 运行环境 创新场景 内核创新 低延时虚拟化方案 智算加速方案 提升存储协议栈关键路径性能与IO调度算法 内核优化与NUMA绑定机制 NUMA与JVM优化机制 国产处理器调度算法,智能调整调度颗粒与优先级 如何构建数据中心服务器硬件驱动 适配云计算,数据库,AI智算等场景 |
5.缓存技术 Reids生产实践 Redis架构选型依据 Redis生产建议 内存线程配置 快照同步配置 内存线程配置 AOF配置 Cluster配置 慢监控配置 事件通知 Redis数据类型 Redis持久化 Redis开发规范设计规范及案例分析 |
Redis数据类型与应用场景 Redis应用之抢购代金券 Redis解决超卖问题 Redis原生实现分布式锁 Redisson分布式锁的应用 Redis应用之好友功能_共同关注列表 Bitmap高阶数据类型详解及案例分析 Redis实现TOPN积分排行榜 GEO需求分析 缓存及分布式缓存概念 |
Redis特性 Redis中的管道原理 Redis的发布与订阅 Redis中的流技术 Redis中的过期策略 Redis内存淘汰策略 Redis中的Lua编程 Redis中的事务 Redis中的锁介绍 |
Redis中常用运维管理和备份迁移 配置修改&查看 安全认证之密码 ACL开启方式 键值权限规则 订阅&发布 安全认证之TLS 数据备份与恢复 线上扩容子集群 线上缩容子集群 线上置换节点 Redis的故障与恢复 运维常用命令 在线迁移 集群在线迁移 |
Redis性能优化和通用因素 CPU对Redis的影响 磁盘对Redis影响 网络对Redis影响 wap对Redis影响 Redis性能分析定位 复杂度过高的命令 RDB和AOF重写 大内存页性能影响 Redis绑定CPU Redis内存碎片 参数优化—[影响业务可用性] 存储低成本(层次化存储&冷热数据分离) 热点key优化思路 Key集中过期问题 淘汰策略性能问题 Redis单实例不亦太大 应用场景中缓存穿透 应用场景中缓存击穿 应用场景中缓存雪崩 应用场景中bigKey问题 Redis与本地缓存平衡 |
Redis缓存和数据库一致性 引入缓存提高性能 缓存利用率和一致性问题 并发引发的一致性问题 删除缓存如何保障一致性 如何保障Redis缓存和数据库都执行成功 主从库延迟和延迟双减问题 如何做到强一致性 |
原生redis弊端的优化思路 断点续传、数据一致性校验、延迟校验 RDB持久化优化 Gossip选主慢 RESP协议进行扩展 |