wellabb
本站致力于IT相关技术的分享
基于 eBPF 的 Hugging Face 模型服务深度可观测性架构实现 基于 eBPF 的 Hugging Face 模型服务深度可观测性架构实现
我们的文本生成模型推理服务开始出现问题。最初的症状是客户端报告的 P99 延迟无规律飙升,并伴有少量超时错误。Django 应用服务器的日志显示请求处理正常,Celery worker 的日志也未记录到任何异常崩溃。Prometheus 监
2023-10-27
构建从 Vue.js 到 Java 微服务的全链路追踪:手动埋点与上下文传播实践 构建从 Vue.js 到 Java 微服务的全链路追踪:手动埋点与上下文传播实践
一个前端发起的请求,在后端系统中流转缓慢,但每个微服务的日志都显示自身耗时在50毫秒以内。这是一个典型的分布式系统“幽灵延迟”问题。排查时,我们发现链路追踪系统(Zipkin)里只看到了后端服务之间的调用链,从用户点击浏览器到第一个Java
2023-10-27
利用 Clojure 构建从 HBase 到 Delta Lake 的异构 CDC 数据同步架构 利用 Clojure 构建从 HBase 到 Delta Lake 的异构 CDC 数据同步架构
一个常见的架构困境是,如何将一个为高并发、低延迟随机读写优化的在线事务处理(OLTP)系统的数据,高效、可靠地同步到一个为复杂分析查询优化的在线分析处理(OLAP)系统。我们的核心业务依赖于 HBase,它承载着每秒数十万次的点查和范围扫描
2023-10-27
通过自定义网关与ELK实现基于JWT会话的XState状态机全链路追踪 通过自定义网关与ELK实现基于JWT会话的XState状态机全链路追踪
项目中的日志系统,起初只是为了记录异常。随着业务变得越来越复杂,尤其是那些包含多个步骤、长周期的用户流程,比如贷款申请、保险理赔或者多阶段的注册流程,我们发现现有的日志完全无法回答一个核心问题:“某个用户的特定请求,到底卡在了哪一步?” 当
2023-10-27
在生成式AI平台中基于DDD与Dgraph实现Saga分布式事务与动态IAM 在生成式AI平台中基于DDD与Dgraph实现Saga分布式事务与动态IAM
一个多租户生成式AI平台的模型微调请求,其业务流程的复杂性远超想象。用户点击“开始微调”后,系统需要原子性地完成一系列跨服务的操作:验证数据集访问权限、锁定并计费计算资源、创建模型训练任务、更新模型谱系、最后再将新模型的访问权限授予指定团队
利用CQRS模式构建MySQL事务性写模型与GraphQL客户端读模型 利用CQRS模式构建MySQL事务性写模型与GraphQL客户端读模型
一个日益复杂的业务系统,其数据模型的演进往往会陷入一个两难境地:写操作要求严格的事务一致性、数据校验和领域规则,而读操作则需要极高的灵活性和性能,常常涉及多表聚合与复杂筛选。当单一的、高度规范化的数据模型同时服务于这两种截然不同的需求时,性
2023-10-27
3 / 5