54k 词
Prototype to Production 从原型到生产 Authors: Sokratis Kartakis, Gabriela Hernandez Larios, Ran Li, Elia Secchi, and Huang Xia This whitepaper provides a comprehensive technical guide to the operational life cycle of AI agents, focusing on deployment, scaling, and productionizing. Building on Day 4’s coverage of evaluation and observability, this guide emphasizes how to build the necessary trust to move agents into production through robust CI/CD pipelines and scalable infrastructure. It ...
73k 词
Agent Quality 智能体质量 Authors: Meltem Subasioglu, Turan Bulmus, and Wafae Bakkali Agent Quality The future of AI is agentic. Its success is determined by quality. AI 的未来是智能体化的。其成功取决于质量。 Introduction 简介 We are at the dawn of the agentic era. The transition from predictable, instruction-based tools to autonomous, goal-oriented AI agents presents one of the most profound shifts in software engineering in decades. While these agents unlock incredible capabilities, their inherent non-determinism ...
110k 词
ContextEngineering:Sessions, Memory Authors: Kimberly Milam and Antonio GulliContext Engineering: Sessions, Memory 上下文工程:会话与记忆作者:Kimberly Milam 和 Antonio Gulli Introduction 简介 This whitepaper explores the critical role of Sessions and Memory in building stateful, intelligent LLM agents to empower developers to create more powerful, personalized, and persistent AI experiences. To enable Large Language Models (LLMs) to remember, learn, and personalize interactions, developers must dynamical...
77k 词
Agent Tools & Interoperability with MCPIntroduction: Models, Tools and AgentsWithout access to external functions, even the most advanced foundation model1 is just a pattern prediction engine. An advanced model can do many things well – passing law exams2, writing code3 or poetry4, creating images5 and videos6, solving math problems7 – but on its own it can only generate content based on the data it was previously trained on. It can’t access any new data about the world except what i...
76k 词
Introduction to AgentsAgents are the natural evolution of Language Models, made useful in software. 代理是语言模型的自然演进,在软件中变得有用。 From Predictive AI to Autonomous Agents从预测性 AI 到自主代理 Artificial intelligence is changing. For years, the focus has been on models that excel at passive, discrete tasks: answering a question, translating text, or generating an image from a prompt. This paradigm, while powerful, requires constant human direction for every step. We’re now seeing a paradigm shift, movi...
4.9k 词
Cursor:结构和控制是胜利之道引言在AI编程助手时代,Cursor作为基于VSCode的智能编辑器,已经成为众多开发者的首选工具。然而,仅仅拥有强大的AI能力是不够的,关键在于如何通过编程思维来高效地使用Cursor,让AI成为我们编程过程中的得力助手,而不是依赖。 什么是编程思维?编程思维就像建造房子:先画图纸,再分步骤建造,随时调整。使用Cursor时,我们也需要这种系统性的思维方式。 核心原则: AI很强大,但不会思考 - 我们需要做”大脑”,AI做”手” 主动控制 - 决定要做什么、怎么做、为什么这样做 结构化思维 - 让AI理解我们的意图 编程思维的核心原则1. 结构化思维项目结构清晰化12345678project/├── src/│ ├── components/ # 组件目录│ ├── utils/ # 工具函数│ └── services/ # 服务层├── tests/ # 测试文件├── docs/ # 文档└── config/ #...
4.6k 词
基于Web Vitals的秒开优化调研需求背景项目中上线的H5页面越来越多,用户在Web页面的体验变得更加重要。 随着网络带宽不断发展增大,人们对网页的打开速度要求也变得越来越高。 性能指标做性能优化之前首先需要明确相关指标。明确性能指标就是要明确我们关注哪些数据,这些数据如何测量,什么数据算是好的,什么数据算是不好的。 拿到我们需要的指标数据之后才能再针对特定的场景进行优化。 基于Core Web Vitals的指标多年来Google提供了许多工具衡量和报告网页加载效果,有些开发者擅长使用这些工具,而有些开发者因为工具和指标众多难以跟上节奏。 这里我们按照Chrome的最新LightHouse给出的以用户为中心的标准化指标Web Vitals来衡量网页的性能。 其中我们最关心以下指标: LCP 最大可视内容绘制时间LCP 会报告视口内可见的最大图片、文本块或视频的渲染时间(相对于用户首次导航到网页的时间)。 从用户视角来看,相比于其他指标LCP最能反映出页面加载的速度。 为了提供良好的用户体验,一个网页应该在2.5s内完成最大可视内容加载。 INP 输入延迟时间输入延迟时间指...
iOS
1.3k 词
一、背景介绍公司采购了Cursor IDE,其中的Composer功能十分强大。目前Xcode缺乏对应的AI功能,尝试迁移到Cursor。 二、准备工作2.1 必要插件安装 安装Swift扩展插件 安装SweetPad扩展插件 在SweetPad插件中安装TOOLS xcode-build-server 必须安装 别的按需安装即可 2.2 可选插件安装 安装Chinese简体中文插件将Cursor语言改成中文 安装Xcode Keymap扩展插件将Xcode的快捷键映射到Cursor 2.3 界面优化新下载的Cursor功能菜单默认布局是横向的,空间很小,建议改成纵向布局: Cursor - 首选项 - 设置 - 工作台 - 外观 搜索 workbench.activityBar.orientation,改为vertical 重启即可 三、编译与运行3.1 设备选择在SweetPad插件中找到DESTINATIONS(设备列表)项: 只能找到iOS17以上的设备,最好使用模拟器 此插件不支持真机Debug 右键点击模拟器后弹出选择设备 3.2 构建项目找到BUILD...
iOS
2.5k 词
一、项目背景在全球化业务快速发展的背景下,我们的教育类应用需要支持18+语言、覆盖100+国家地区的本地化需求。 二、现状分析目前iOS端在基于系统级的.String文件支持多语能力的基础上又增加了一层动态Json多语。 为了获取动态修复多语的能力,我们额外实现了一套动态拉取多个scope下的18种语言json的功能。支持server、本地文件、内存三级缓存。 在根据多语key提取文本时会先到动态多语模块去查询,如果查不到目标字符串则会回退到系统NSLocalizedString获取文本。 主要实现特点: 123456// 内存管理核心逻辑- (NSDictionary *)getCurrentLanguagesData { NSMutableDictionary *stableLanguages = [NSMutableDictionary dictionary]; [self.subScopes enumerateObjects...]; // 全量合并多语数据 return stableLanguages; // 产生内存峰值} 现存...
11k 词
iOS背景模糊实现技术方案需求背景晖致日本提出很多代表在家里录制AI作业,希望可以将背景模糊,保护代表隐私。 类似于腾讯会议的背景虚化功能,录制视频作业 的时候将背景模糊化,只保留用户人像区域。 技术方案业界对这个需求的实现方案基本一致。 首先录制过程中将视频帧做高斯模糊形成背景模糊中”背景”部分。 然后在实时的将每一帧图像中包含人像的部分“扣”出来形成一张黑白分明的灰度图(mask)。一般是人像区域为白色,非人像区域为黑色。 最后使用自定义三输入的滤镜,分别传入模糊后的背景视频帧+灰度mask图+原始视频帧,通过片元着色器对每一个像素点进行遴选。根据灰度图的颜色,白色取原始视频帧,黑色取模糊视频帧。 这样就形成了背景区域是模糊的,人像区域是正常的视频,达到要求。 在视频帧处理这方面我们采用项目中已经引入的GPUImage库来实现。 人像分割这个抠图的技术我们称为人像分割,人像分割算法有很多种,常见的包括:基于颜色和纹理的方法、基于边缘检测的方法、基于深度学习的方法、基于图割的方法等。 目前这一步交由AI组伙伴提供基于TensorFlowLiteObjC的深度学习人像分割模型来实...